不久前阿里云推出了其大数据产品ODPS(开放数据处理服务),对于这样一款高大上的产品,看着总觉得云里雾里。
7月14日,笔者参加了ODPS的一场媒体交流会,对相关情况有了进一步了解,以下是笔者了解到的一些简单的事实。
由于内容比较专业,可能会有表述不当的地方,希望对想了解ODPS的读者有所帮助。
1、ODPS目前主要支持结构化和半结构化数据的分析,无法处理非结构化数据。
这主要和阿里巴巴目前的业务有关,阿里巴巴的业务主要是交易数据,它们基本上都是结构化数据。
2、ODPS目前所开放的服务可以简单的看做是一个可以处理PB级别数据量的SQL数据库。未来ODPS将开放更多的其他服务。
3、ODPS是一个离线大数据服务,并不适合做实时的数据处理。其应用场景主要有做交易清算、生成相应报表等。
4、ODPS是阿里云生态的一部分,和阿里的RDS、OTS配合使用是最为方便的。
RDS、OTS的数据可以非常简单的推到ODPS上进行处理,阿里会保证其安全性。
如果业务数据储存于非阿里平台上要利用ODPS进行数据处理会比较麻烦,可以通过HTTPS通道上传导阿里的平台,由于是海量数据,传输时间会很长,而且传输途中的安全性阿里也不保证。
5、阿里巴巴希望有越来越多的ISV(独立软件开发商)、咨询公司等利用ODPS打造相应的大数据产品为最终用户提供服务。