文件名称:强琦:大数据开发平台
文件大小:1.92MB
文件格式:PDF
更新时间:2017-06-18 07:53:09
阿里巴巴 大数据 云计算 强琦 CCCC2013
强琦介绍,阿里巴巴集团与百度或者其他公司最大的区别是拥有更多结构化的数据,而且业务线非常多。目前该集在梳理内部的结构化数据,其中很少一部分的数据表量已达150万个,如果加上分库和分表,数量达到400多万个。目前已经结构化的数据总量是80PB,数据量月增将近3PB。阿里巴巴建设集团统一数据平台的进展情况。关于如何解决“找得到”数据的问题,阿里巴巴建设了一个很大数据管理系统,在系统中可以找到整个集团的所有数据。