聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

阿里巴巴集团数据平台事业部简介

2013-03-29 10:01 浏览: 3578557 次 我要评论(0 条) 字号:

阿里巴巴集团未来10年的定位是数据分享第一平台,我们要做的是二十一世纪最伟大的一家数据公司,只不过这一次我们要做的数据不再仅仅是硬件,更不仅是软件,我们要真正把数据变成商业资产。阿里集团数据平台致力于收集、整合全球数据,通过数据交换和共享,把数据变成整个社会最有价值的生产要素,让数据变成服务,让数据去驱动商业变革。

当前阿里巴巴集团有数百PB、多样的结构化数据,阿里集团内部的数据以每年近3倍的高速增长,在集团内,承载着淘宝、天猫、支付宝、搜索、广告、金融等高速增长的成长型业务。外部我们的客户、合作伙伴也渴望能基于中国最有价值的商业数据进行深度加工,围绕着数据进行应用,以创造更大的商业价值。

阿里巴巴集团数据平台底层依托于自主研发的大规模分布式计算系统,目前已有多个数千台服务器组成的大型离线计算集群提供通用数据处理服务。同时还有能处理数十亿数据的流式计算引擎和支持高并发、多维分析的即时计算引擎,满足对实时业务场景的需求。预计5年内集群数量增长到数十个。我们未来逐步在全国建立多个数据中心。

为了让数据应用变得更加简单,我们正在实现一个基于WEB的协作开发平台,打通数据产品开发、测试、生产、运维各个环节,在这个平台上我们还提供能支持超大规模矩阵计算、SVD分解等算法的分布式算法平台,提升高级数据处理效率和体验。

同时我们信奉”数据即服务”的理念,我们需要把多种数百亿的数据集整合、管理、共享,为我们的用户提供高效的数据服务,建立通道帮助数据变现。

典型数据案例:

• 数据改变金融行业

阿里金融小额贷款就是阿里巴巴集团尝试的第一个在线金融业务。阿里金融彻底抛弃了传统金融做法,完全不依靠线下人力,只需要对海量的淘宝数据进行风险建模,把代码部署到离线计算平台上,实现贷款额度预测,从而实现一秒钟贷款。

数据平台在提供稳定、超大规模数据计算能力的同时,还提供了对计算任务、数据异常、波动等的监控,以保证金融可以通过正确的数据来开展在线贷款业务。未来这个模式很可能会成为金融行业的标准模式,从贷款进一步延伸到保险、担保、基金等领域。

• 数据革新零售行业

与传统商业相比,C2B是消费者发起的需求,更加贴近生产。通过博弈数据的挖掘,可以对消费者的层次进行分类,从而可以更有针对的给消费者提供适合他的高性价比产品,对供应商而言,也是作出更加贴近消费者产品,降低风险,提高效率,同时打通供应链的数据,可以实现大幅提升制造企业的效率。

通过数据平台沉淀所有这些数据,对接产业链各方,通过淘宝、天猫等形成数据回流,基于数据平台进行数据加工和挖掘,给消费者、商家、企业都提供更大的价值。

• 数据为中国商业建立下一代的基础设施

阿里巴巴正在建立“中国智能物流骨干网”(CSN),预计能支撑日均300亿元网络零售额,并确保全国范围24小时内送达。建立社会化物流体系,提升物流个环节的效率是本质要解决的问题。

CSN的核心要素是数据,数据可以帮助物流公司智能规划配送网点、优化配送路线、规划仓储建设、合并路线、爆仓预警等,从而达到社会化资源最优。通过提供实时计算、大规模数据处理,以及数据挖掘等技术能力,让中国的物流公司、商家、淘宝、天猫等都通过数据平台参与到物流数据建设,从而形成基于数据的中国下一代物流体系。

 

作者:阿里巴巴集团数据平台事业部数据交换平台(DXP) 总监 空无



网友评论已有0条评论, 我也要评论

发表评论

*

* (保密)

Ctrl+Enter 快捷回复