大公网

大公报电子版
首页 > 财经 > 港股 > 正文

“豪掷”9000万欧元!阿里巴巴收购德国数据公司

2019-01-09 03:17:52大公报 作者:李洁仪
字号
放大
标准
分享

阿里巴巴深化实时数据分析处理,收购德国数据处理公司data Artisans,双方管理层分别在网站宣布深化合作,共同建立大数据分析框架Apache Flink,惟未有披露收购作价。消息传出涉资高达9000万欧元,相等於8.1亿港元。
 
data Artisans开发的大数据分析框架Apache Flink,为企业客户提供大规模即时分析、机器学习、搜索、内容排名及欺诈检测等服务。
 
阿里巴巴集团副总裁、搜索事业部与计算平台事业部负责人周靖表示, 阿里巴巴将继续投资技术,未来将与data Artisans进一步推进Flink在技术领域的发展和应用。
 
两年支援双11大屏幕
 
阿里技术计算平台事业部资深技术专家莫问指出,目前,Apache Flink在阿里系内最典型的业务场景是实时BI(商业智能),Flink已经连续两年支援阿里巴巴双11实时GMV(交易总额)大屏幕,2018年双11期间,阿里巴巴内部Flink版本(Blink)完成峰值每秒17亿次的处理能力。
 
较早前,阿里巴巴已宣布,Blink版本将於今年1月正式对外开放。
 
根据Market Insights Reports的数据,预计到2025年,全球串流数据市场市场规模将达到477.5亿美元(约3725亿港元),从2017年到2025年增长近35%。
 
Uber腾讯ebay为客户
 
data Artisans网站显示,公司客户除了成为股东之一的阿里巴巴,还有内地另一互联网巨擘腾讯(00700),其他客户包括拍卖平台ebay、共享汽车平台Uber、影片串流服务商Netflix等。
 
於2014年,Apache Flink创始人Kostas Tzoumas及Stephan Ewen成立data Artisans,总部设於德国首都柏林,主要透过Apache Flink技术,向客户提供大数据处理解决服务。
 
据了解,data Artisans已完成两轮融资,其中A轮融资於2016年3月进行,由英特尔旗下Intel Capital投资600万美元(约4680万港元)。不过,公司未有披露去年进行的B轮融资,惟市场估计当时阿里巴巴已有份参股。
 
阿里夥Intel推3D运动追踪系统
 
基於人工智能(AI)技术,阿里巴巴与英特尔(Intel)合作,发展首个由人工智能推动的3D运动追踪系统,并计划於2020东京奥运会启用。
 
在2019美国消费电子科技展(CES)上,阿里巴巴与Intel共同宣布开发3D运动追踪系统,只要通过一般的摄录机拍摄运动员的动作,从而提供新的训练数据及分析。
 
同时,阿里巴巴公布,人工智能实验室开发的智能音箱天猫精灵,将搭载宝马(BMW)在中国推出的新车及部分现有系列车款,实现“AI+车”的新车型,预期在2019年底推出市场。
 
搭载天猫精灵的宝马车款,将为车主提供语音唤醒服务、云端生态服务,例如车主可通过车内的远程语音系统,控制家中的天猫精灵。
 
装配有BMW Connected Drive系统的部分BMW汽车将陆续接入天猫精灵的语音交互及人工智能服务能力。目前,阿里巴巴人工智能实验室还正与斑马智行、高德A+Box等车载系统商进行“AI+车”方案的合作。
 
流式计算引擎大受欢迎
 
据互联网资料显示,Apache Flink(以下简称 Flink)是诞生於欧洲的一个大数据研究专案,原名StratoSphere。该专案是柏林工业大学的一个研究性专案,早期专注於批计算。2014年,StratoSphere专案中的核心成员孵化出Flink,并在同年将Flink捐赠给Apache,后来Flink顺利成为Apache的顶级大数据专案。
 
Flink是近年来越来越流行的一款开源大数据计算引擎,它同时支持了批处理(即静态的数据集、历史的数据集)和流处理(即时数据流,即时产生数据的结果),也能用来做一些基於事件的应用,比如说,滴滴通过Flink CEP实现即时监测用户及司机的行为流,判断用户或司机的行为是否正当。官网介绍Flink的一句话,就是“Stateful Computations Over Streams”(数据流上的有状态的计算)。
 
Flink是一个纯流式的计算引擎,它的基本数据模型是数据流。流可以是无边界的无限流,即一般意义上的流处理。Flink优势之一,是支持有状态的计算。如果处理一个事件(或一条数据)的结果,只跟事件本身的内容有关,称为无状态处理;反之结果还和之前处理过的事件有关,称为有状态处理。稍微复杂一点的数据处理,比如说基本的聚合,数据流之间的关联都是有状态处理。
 
Flink不同於Storm、Spark Streaming以及其他流式计算引擎,它不仅是一个高吞吐、低延迟的计算引擎,同时还提供大量高级功能。它的受欢迎,还离不开它身上的众多标签,其中包括性能优秀(尤其在流计算领域)、高可扩展性、支持容错,是一种纯记忆体式的一个计算引擎,做了记忆体管理方面的大量优化,另外也支持eventime的处理、支持超大状态的Job、支持exactly-once的处理。

 

点击排行