大公网

大公报电子版
首页 > 财经 > 地产 > 正文

实用解读\从数据提炼出资讯

2020-05-11 04:23:42大公报
字号
放大
标准
分享

  2001年,数据分析员Doug Laney在一篇关於数据管理的报告提出大数据概念。若果是大容量(通常达到Petabyte(PB)级的数据规模)、累积速度高、种类繁多,便可归纳为大数据。目前全球数据量每年增长40%,例如社交网站Facebook上载的相片,每日全球平均数亿帧,这些数据应放哪?大数据中心由此应运而生。

  据统计,到2025年,全球每天预计有463Exabyte(EB)(1EB =1024PB)的数据产生,相当於每天产出逾2.127亿张DVD碟,若将这些资料储存在32GB版本的iPad,所需要的iPad数量,大约是3125万部。大数据包罗万有,很可能与主题无关的资料,最终也能提供实用的解读,如何分辨哪些资料值得储存、如何将资料有效分类,同时剔出没有代表性的杂音,这不是轻而易举的事。

  目前仍有不少人把数据及资讯两词等同,然而两者不同之处──数据可以是数字、文字、图片或视频等等,资讯则直接与内容挂鈎,需要有资讯性(informative)。数据越多,不一定代表资讯越多,更不能代表资讯就会按比例增加,而是需要整合内容类似的数据,剩下的才是资讯。企业难以处理这些事情,这便需要依靠大数据中心,故此,全球对大数据中心的需求也越来越大。

点击排行