大数据权威:真正的障碍不在技术而是态度

导读 撰稿:何宛芳 近日爸爸妈妈们都在为风声鹤唳的肠病毒烦恼,殊不知早在2009年就针对H1N1流感发展出了预测机制。而且,这个流感预测机制

撰稿:何宛芳

近日爸爸妈妈们都在为风声鹤唳的肠病毒烦恼,殊不知早在2009年就针对H1N1流感发展出了预测机制。而且,这个流感预测机制竟不是来自医疗体系,反而是八竿子打不着的Google?

首度来台的《大数据》一书作者麦尔荀伯格在11日的演讲中,就以大数据(Big Data,又称巨量资料)的真实案例作为开场,例子中的Google,先是找出全美使用者最常搜寻的五千亿种关键字,再跟疾病管制局的流感传播资料比对,找出搜寻关键字与流感传播的相关性。

结果,Google这套流感预测机制,不但在2009年精準地预测流感在各地区、城市的传播情形,而且甚至还比疾病管制局的系统快了两週。

麦尔荀伯格指出,随着大量的资料从类比(诸如纸张)形式转为数位形式、储存成本降低与运算能力的提升,在网际网路发展了20年间,人类所产出的资料已经成长了100倍,我们所面对的已经是一个「巨量资料」的时代。

「当一张照片变成一秒钟拍16张照片时,就成了动画,」麦尔荀伯格举例说明,大数据不但是前所未见,由量变产生质变,甚至也将改变人们思考事情的脉络与研究方法。

别问Why,请问What

过去人类非常执着于找到事物间的因果关係,晚上拉了肚子立刻就会联想到晚餐是不是吃坏肚子,而忽略了事情往往比我们想像得複杂多了。然而,在大数据时代里,因为可以準备大量资料来回应单一问题,「相关性」就可以取代过往人们习惯于研究的「因果关係」。

举例来说,连锁超市发现了每在飓风来袭前,店内的草莓吐司饼乾(pop tarts)就会有一波热卖。到底「为什么」有这样的巧合,对店家来说其实并不重要,只要能够确认这样的相关性,他们就能在飓风来临前透过更好的陈列,达成更好的销售。

「我们只要了解到底相关性是怎么一回事就好了,」麦尔荀伯格说明,在网路世界里运用巨量资料找到「相关性」的範例比比皆是,亚马逊(Amazon.com)的推荐购买功能,就是其中的佼佼者。

还有一个令人印象深刻的案例:多伦多大学团队与IBM合作,将巨量资料应用在早产儿的照护机制中。

早产儿容易受到感染,出现症状才用药往往已过了治疗时机,然而,这项计画则透过在早产儿身上放置感应器,大量採集早产儿包括心跳等精密数据,整理出疾病发展的「模式」(patterns),让医生能够及早用药避免症状扩延;而且最有趣的是,「这项计画的主持人,甚至还不是医生,而是资讯工程博士。」

大数据的价值在于「再利用」,变化才是常态

然而,麦尔荀伯格也提醒,运用大数据的重点也在于持续不断地重跑数据,因为世界是不停地变动,唯有持续不断的更新资料,才能得到最适切的相关性。前文所提到的Google流感预测机制,就曾因为没有持续更新数据导致预测失準、饱受批评,最后在2012年重新调整资料后,才又扳回一城。

麦尔荀伯格进一步强调:「资料的价值在于我们儘可能的重新使用他们。」

一家整理交通路况的公司Inrix,发现了购物商场附近交通堵塞与销售之间的关係,这家公司就靠着购买这些在堵车地带附近店家的股票,而大赚一笔,「对他们来说,他们就把『再利用』转换成了『营收』。」

「真实的世界远比我们所想的複杂,但也更加有趣,对于我们身处的世界,我们也一定要更加谦卑,」不能再用过往快速、直觉的因果关係,企图找到存在于複杂世界中的规则。而且,透过大数据观察世界,也会发现「变化」才是常态。

「我们必须珍视变化,我们要拥抱变化,大数据只能告诉你发生了变化,它却不能告诉我们如何应对变化,我希望能够透过大数据让大家知道,我们的社会永远处在动态的变化,既然变化是无可避免,我们何不就拥抱它?为何不就将其视为新机会?但这也需要一个愿意勇于冒险并自我重塑(reinvent)的社会,企业也要愿意自我重塑,」麦尔荀伯格说。

障碍不在技术而是态度

只不过,他也在会后与新北朱立伦等人针对开放政府资料的相关对谈中坦承,大数据的优势虽然很明显,但实际执行上,也的确会遭遇困难,无论在公部门、私部门,都会有类似的困境。

「企业的部门之间常常不愿意相互开放资讯,深怕其他单位抢得机先……但是,若要得到大数据的功效,就必须要打破这些藩篱,无论是在公部门或是私部门这都是最困难的部分,最困难、最複杂的部分压根就不是科技本身。若人们不想要一起合作、不能用一致的角度看待变化,就算有再多频宽、伺服器、软体也是枉然。」

最后,对此,他也提出他的解决之道:「我们不能只从科技的角度思考科技,只从大数据来看大数据,而要真正回到一般人的生活,理解民众的偏好与需求。若我们能够满足需求,那么就会得到来自群众的支持。」

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章