探索中国CIO人才现状 | 第四季调研报告
把“大数据”画出来
2013-09-18  作者:CIO时代网 

  我们真正关心的是怎么来处理数据,数据开发的结果哪些是软件解决不了的。


  数据真正的量化应用是可以达到一个可视化的高度的。


  尼古拉斯·费尔顿(NicholasFelton)真是一位神奇的信息图形设计师,他坚持7年用数据记录自己的生活,并每年完成一份年度报告,2012年,他把他16页的年度报告在网上出售,限量2500份,竟被很多人抢购。


  费尔顿专心研究于数据,他也非常细心地收集他的所有资讯,比如邮件、护照、电话单、信用卡单、发票、机票、跑步计步数值等。2010年他父亲去逝后,他整理父亲30多年的各种票证和照片,完成了一份报告,这份报告包括父亲从出生、上学到结婚以及30年来在世界各地的足迹。他说:“整理很辛苦,但我认识到另一个父亲,一个父亲生前没有来得及告诉我的他的故事。”


  费尔顿更准确的身份是美国数据化专家,他曾在Facebook工作过。在大连举办的2013年达沃斯会议期间,他做了几场演讲。他对当今全球火爆的流行语“大数据”的诠释是:“超出传统数据管理工具处理能力的大规模、复杂的数据集合。判断是否属于大数据的范畴,要从三个维度来衡量:数据量(Volume)、处理速度(Velocity)以及数据种类(Variety)。”


  作为热概念,“大数据”正在影响着传统制造业、零售业、金融业、汽车业、物流业,也令研究机构和政府部门大开眼界。但费尔顿表示,从现在业界一些公司拿出来的所谓的大数据应用实例来看,依然只是在利用传统意义上的数据价值,并没有真正挖掘数据的附加值,甚至没有真正挖掘大数据的成熟产业链。


  来自美国Kaggle公司的首席科学家杰里米·霍华德(JeremyHoward)也认为:“既使海量数据也可以由工程师发明软件来‘一键’处理,所以我们不关心你的数据到底有多大,而是怎么来处理数据,数据开发的结果哪些是软件解决不了的,也就是从大数据中获得一种‘可视化’的意外惊喜。”霍华德认为有四个领域确实需要“大数据”,分别是“理解人类语言”、“理解图片的内容”、“分析视频影像”和“利用数据相关基因组图解决问题”。这说得还是有点玄乎其玄的吧。其实就像费尔顿所研究的内容,他将个人生活经历编制成年谱,进而将个人数据量化达到一份报告的高度,但这个报告令你可以看到费尔顿的衣食住行的信息流,他所在的社区情况,甚至可以看到他和他的女朋友见面频率起伏的原因。


  2011年的一天,美国国家安全局的人找到费尔顿,希望他通过一些数据来帮助国安的人找到一群制造假币的人。费尔顿说,他做到了。但是在2011年他的个人年谱报告中,他删掉了他在这段时间所有去过的地方的痕迹。“不然,另一个大数据专家,也许来自罪犯,就会分析出我是怎么找到他们的了。”他说。


  费尔顿确信,数据真正的量化应用是可以达到一个可视化的高度的,这种可视化提供的附加值才是有价值的,“数据的力量仍然被许多公司低估。当你观察成功的公司时,他们都是靠数据推动的。我们要清楚的一点是,没有哪个产业可以不被数据驱动的公司所颠覆。”


  数据虽然有耍酷的力量,有时候也许还是人艰不拆的好。“我对我父亲的数据研究中看到了一个我陌生的父亲。我发现他上世纪70年代多次去过越南。”费尔顿有点伤感地说,“但是我父亲的好友说,那些都是真实的,就是那样的!”