探索中国CIO人才现状 | 第四季调研报告
发展大数据要翻过“三座山”
2013-06-08  作者:企业网 

   大数据,正成为当今世界最炙手可热的产业,企业、政府纷纷对其趋之若鹜。然而我市一些业内人士表示,尽管大数据前景被普遍看好,但发展上也不能操之过急,只有翻过数据来源、成果应用和隐私保护这“三座山”,大数据产业才能有光明未来。

 
 
  数据“山”:海量数据是基础
 
 
  顾名思义,大数据的首要特点就是“大”,没有大,一切都无从谈起。专家预测到2020年,全球每年新创的数据容量将会达到40泽字节,如果要用DVD光盘储存一天在互联网里传送的数据的话,大约需要2.5亿张光盘。
 
 
  东北财经大学教师屈超说,大数据取得成功的前提是有足够多的样本供应,“小数据”时代的分析预测采用的是随机样本分析的方法,弊端就在于一旦采样过程存在偏见,分析结果就会相去甚远;而大数据“样本=总体”的分析方法,让产生误差的概率大大缩小。
 
 
  业内人士建议:我市要发展大数据产业,首先就要解决海量数据来源的问题,在企业短期内无法搭建拥有足够访问量平台的情况下,可由政府牵头在公共服务领域搭建一个信息共享平台,为大数据的发展提供充足的数据样本。
 
 
  应用“山”:有应用才有价值
 
 
  大连天维科技总经理李丕说,我市发展大数据产业,一定要先期、至少要同步解决好需求、应用的问题,否则可能陷入高投入、低产出的窘境。李丕认为,阿里巴巴集团之所以近年在大数据业务上发展迅速,并已经将其作为未来集团三大战略方向之一,正是因为其背后有强劲的应用需求和驱动。
 
 
  专家建议:我市一定要提前找准和确定几个确切的应用方向和领域,之后再加快大数据产业本身所需的基础设施、技术等方面的投入。要让市场牵着产业发展,让效益支撑技术进步,不能不计产出地盲目投入。


  隐私“山”:法律边界要先厘清
 
 
  今天的互联网领域,隐私安全已经越来越成为一个问题。大数据带来的不仅是各种便利及机会,同样也会让人们时刻都暴露在“第三只眼”之下。专家表示,跨不过“隐私山”,大数据的前途注定会非常坎坷。
 
 
  中科院大连化物所研究人员李国辉说,数据的采集必然包括客户的性别、年龄、办公地址、家庭住址、消费能力水平、消费偏好等内容,甚至还包括客户的消费行为特点等详细的信息,通过对这些信息进行分析从而洞察客户的需求和意向。而问题在于,上述信息对客户来说可能属于个人隐私,客户可以接受这些信息存在于本次交易过程中,而不一定接受信息“被存储”、“被分析”,甚至“被营销”。李国辉认为,这种状况持续下去必然会遭遇反弹,如减少提供个人信息,或者提供虚假伪造信息等,这样会造成大数据中冗余数据过多的情况,阻碍大数据的健康发展。
 
 
  专家建议:我市发展大数据产业,隐私安全和保护等法律问题必须厘清、完善,许多问题企业无力单独解决,需要政府在其中发挥重要作用。