探索中国CIO人才现状 | 第四季调研报告
如何看待阿里巴巴转型大数据公司
2013-04-12  作者:CIO时代网 

  


  “平台、金融、数据”是去年马云公布的阿里巴巴“三步走”发展战略,而作为压轴部分,“数据”显然是阿里集团战略棋盘中最有野心也最为谨慎的一步棋。昨日,在淘宝开放日数据分论坛上,阿里巴巴数据委员会会长车品觉就表示,阿里巴巴的未来会是一个数据公司,但“贩卖数据并不是阿里巴巴未来要走的路”。此外,他还透露说国内一些商家、企业已在线下悄悄展开了“数据的收集”。


  阿里设立数据委员会


  安全与质量是“大数据”核心


  车品觉在论坛上谈到了阿里巴巴对“大数据”的应用,称阿里已经设立了数据平台事业部和横跨其他事业部的数据委员会。“专设数据委员会,是希望把数据安全、数据质量以及数据化运营当作集团战略重点来抓。”并进一步协助集团内各事业部数据基础设施平台的“底层互通”。


  他对此做了进一步解释。数据安全,主要是要考虑“在数据开放的同时如何做到对用户隐私的保护”。数据规模越大才越有价值,价值的发挥基于数据的开放。而随着数据开放而来的则是安全问题。


  车品觉说,“阿里对于数据的挖掘处理有一套自律准则,包括后台数据的查看,一些明细是看不到的,这样封闭的目的在于维护用户的隐私,同时也防止数据滥用。”


  对于数据的应用,阿里一向谨慎,车品觉说:“阿里内部有个专门的小组,数据的公开与否主要由他们进行判断。”然而评判小组却没有一个具体且统一的评判标准,“所有数据该不该公开,公开到什么程度,都以每个案例本身为具体考量。”


  而数据质量则是在大数据多源头的获取方式上,从源头上保证数据的准确度。“就好比我们去挖掘一个信用卡持有人的消费记录,但我们必须搞清楚这些记录的消费行为是不是都来自于持卡人,有没有可能这当中的一部分是持卡人老婆拿卡去消费的?”要尽可能地保证数据的精确度,不然就会导致数据质量失准。


  贩卖不是阿里大数据未来之路


  大数据无疑是个极佳的财富工具。


  从资本角度看,什么样的公司有价值,拥有多大的价值,这些都能通过它所拥有的数据规模、数据活性,以及该公司对数据的分析应用能力看出。


  而通过大数据实现盈利的关键,就在于提高对数据的“加工能力”,从而实现数据“增值”。


  关于阿里巴巴如何利用手中的数据为企业本身创造更大的价值,本报记者现场就此向车品觉会长提问,而他所代表的、坐拥30PB超大规模深度数据的阿里,却表示对大数据这笔财富的运用并非“贩卖”那么简单。


  “贩卖不是阿里未来的大数据之路”,如何在安全前提下使大数据产生新的价值与财富,这是阿里巴巴仍在思索的问题。“因为阿里还在路上,而这条路还很新,可供我们参照的‘前车’并不多。”车品觉说,“未来的发展,恐怕要到未来才知道。”


  车品觉眼中的“数据策略”


  车品觉还提到部分企业、商家在线下的一些“数据策略”。而在国外,线下企业的大数据收集早已开始。


  ●周大福


  周大福珠宝现在要求收银员在收银时做好顾客的“款式挑拣记录”。


  “假如一个顾客他这次一共试戴了5款戒指,虽然最终为其中1款买了单,但收银员要将这位顾客试戴的其他4个款式记录下来,以便做后续数据分析。”


  ●VISA


  信用卡发行商VISA,其很早就站在了信息价值链的最佳位置上。


  它的数据部门通过挖掘210个国家15亿信用卡用户的650亿条交易记录,来对客户的消费趋势进行预测,从而贩售给其他公司,以此从中获利。


  VISA数据部门通过分析发现,若某人在下午4点为汽车加油,其很可能会在接下来的1小时内去吃饭或去超市购物,而这1小时的花费约在35~50美元。对应的这些商家所需要的正是这样的“有用信息”,因为他们能据此在这一时段的加油小票背后附上加油站附近商店的优惠券,吸引加油者前往消费。


  相关链接


  大数据的六大商业类型


  大数据是一个处于爆发式增长阶段的新技术概念,由于这个领域的技术创新和投资火热,其产业生态地图处于快速变动之中,近日BloombergVenture发布了大数据产业地图2.0版本,其中将数百个大数据创业公司和IT厂商根据产品和商业模式划分为38种,大数据产业可划分为六大类:


  1.大数据基础设施类(NoSQL数据库、Hadoop相关产品、NewSQL数据库、MPP数据库、管理监控等)


  2.大数据分析类(分析解决方案、数据可视化、统计计算、社交媒体、舆情分析、分析服务、IT分析等)


  3.大数据应用类(广告优化、出版工具、市场营销、行业应用、大数据应用服务提供商)


  4.大数据数据源类(数据市场、数据源)


  5.跨基础设施分析(主要为传统IT巨头业务延伸)


  6.开源项目(框架、查询/数据流、数据访问、协作/工作流、实时、统计工具、机器学习、云部署)