探索中国CIO人才现状 | 第四季调研报告
大数据如何成为香饽饽: 盯着SaaS!
2013-05-16  作者:CIO时代网 

  有人问我要怎样的智慧才能利用好大数据这个商机,然后我常常觉得这不是个智慧的问题——我又不是职业投资人。不过如果我是的话,我肯定会盯着SaaS(软件服务化)。


  这么说是有两个原因的:第一,有那么多的公司需要管理他们的应用和设备。如果这时候有什么技术能自动地优化这些常规任务,那一定很有潜力。现在这项技术叫做“云计算”。


  第二点就是只有通过大数据,你才能看见整个业务的全局和它的每个细节。当任何一家独立的终端用户公司没有能力(或者说不太可能)通过收集建立庞大的数据存储来解决搜索引擎优化这个难题时,专业的云端服务就可以。


  从网络安全到系统管理,SaaS已经从集中数据存储中获益:对业务的全景的把握和细致到每个独立客户的特殊需求。


  这其中一个很好的例子就是BloomReach,一家为其他公司提供网页内容优化的SaaS起步公司。


  “桌子”和“手机”各是什么意思?


  BloomReach的营销总监Joelle告诉我说:“理想状况是我们帮助用户在消费者搜索时以更显眼(排名靠前)、更相关(展现他们服务的内容)和更匹配的方式(比如语言)出现。”


  BloomReach会高频率地从整个互联网抓取信息来掌握所有其他站点内容描述、页面排布和网页架构的方式。每天他们在AWS(亚马逊网络服务)中有超过1000台云计算机来处理从10亿的数据点获取到的5T的用户行为数据。


  BloomReach的CTO和创始人之一Garg解释道:我们需要分析是哪些人在访问这些站点,他们在做什么,浏览的时间是怎么分布的还有如何把用户行为联系在一起。
  “在你动手干活(优化网页)以前,你需要从对的地方拿到足够量的数据。这个计算机学习的量是巨大的。”他说。


  当你考虑所有描述和组织事物的方式的时候,问题的规模也是一个很大的影响因素。比如你说“桌子”和“凳子”,那么结果应该是比较单一的。但是如果你说的是“手机”,这个会包含智能机,板砖机,安卓,苹果…两者的机器学习要求完全不在一个等级,是你要在优化以前,先收集的数据。


  成千上万的可能性挑一个吧


  网页组织也就是一个网页从跳转到另一个网页的最佳方式。这个问题会随着数字的增加让人异常暴躁。比如,你有4样产品要挂到2个网页上,这个很好办。但是如果你有1000件商品要放在100个页面上,同要考虑这些页面间的联系?


  还有一点是处理时间,分析100个页面要远远长于分析10个页面的10倍,没准儿比100倍还多。如果一个网站有100万个页面,其中涉及的计算量是不能估计的。通常这种情况的惯用做法是模拟,也就是在一定量的数据上计算近似结果。这样才有可能在靠谱的时间内把问题搞定。


  定制个性化的页面


  如果我们想在用户搜索时,实时调整页面内容,其中的难度可想而知。但是如果你能准确地预测他们的意图并显示合理的内容,自然意义重大。你要做的判断包括他是不是常客或者新用户,是不是对价格敏感或是钟爱某一个品牌…等等。


  这里BloomReach有一个很有趣的发现是:在节日里,“礼物”这样的搜索会非常多,但是在单个用户身上持续的时间会很短。Grag解释说,这是因为人们通常不愿意在“礼物”这件事上纠结太久,所以只要看到了合眼又价格过得去的商品,他们很快就会下单的。


  但是要用大数据优化这些页面比仅仅合眼要复杂得多。在前面那些计算机学习的过程里,人的参与也非常重要。人类当然比机器更了解买什么做礼物更合适。聪明人总是能很快发现什么是适合他的,这就是为什么SaaS在大数据时代这么重要了。