在云计算之后,大数据堪称另一个火热的名词,美国总统选举、伦敦奥运会……各项时事热点中都能看到它的身影。在2013年国内外的大数据领域将有哪些领域将更为火热呢?以下6个方面值得关注。
智能数据?
美国各个行业领袖、作家、演讲者还有民意调查机构已经开始使用“智能数据”这一个词语,这指的是在大数据场景中一个越来越普遍的模式——通过预测分析,实现持续的数据产品化。
从本质上讲,BI(商业智能)正被超越,因为它依赖于人工解释数据,而企业正在寻求通过预测分析,让机器捕获到的大量数据产生利润,这是依赖于统计学和先进的技术来认识和利用数据。这类技术通常表现为产品中能够产生营收增长的智能特性,比如欺诈甄别、推荐技术、个性化、广告定位等等。Netflix,亚马逊,RichRelevance,Gravity,LinkedIn,SailThru等企业都在利用智能数据。
数据科学?
数据科学是一个新的领域,它运用了统计学、机器学习、自然语言处理,计算机科学等先进的理论和技术,从海量的数据中提取信息。有时候也用于创建新的数据产品,可以说,这同样是数据科学被创造的缘由。不过,随着这一词汇的人气急升,它越来越被各类厂商滥用。比如鼓吹自己是数据科学的平台,而实际上核心技术只是数据分析的信息处理工具。同样的,许多懂得SQL和MicroStrategy的人现在也自称是数据科学家。这不得不让人担心,这个词可能会因为过于成功而成为自己的受害者,和大数据、云计算等词汇一样遭受到被滥用的命运。
NewSQL?
NewSQL是用来描述一个高度可扩展、水平分布的SQL系统。目前包括VoltDB,SpliceMachine,SQLFire,Impala,Redshift,Clustrix,NuoDB、Hadapt等众多解决方案,它结合了NoSQL平台的可扩展性、传统关系数据库的SQL和超强的ACID作保证。NewSQL并不意味着NoSQL会消亡,这只是意味着那些想要可扩展性和SQL的企业,也可以鱼与熊掌兼得。
许多公司将继续选择NoSQL系统,因为它支持非关系型数据,并能提供更高的性能,因为它们不提供ACID。
预测分析?
经历了多年来相对的默默无闻,预测分析迎来了自己的时代。作为数据科学(datascience)和智能数据
的核心,预测分析是“历史分析”的另一面,它涉及到使用历史数据来预测未来的事件。如果你能预测未来,那你也可以改变它。
事实上,预测分析是一切事物的“推荐引擎”,它推荐的项目是所预测的最大转变可能,比如用于欺诈甄别,用于预测哪些假释犯最容易犯谋杀罪。这一技术涉及统计学、机器学习、建模以及其他领域的识别和开发模式。
这一趋势还未真正形成,但是值得关注。它包括数据流分析、NLP(似乎将成为主流,这在很大程度得益于Alchem??yAPI等技术供应商)、图像和视频流处理(包括人脸、手势和情绪的检测)、机器学习、内存存储、计算网格,图形数据库,提供了一个完全不同的方式用数据分析来解决问题。
后大数据时代
大数据已经到达了它的鼎盛时期,虽然存在诸多挑战,但是几乎无限量的非结构化数据存储,已经不再是一个传说。同时,供应商对大数据的广泛使用和滥用,也意味着随着时间的流逝,它所能包括的含义将越来越少。
随着存储、处理和数据使用日益复杂,这意味着我们可能不会看到一个新的单一术语来代替大数据。相反,我们将从最常见的使用实例开始,看到更严格和更具描述性的术语得以采用。
后大数据时代欢迎你!不过,前路漫漫,这也不会是终点。