Hadoop大数据部署软件供应商CEOJohnSchroeder关于2014年大数据发展的8个预测,JohnSchroeder认为在新的一年里企业主管的主要发展思路是将大数据变成为企业必须具备的基础设施,以下是有关技术发展和市场走向的8个预测:
预测一:SQL依然是大数据发展的一个矛盾点,首先SQL依然是Hadoop的业务分析师以及项目的开发人员的首选工具,开发人员可以选择hive、drill和impala等apache项目,以及选择Hadapt、Hawq和SpliceMachine等公司的专有技术。但是SQL还面临着一个严峻的挑战——那就是SQL需要数据结构,而集中的结构化数据可引起延迟并且需要人工管理。SQL还限制分析类型。过分强调SQL将延迟机构全面利用其数据价值的脚步和延迟反应。
预测二:在2014年安全问题依然是制约技术发展一个难题,其中身份识别、认证是主要的数据安全问题,随着Hadoop(分布式计算)中提供的接入控制能力的猛烈攻击,机构迅速认识到线路级身份识别是必要的基础。没有充分的身份识别与认证机制,任何更高级的控制都很容易被绕过,妨碍预定的安全计划。
预测三:众所周知数据的不断发展中,总会有一些错误的数据,这些错误的数据可能导致中下游的分析出现偏差,导致跨部门或者业务部门的操作缺乏一致性等等,那么如何将错误的数据变成对企业有帮助的东西呢?2014年我们将会看到数据异常问题的解决方案。
预测四:Hadoop即将入户各大企业,2014年将看到Hadoop在各个行业中的生产部署显着增加。这将显示出Hadoop在运营中的实力。在那里,生产应用与分析结合在一起能够提供可以衡量的商业优势,如在客户化零售建议、诈骗检测和试验传感器数据进行规范的维护等场景。
预测五:更多的数据仓库将部署企业数据中心,2014年将会看到大多数公司的数据中心把数据提取处理和数据从企业数据仓库卸载到Hadoop,这样Hadoop将成为企业中心,并且能够对额外的处理或者新的应用进行更多的分析,同时还可以大幅度的降低数据中心的成本。
预测六:每个行业都会部署一个新的以数据为中心的应用,因为在2014年大数据的利用能力将会是企业间竞争的核心武器,更多的公司将使用大数据和Hadoop准确地针对个人消费者的偏爱追逐追加销售和交叉销售的机会,更好地缓解风险以及减少生产和开销成本。
预测七:数据成为每个数据中心的重中之重,在2014年,it部门将越来越多地担负定义支持多种应用的数据基础设施的任务,把重点集中在部署、处理和保护一个机构的核心资产所需要的基础设施方面。
预测八:2014年非结构化的查询语言将会成为搜索的中坚力量,同时由于2013年有大量的用于Hadoop的SQL计划。2014年将是这种非结构化查询语言成为重点的一年。把搜索集成到Hadoop将为查找重要信息的企业用户提供一种简单和直观的方法。搜索引擎还是包括推荐引擎在内的许多发现和分析应用的核心。