随着全球范围内对大数据技术及服务需求的不断升级,大数据技术堆栈的各个层面也将迎来显著增长。存储是基础架构组件中的重要组成部分,在2011年到2016年之间将一直保持53%的复合年增长率(简称CAGR)。国际数据公司(即IDC公司)在刚刚出版的两本深度研究报告《大数据存储:使用模式深度分析》(IDC#240372)与《大数据存储部署中的影响力》(IDC#240451)中展示了其首套对大数据及分析存储架构的调查结果。
大多数企业所生成、处理与存储的数据量将在可预见的未来继续增长。“存储将成为基础架构中最重要的组成部分之一,用于为以预测为目的的大数据与分析环境提供运作平台,”IDC公司存储系统研究主管AshishNadkarni表示。“由大数据与分析环境带来的存储需求将带来丰厚的利润空间,其市场总额将由2011年的3.799亿美元上升至2016年的接近60亿美元。这一增长在很大程度上来自容量优化系统(包括高密度机柜),不过基于软件、采用内部磁盘的分布式存储系统也将成为经过处理的数据的理想安置方案,并成为某些用户的理想选择。”
此外,企业将继续向新的数据源进军,这与分析师将大数据着眼点由研究向探索过渡密切相关。这种转变将令基础架构投入进一步加大,数据结构平台的建设也将获得显著推动。
《大数据存储:使用模式深度分析》
IDC的这份研究报告对IDC于2013年第一季度进行的以存储趋势为对象的大数据调查做出评估。存储作为一套极为重要的子系统,能够成为判断大数据与分析实例成功与否的重要标准。容量提升与应用程序性能改善仍将继续成为各类企业在与大数据及分析环境对接的存储领域面对的最大挑战。
68.6%的受访者将性能作为选择存储架构的主要参考指标。另有59.5%的受访者认为实施成本是影响选择的主要推手(调查允许存在多个选项)。
只有不到31%的受访者表示自己还没有为数据分析基础架构部署企业级存储系统,但他们同时表示有计划在未来六个月内着手实施。
大数据基础架构中的两大分支在受支持比例上可谓平分秋色,其中聚合式基础架构拥有30.1%的支持率,而离散式则为29.4%;此外,还有28.4%的受访者选择整合内部资源。
《大数据存储部署中的影响力》
IDC在这份研究报告中探讨了企业在大数据基础架构领域面临的一些性质定位与“幕后”挑战——它们可能在部署过程中或完成后出现。企业将继续努力评估哪些数据需要分析、如何在分析前后保存这些数据以及怎样将数据分析结论反馈至业务流程当中。
63.7%的受访者认为处理与运营相关的数据是部署数据分析基础架构的主要用例,而53.3%的受访者则把来自销售或零售终端系统的交易数据视为首要处理对象。
IT部门是目前对数据分析基础架构影响最大的群体,运营部门则位列第二。
根据略超过61%受访者的意见,改善客户满意度是数据分析部署工作中所面临的最大业务挑战。