探索中国CIO人才现状 | 第四季调研报告
网络存储可能影响重复数据删除技术的应用
2014-01-15  作者:e-works 

  相比居于第二线的备份设备,网络存储设备有许多不同的特性,连带De-Dupe技术也面临不同的要求:


  对能效更敏感


  将数据以重复删除运算分解为基本元素与索引存储,以及反向运作将经过重复删除运算后的数据回复为原始状态,以便供前端主机存取,都需要消耗运算资源。


  网络存储设备必须应用前端主机即时写入与读取数据的要求,对能效十分敏感,不能允许因执行De-Dupe与还原运算,而导致前端主机的存取出现延迟。


  重复删减率先天较低


  许多备份型De-Dupe技术宣称的20~30倍,甚至是50倍以上的空间节省比率,都是以“每天执行全备份”为基准。


  一般情况下,企业数据的变动量通常有限,每天新增或变动部份,占总数据量的比率并不大,因此若每天都执行全备份,则两次全备份之间,绝大部分的数据显然都是重复的。在这个基础上运用De-Dupe,得到几十倍的空间节省效果是理所当然的。


  但换成网络存储环境,就没有前述那种数据先天就带有很高重复性的现象,能缩减的比率十分有限。


  网络存储直接处理原始数据


  备份装置存放的数据是原始数据的复本,只有需要还原时才派得上用场;网络存储装置存放的,则是必须随时应用前端主机存取的原始数据。因此整合在网络存储设备中的De-Dupe技术,对重复删减运算法的可靠性与可用性,将有更高要求。


  需与其他存储功能整合


  许多增益存储功能,都是基于网络存储设备的原始磁盘进行,如快照Clone远端复制等,因而在网络磁盘运作的De-Dupe,也必须整合这些应用功能,不能因启用De-Dupe而妨碍其他功能执行。