凭借速度及适中的价格,Google Nearline正崛起成为Amazon的Glacier云归档系统的强大竞争者。
通过降低从灾难或者宕机恢复的时间,云归档和数据备份系统在云计算中扮演了很重要的角色。尽管亚马逊Web服务的Glacier归档服务已经成为许多云用户的普遍选择,谷歌云存储Nearline也代表着一个强有力的替代选择。
就速度而言,亚马逊Glacier归档服务在Google的云存储Nearline面前显得逊色了些。鉴于其基于磁带存储的速度,Glacier的数据检索需要3到5个小时才能开始,并且需要一个对AWS的请求来进行初始化。而Nearline,使用其标准的存储接口,在3秒内就能启动数据传输。这对于在灾难恢复中数据能够多快恢复成联机状态来说产生巨大的差异,也使得单个文件或目录的恢复更具吸引力和交互性。
除此之外,Nearline的多站点冗余存储提供了数据完整性和灾难保护,并且使用和其他Google存储服务相同的接口。
Google将检索带宽建立在存档容量的基础上。目前,Nearline提供每TB存储4M/秒的带宽速度,并且速度会随着存储容量的增长而提升。这也意味着Amazon Glacier对于小容量存档具备速度上的优势。尽管这也许会成为小企业选择Nearline的一大顾虑,但是中型和大型企业都拥有较大容量的存档,因此并不那么担心带宽的问题。
尽管如此,Amazon Glacier仍然是一个可靠的服务并且从数据完整性来看是安全的。Glacier和Nearline的定价大致相同,1美分/GB,但是Glacier的早删除罚金明显要比Google要贵很多。然而,Google的高数据传输费用又抵消了这一价格的差异。
低成本云归档对企业的影响
那么,象Nearline和Glacier这样的低成本云归档系统如何影响运维呢?Facebook和其新的基于磁盘的归档系统就是一个很好的例子。Facebook已经建了2个数据中心,更多的正在规划中,每一个数据中心都超过1艾字节的容量。该社交媒体巨头没有打算丢弃每天增加的20亿张图片中的任何一张。但是,既然Facebook不得不花钱存储这些图片,那么一个低成本的系统很关键。
Facebook创建了一个很紧密的存储方案,将2PB放进一个机架中,用2台服务器来处理480个硬盘。有趣的转折是,该公司采用的电源管理方法是同一时间只允许其机架上的25个存储外壳中的一个通电。其结果是,机架功率小于2千瓦,并且磁盘的磨损惊人。
借助纠删码和数据块地理分散所带来的容量节省,Facebook拥有一个能够在失去一整个数据中心的情况下而不会丢失数据可用性的高完整性系统。另一个有趣的点在于Facebook如何处理其主要的“热”存储。并非使用3个热存储照片副本,而是采用一个热副本和一个单独的冷存储纠删码副本,从而节省了能源和空间,并同时减少了设备成本。
当需要恢复的时候,Facebook期待恢复大量的数据而不是单个文件。基于磁盘的冷存储策略允许选择性恢复,同时快速的响应时间意味着恢复可以具备交互性。但是,在常规操作中采取这个措施的一个缺点是启动一个磁盘所伴随的功率飙升,以及启动和停止所带来的额外的功率耗损,
要最大限度的降低运营成本,Google很有可能使用一些和Facebook相同的方法。基于现有的磁带密度,硬盘和磁盘的价格相近。同时,支持硬盘的基础架构同机器磁带库相比更便宜。由于磁盘比磁带的容量上升得更快,这种优势是可持续的。
磁带在功率方面具有优势,但如果用Facebook的MAID方法,磁盘又显得更具吸引力。
观望业界,似乎Nearline将施压其他供应商能否提供同类服务。在未来一年左右,其他提供商将迎头赶上,他们中的一个将可能超越Google并随着固态硬盘价格的下降而转向固态硬盘。