将超融合平台带入企业数据中心会面临一系列问题,因为之前网络、虚拟化与存储团队是各自独立的。
超融合基础架构在虚拟化平台当道的环境下挑战很大。像所有结构性的演变一样,对该环境如何运行产生影响。融合存储与计算意味着双方相互影响。在部署一个新的架构之前,明白运维成本很很重要。有些任务看起来很容易,其他的则很复杂或新简直就是全新的。
在传统的虚拟化架构中,虚拟机存储在阵列中,这个平台就只用于存储,其他不管。该阵列应该随时可用。阵列及其存储网络通常由自己的团队管理,一般是存储团队。运行在hypervisor主机上的虚拟机共享到存储阵列的访问,一般经由一个专门的存储网络。该hypervisor与虚拟机由虚拟化团队照看管理。保持存储与计算的独立能在一方发生问题时不牵连另一方。常见的操作挑战源自于两个独立的团队,大家相互不清楚对方的领域。理想中,两个团队该紧密合作,但在多数企业中这些团队有冲突。在两个团队之间沟通配置请求与性能检修复杂又缓慢。
在超融合基础架构中,存储与计算集成了。每个hypervisor主机有本地存储,形成集群并拥有冗余的共享存储。存储集群是运行每个hypervisor主机上的软件,要么是在hypervisor自身中,要么是在主机上的虚拟机中。这提供冗余,并让数据跨集群分布以提升性能。数据块跨多个hypervisor主机扩散,确保单个主机不可用时的数据可用性。多数超融合系统默认下对数据保存两个副本。这种冗余存储意味着集群的有效库容是购买容量的一半。
管理在合并
超融合的另一个益处在于管理的整合。虚拟化团队将管理计算与超融合存储。一般地,这对于曾经虚拟化与存储团队各顾各来说有着积极意义。虚拟化团队可以在需要的时候立即配置存储,访问他们所需的性能数据。挑战在于虚拟化团队必须学习存储知识。多数超融合产品通过使用大量SSD提升性能,从而简化了存储管理。
移除主机
在传统架构下,通过将虚拟机迁移到其他主机可以停止使用hypervisor主机。这需要花费几分钟时间,还有虚拟机的RAM必须通过网络复制。
在超融合架构下,hypervisor主机也是存储阵列的一部分。存储在主机上的数据必须复制一份到主机,还有RAM内容也要复制。由于虚拟机磁盘通常是虚拟机RAM的数倍,该复制要几小时,尤其是磁盘比RAM慢得多。
要将超融合主机移出集群,,又不损害数据保护,这比传统主机花费的时间与精力要多。一种方式是将数据再复制一份。在维护时,数据部用心复制就能实现冗余存储。当然,存储数据的三个副本意味着只有全部容量的三分之一能用于存储虚拟机。这就可能需要购买更多磁盘容量以实现快速维护。
超融合架构使用存储集群的分布式特性交付性能。通常每个hypervisor可以请求整个存储集群来交付性能。一台不运行的hypervisor主机不再交付性能。存储集群不在维护期间交付峰值性能。希望虚拟机工作负载不会在正常运行中将存储集群推向极限。有时当存储性能处于临界点,可能无法承担主机维护。
给主机打补丁
一个常见运营活动是给hypervisor打补丁。如任何软件块一样,可以发现错误,需要部署补丁保护安全、性能与可用性。每台主机必须停止使用,打上补丁并重启后才能运行。在传统架构中,有八台主机的集群打补丁需要几小时,每台主机得15分钟。有了超融合架构,每台主机所需时间得几小时,意味着八台主机的集群需要一天时间打补丁。