虚拟化并不是一蹴而就的,随着时间推移,虚拟化就会出现各种问题,就算看起来运行得很正常。
例如,虚拟机不受控制的增长就造成虚拟机蔓延,会逐步消耗来自服务器的剩余处理能力。虚拟机蔓延会降低其他虚拟机的性能,导致未知的崩溃,并阻止虚拟机从其他受影响的服务器进行正确的故障转移。给底层虚拟化平台升级或打补丁也会对性能和稳定性造成未知的结果。
因此,管理员必须积极主动地预防虚拟机蔓延,以及可能出现的其他问题。下面我们分享一些最佳实践。
虚拟化生命周期管理以及性能监控
虚拟化生命周期管理是有助于管理虚拟机的一种策略,确保只有授权的管理员能够创建所需的虚拟机,这些虚拟机能激活使用,并且最终能删除以释放计算资源给其他虚拟机。
性能监控能够根据有形因素计算资源利用率,比如网络带宽、磁盘I/O和CPU使用。追踪随着时间的推移,资源负载趋势能够标注出潜在的需要进行研究的故障点。几乎所有的性能监控工具都包括email/SNMP陷阱,当关键资源超出设置参数时会发生警报。识别资源使用里的瞬间警告转移能够较早发出警告,这对于快速做出决定是必要的,更能最小化产生环境的损失。
“在终端用户知道之前你应该发现问题,”FirstFlightFederalCreditUnion首席运营官ToddErickson说。
服务器容量规划与归档
正在进行的性能监控对于实际的服务器容量规划也很必要。通过观察趋势,管理员能对未来升级做出预测,以适应业务的长期增长。
“在虚拟环境里作的容量规划越多,你就会发现这不是物理设置,”IBusinessNetworkLLC技术服务经理TyHacker说。
服务器容量规划更好,花费也不贵,所以不过不做规划在达到危险级别时就会损失性能。
彻底预防虚拟化问题的最后一个元素是精确的、精心维护的存档。出现在虚拟设置里的大量细节非常容易忘记。所以要记录支持文档,确保你的修复、升级和提升进展顺利。