CloudStack异常状态恢复&计划内开关机顺序

CloudStack在遇见突发的停电或断网情况下,有可能出现很多异常的状态,如主机存储的警告状态,虚拟机不能正常运行或启动。

在运营维护中,为了保证CS内个物理设备和VM的状态稳定,我这里有一个关机顺序的建议。
  • 在UI上关闭所有的VM。
  • 在UI上将主存储进入维护模式,再等待所有系统虚拟机也关机。
  • 在UI上将host进入维护模式,
  • 关闭CS服务。
  • 关闭mysql数据库
  • 关闭相关硬件设备

重启的时候用相反的操作进行就可以。以上步骤是在计划内停机的情况下做的操作。

如果是突然断电造成VM不能启动,大部分是由于存储原因,或host同步状态问题造成的,需要看log分析,一般也都能恢复回来。
  • 出现问题后,需要检查的几个地方:
  • 存储的运行状态
  • 存储和Hypervisor的连接状态
  • Hypervisor和管理节点的连接状态
  • 如果相互连接都没有问题,可以尝试在UI上将主机进入维护模式,再退出。或者直接进入DB将主机的状态直接改为UP。


但如果人品不好,因为断电造成存储或VM的镜像文件损坏,恢复的可能就很低了。如果因为镜像文件损坏,Hypervisor会有直接提示写入CloudStack的log用于分析。这时只能找Hypervisor相关的恢复操作来进行解决。

猜你喜欢

转载自tanthalas.iteye.com/blog/1855038