vSAN集群部分虚拟机“不可访问”
现象
vSAN集群物理机关机进行硬件升级后,启动后发现部分虚拟机显示不可访问,重新注册虚拟机问题依旧
排查过程
物理机ESXi启动SSH服务,并且登录到SSH
在物理机上依次执行下面的命令,进行状态检查
检查vSAN集群健康状况esxcli vsan health cluster list
检查虚拟机状态vim-cmd vmsvc/getallvms
检查集群主机状态esxcli vsan cluster get
在执行esxcli vsan cluster get
后,发现有一台主机处于维护模式
[root@SH-VSAN01:~] esxcli vsan cluster get
Cluster Information
Enabled: true
Current Local Time: 2023-09-03T04:49:40Z
Local Node UUID: 63f4d839-32da-07f5-a655-00620b784b80
Local Node Type: NORMAL
Local Node State: MASTER
Local Node Health State: HEALTHY
Sub-Cluster Master UUID: 63f4d839-32da-07f5-a655-00620b784b80
Sub-Cluster Backup UUID: 63f4e01c-84c4-ada9-4667-00620b925480
Sub-Cluster UUID: 52a99051-c929-d59e-7cf3-7a049138ef11
Sub-Cluster Membership Entry Revision: 2
Sub-Cluster Member Count: 3
Sub-Cluster Member UUIDs: 63f4d839-32da-07f5-a655-00620b784b80, 63f4e01c-84c4-ada9-4667-00620b925480, 63f4f2ec-35c2-e5e9-e648-00620b9254b0
Sub-Cluster Member HostNames: SH-VSAN01, SH-VSAN02, SH-VSAN03
Sub-Cluster Membership UUID: 63f1f364-e2e9-8677-edad-00620b784b80
Unicast Mode Enabled: true
Maintenance Mode State: ON
Config Generation: d3a3bca6-72fe-4a7f-bbda-6ce2aeb07a96 11 2023-09-03T04:00:46.762
Mode: REGULAR
但是在前端网页中显示未处于维护模式,并且执行命令esxcli system maintenanceMode get
显示为Disabled
,未处于维护模式
[root@SH-VSAN01:~] esxcli system maintenanceMode get
Disabled
解决办法
执行命令,将维护模式的主机退出维护模式esxcli system maintenanceMode set --enable=false
如果卡在Maintenance Mode State: ENTERING
,可以在ESXi的Web界面手动执行一次进入维护模式,这时候会出现两个正在进入维护模式的任务进度,手动取消后再次查看状态