Blog of Khlebalin Dmitriy

(Дорогу осилит идущий…)

VMware VM Monitoring.


Начиная с версии ESX Server 3.5 VMware HA может обнаруживать сбои в работе виртуальных машин. Данная функциональность называется VM Monitoring и она включается на уровне HA кластера, и дальше VMware HA а точнее VM Monitoring сервис начинает контролировать доступность виртуальных машин. В случае сбоя гостевой ОС (к примру BSOD-а или Kernel Panic-а) виртуальная машина перезапускается (Reset), чтобы восстановить работу.

Как он это делает?

Каждая виртуальная машина, каждую секунду используя VMware Tools посылает хартбиты (heartbeats) VM Monitoring сервису тем самым говоря что она работает. VM Monitoring сервис также наблюдает за I/O активностью этих машин чтобы уберечься от  лже срабатываний (к примеру если VMware Tools перестали работать или же мы их остановили на время и т.д.). Если VM Monitoring сервис не получал хартбиты в течении failure interval-а, то проверяется I/O stats interval.  I/O stats interval определяет если хоть какая ни будь активность дисковая или же сетевая произошла в течении предыдущих двух минут. Если нет то виртуальная машина перезапускается. Значение  I/O stats interval-а регулируется атрибутом das.iostatsinterval, и данный атрибут является cluster-level атрибутом.

Так же мы можем отрегулировать уровень чувствительности VM Monitoring-а. Есть четыре уровня:

  • High
  • Medium
  • Low
  • Custom

Высокая чувствительность способствует более быстрому реагированию при случае сбоя виртуальной машины, но в некоторых случаях это может сыграть злую шутку нам. Например при нехватки ресурсов может случиться так, что хартбиты не будут доставляться, но на самом деле гостевая ОС будет работать, но VM Monitoring сервис все равно будет думать, что она упала и перезапустит ее.

Низкая чувствительность увеличит время реагирования в случае выхода из строя гостевой ОС, так что надо выбрать тот вариант который больше подходит для конкретной инфраструктуры.

В случае Custom чувствительности мы сами указываем значения.

snap3

snap1

Чтобы избегать постоянно повторяющихся перезапусков виртуальной машины в случае ее неисправности, по умолчанию VM Monitoring сервис перезапустит VM три раза (значение Maximum per-VM resets) в течении определенного количества времени (значение Maximum resets time window > Within), и больше не будет стараться ее перезапустить в случае последующего падения виртуальной машины, до тех пор пока не истечет отведённое время (значение Maximum resets time window > Within). Потом все пойдет заново.

snap2

Использованная документация: vSphere Availability Guide

Всем хорошей работы !!!

Реклама

23.07.2014 - Posted by | vmware & hyper-v Infrastructure

Sorry, the comment form is closed at this time.

%d такие блоггеры, как: