Blog of Khlebalin Dmitriy

(Дорогу осилит идущий…)

Crash cluster vSphere 6.7. vCenter High Availability (VCHA) (part 2).


Времени мало, перед работой решил черкнуть пару строк…

В первой части описал  хронологию и траблешутинг падения кластера, вторая часть больше посвящена отладке, а именно настройке vCenter High Availability (VCHA).

https://vmblog.ru/nastrojka-vysokoj-dostupnosti-ha-dlya-vmware-vcenter-6-5/

https://esxsi.com/2018/10/21/vcsa67-ha/

https://vmvtips.com/2019/02/24/vcp-dcv2019-objective-1-2/

У меня уже подцеплен другой VLAN управления (VLAN4), который мне будет необходим чуть позже, поэтому, как его «прикрутить», я здесь этот момент пропущу.

Пробую нажать кнопку Set UP

Предположил, что ошибка связана вот с этим правилом DRS.

 

Но мое предположение оказалось неверным. Результата это никакого не принесло.

Далее предположил, что ошибка вызвана остановленной (а точнее даже выключенной) службой:

Служба vCenter HA в положении Disabled.

Поэтому стартануть ее тоже не получится.

Официальный гайд гласит следующее:

https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.vcsa.doc/GUID-10E2CE2D-8CBD-49B7-BC1C-1F25C1A627EC.html

но в живую всего этого нет (вероятно было в версии 6.5)

Пробуем обходной путь:

Тоже не выходит «каменный цветок».

Тогда будет полезен вот этот пост:

https://communities.vmware.com/thread/595633

Через HTML5 ничего не получается, а вот через:

Вполне себе получилось

Службу включил, но потом выключил, и понял, что она не влияет на процесс-это странно, но это факт (вероятно в процессе развертывания HA она в последствии все же стартует сама), пока оставляем выключенной.

Далее продолжаем настройку через этот же интерфейс FLEX (запускаем из под IE, в EDGE, Chrome, мне ее так и не удалось стартануть).

Адреса должны быть в другом VLANe (про него я как раз писал в начале поста).

Хосты и стораджи тоже надо разнести.

В процессе появилась вот такая ошибка:

Предположили, что ошибка связана с правилом DRS, которое привязывает vCenter  к первой ноде (я ранее его уже упоминал). Удаляем правило, снова пересобираем.

И снова та же ошибка:

Руками «передвинул» vcenter на другую корзину и при создании реплик разнес все по разным нодам и по разным лунам.

Но это тоже не помогло. Теперь ошибка на третьей копии vcenter.

Переводим DRS в ручной режим.

Снова пробуем.

Проблема  та же самая.

Выключаем DRS.

И  выключаем Admission Control.

Снова пробуем.

Свершилось чудо. Подозрение пало на то, что как раз Admission Control не давал развернуть HA vCenter.

Снова включаем DRS и Admission Control.

Пробуем INITIATE FALOVER.

Сервак на некоторое время (минут 5-10) впадает в анабиоз. И поднимается вновь.

После чего пассивная нода вдруг становится активной, HA наконец отрабатывает.

Это радует.

Далее осталось разобраться с:

И VMvare Tools, но это уже не относится к падению кластера.

Отправляем логи, коллегам в «КРОК» для изучения и в «VMware» для расшифровки и понимания того, что вызвало такое падение.

В общей сложности кластер был недоступен примерно 4 часа — ЭТО НЕ ЕСТЬ ХОРОШО.

Восстановление обновление и отладка также заняла немало времени. Надеюсь все, что было сделано, было не зря. Пока полет нормальный…

По итогам попробовал «уронить» одну ноду, дабы посмотреть , как все будет.

Как я ранее писал, сначала включил Admission Control, но уронив ноду, выключил его, так как машинки при текущей нагрузке еле ползли и почти впали в гидростопор (резервирование ресурсов в нашей ситуации пока противопоказано).

После отключения все достаточно быстро заколосилось…

Продолжение следует…

Всем хорошей работы!!!

07.11.2019 - Posted by | vmware & hyper-v Infrastructure |

Комментариев нет.

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Google photo

Для комментария используется ваша учётная запись Google. Выход /  Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d такие блоггеры, как: