У меня проблема с нашим клиентом.
Мы настроили циклический многопутевый переход к их san из их кластера ESX, у нас он настроен так, что два сетевых адаптера на каждом хосте добавляются в группу портов, один сетевой адаптер подключается к одному коммутатору, а другой - к другому коммутатору. Затем каждый коммутатор подключается к одному из двух интерфейсов Gigabit на Equallogic. Затем я правильно настроил динамическое обнаружение и включил циклический перебор в каждом хранилище данных для каждого хоста.
У нашего клиента есть автономный сервер esxi как часть среды, и с этой конфигурацией он отлично работает. Проблема только в кластере. Когда мы первоначально перенастроили его для работы ранее в тот же день, я протестировал его, вытащив переключатель, и он работал для кластера + автономного хоста esxi. Затем я перешел к базовой конфигурации переключателей; 1 порт без тегов на vlan 1 для управления, а остальные без тегов на vlan 500 для данных. Затем я вставил первый перенастроенный переключатель, затем через некоторое время вытащил второй переключатель, увидел, что он вышел из строя, и сделал то же самое. После перенастройки я вернул второй переключатель в среду, и он работал нормально.
Затем я понял, что пропущу питание к переключателям через боковую часть шкафа, и мне придется перенаправить их, поэтому включил питание переключателем 2, хорошо, подключил его обратно, хорошо, нажал на первый переключатель питания, хорошо, воткнул обратно ... потом был потерян доступ к хранилищам данных. Я заглянул в хранилища данных в vsphere и заметил, что все LUN были отключены, даже после обновления ничего не появлялось. Я включил первый выключатель, и доступ был восстановлен.
Странно то, что такое поведение наблюдается только в кластере ESX, автономный хост ESXi работает нормально и, насколько я могу судить, имеет идентичную конфигурацию.
Я признаю, что я не гений в области хранения данных. Кто-нибудь захочет пролить свет на то, в чем я ошибаюсь?