Два сервера с примерно 100 LUN, представленные каждому из IBM V7000 (Storwize). Каждый LUN имеет 8 путей - 2 порта FC x 2 коммутатора FC x 2 головки V7000 - итого около 800 устройств. Устройства / пути управляются multipathd. Каждый раз, когда один из коммутаторов FC или портов выходит из строя (для обслуживания), сервер теряет половину других путей ко всем LUN, но в этот момент все в порядке. Однако, когда соединение восстанавливается и пропавшие 400 путей внезапно снова становятся доступными, сервер блокируется (предположительно, связанный с вводом-выводом) на 30-90 секунд.
Стоит ли мне смотреть здесь на глубину очереди или другие настройки? Кроме того, следует ли мне искать на серверах или на V7000?
ОБНОВЛЕНИЕ: ОС - CentOS 6.6 2.6.32-504.30.3.el6.x86_64, карты FC - QLogic 8G