У меня есть iSCSI HP P2000 с 12 дисками DP SAS по 300 ГБ. Он подключен к 2 серверам DL385 с 64 ГБ ОЗУ, на которых работает XenServer. Сеть SAN подключена через 2 гигабитных коммутатора (4 медных канала от P2000 к каждому коммутатору, затем каждый XenServer имеет медный канал к каждому коммутатору)
Недавно я пересмотрел свое решение во время установки создать 2 виртуальных диска: RAID-5 и RAID-10. Я решил, что RAID-5 бесполезен, и уничтожил его, а затем использовал эти диски, чтобы превратить RAID-10 в один большой массив с двумя дисками горячего резервирования.
С тех пор, как это было сделано (чуть больше недели назад), производительность дисков была ужасной; смотря на top
на обоих хостах XenServer отображается ожидание ввода-вывода ~ 15%. hdparm внутри виртуальной машины показывает вокруг 1.12MB/s
читает из SAN.
К SAN подключены еще 2 машины Win2008R2. У меня есть предыдущие тесты производительности, показывающие, что они тоже испытывают значительную разницу, поэтому я не считаю, что это проблема хостов XenServer.
~24.75MB/s
, сейчас 1.67MB/s
~170MB/s
, сейчас 3.61MB/s
Расширение RAID завершено, в SMU все "ОК". XenServers довольно "пустые" (7 виртуальных машин на одной из них, 4 виртуальных машины на другой), но это производственная среда.
После некоторого дополнительного расследования выясняется, что проблема заключалась в том, что кто-то (кашляет) включил управление потоком на коммутаторах SAN по совету интернет-статьи, в которой говорится о том же самом оборудовании и явно поощряется использование управления потоком.
После отключения управления потоком средняя загрузка и ожидание ввода-вывода сразу же уменьшаются, а через 24 часа они полностью возвращаются в нормальное состояние (0,0% wa и средняя загрузка <0,10) после завершения некоторых проблемных задач обслуживания.