RAID-контроллер Areca ARC-1880ix-12 (прошивка 1.50) зависает при высокой нагрузке.
Моя установка:
Шасси Chenbro 3U
Материнская плата Intel S5500BC
Процессор Xeon 5603
16 ГБ оперативной памяти
12 дисков Seagate SAS ST32000645SS (2 из них как горячий резерв, 10 как RAID10)
Карта HBA Mellanox Infiniband
Этот сервер работает как внешнее хранилище Infiniband для виртуальных машин Xen. При большой загрузке прошивка Areca зависает - она становится недоступной даже для сетевого адаптера Areca. После сброса питания сервера он возвращается в нормальный режим работы.
Пока Areca повешен, я могу подтвердить, что он включен (соединение Ethernet активно) и HBA Infiniband работает нормально.
Заранее благодарим за любую идею или предложение, в котором может быть проблема!
Ваша проблема та же, что и у меня несколько месяцев. Сначала ARC-1220, а затем ARC-1260. Оба были пропатчены до прошивки 1.49.
Я подозреваю, что в последней прошивке есть ошибки, поскольку обе карты работали нормально. ARC-1220 стал нестабильным, и ARC-1260 работал, но зависал, даже при потоковой передаче MP3 по жесткому каналу 1000 Мбит он давился и зависал.
Моя Areca 1800IX-16-4G тоже зависает, и это похоже на сбой DRAM.
Проверьте журнал событий и обновите bootrom, прошивку, mbr0 до 1.52, затем перезагрузитесь, обновите BIOS до 1.52, затем снова перезагрузитесь и обновите SAS Expander через RJ-11 к COM-кабелю (2 файла) и Hyperterminal с помощью:
FW : sas2xfwYYMMDD.fw
Command to update,
1)"fdl code 0" to update new fw file
2)"reset"
MFG data : mfgdat6gMMDD.rom
Command to update,
1)"fdl mfgb 0" to update new data file
2)"reset"
after boot,
cmd > rev
Пара вещей -
Кажется, у вас установлена более старая прошивка. Текущая прошивка 1.51 - http://www.areca.us/support/download/RaidCards/BIOS_Firmware/release_1.51.txt
Установите интерфейс командной строки Areca и проверьте состояние ваших дисков и контроллера.
Посмотрите, сможете ли вы отключить сервер, запустить несколько тестов ввода-вывода и посмотреть данные на sar.
Если это может быть что-то еще, кроме Areca - проверьте системные журналы на наличие трассировки стека ядра или системных / аппаратных ошибок. Проверьте, есть ли примечания к выпуску BIOS сервера / материнской платы и есть ли там что-нибудь.
Чида