У меня есть программный раздел RAID 5 на LVM в Ubuntu (на самом деле, настольный компьютер, но я использую его как сервер). Я синхронизировал с ним тонну данных, и компьютер сильно зависал, так как мне нужно было нажать «Сброс».
Я подумал, что это rsync. Но я решил попробовать dd if = / dev / zero of = / path / to / raid5 и, конечно же, компьютер завис. Сделал идентичный dd для раздела JBOD на том же компьютере, и он не сломался.
Предполагая, что чистый раздел RAID5, трехъядерный процессор 2 ГБ оперативной памяти, 6 ГБ подкачки, что может быть причиной этого?
Изменить: я исключил память; Я провел 8-часовой тест без сбоев.
26.04.2011 Редактировать: я исключил только Ubuntu; ошибка произошла в стабильной версии Debian 6. Это либо аппаратная ошибка, либо ошибка апстрима.
Да, проверьте свою оперативную память. Попробуйте более тщательно протестировать простой ввод-вывод. Помимо этого, попробуйте получить повторяющийся сценарий и откройте ошибку на launchpad.net.
Является ли RAID-массив всем на сервере (включая /
и т. д.) или отдельно? Если отдельно, можете ли вы увидеть что-нибудь в журналах непосредственно перед жестким зависанием? Кроме того, не могли бы вы подтвердить, что это было полное зависание - могли бы вы вообще пропинговать машину по сети и так далее?
Различия между записью в массив JBOD и массив RAID5 заключаются в том, что в случае RAID5 доступ к дискам осуществляется более равномерно, и будет использоваться больше процессорного времени (для вычислений четности). Если бы это была проблема с одним из дисков, я бы ожидал, что он выпадет из массива, а не машина зависнет, если только проблема не в том, что контроллер дисковода упал и забрал с собой контроллер ввода-вывода машины. Первое, что я сделаю здесь, это полный тест памяти и убедитесь, что охлаждение процессора работает должным образом (расчеты четности для RAID5 сами по себе не налагают значительной нагрузки на современный процессор, но могут опрокинуть его. край, если он уже приближается к проблеме).
Предполагая, что вы используете программный RAID5 через LVM (вы не говорите, что предоставляет R5), это может быть признаком ошибки ядра. R5 требует вычисления четности, что потребляет ресурсы процессора. Если оно будет достаточно высоким, ядро может столкнуться с некоторыми неразрешимыми конфликтами. Однако это всего лишь предположение.