Назад | Перейти на главную страницу

Блокировка CentOS 6.4… без объяснения причин

У меня есть сервер CentOS 6.4 на старом ящике (HP ProLiant ML350 G4), который я недавно установил, и он работал менее 24 часов. Он имеет 6 146 ГБ 10k SCSI-дисков в RAID 1 + 0, которые также являются совершенно новыми и не имеют признаков сбоя диска или каких-либо уведомлений об оборудовании. Тем не менее, случайным образом это произойдет:

Как только это происходит, я не могу войти в систему (это происходит в приглашении входа в систему), а SSH не отвечает. Пинг отвечает, но в остальном ящик заперт. Обратите внимание, что перезагрузка решает проблему на короткое время, но это происходило по крайней мере 3 раза в CentOS 6.4. и Debian 6, обе чистые установки.

У кого-нибудь есть понимание?

Изменить: журналы постфактум ничего не показывают (даже упомянутые сообщения).

Прошивка на HP gear всегда важна. Контроллеры Smart Array 6400 и 641/642 той эпохи (2003-2005) использовались для зависания и выполнения всевозможных фанковых вещей в определенных ситуациях. Обновите прошивку до самой последней.

На стороне Linux Драйвер блочного устройства CCISS был в ядре много лет. Обычно это стабильно. Но есть и другие соображения относительно EL6. Настройте свой планировщик ввода / вывода или используйте tuned-adm утилита. Убедитесь, что у вас есть кэш с резервным питанием от батареи на этом контроллере, если вы выполняете какие-либо операции с большим объемом записи. И запустите проверку состояния на контроллере с hpacucli ctrl all show config detail команда. Просто убедитесь, что все диски не находятся в аварийном или предаварийном состоянии.