Назад | Перейти на главную страницу

Что могло вызвать сбой всех жестких дисков RAID 10 одновременно?

У меня были катастрофические выходные; Я запускаю сервер с некоторыми виртуализацией (KVM); каждый из них обслуживает около 100 пользователей. Нагрузка весь день на уровне 0,40-0,89, у машины 128гб ОЗУ.

Что ж: В субботу сервер был недоступен. Я сразу использовал свой IPMI-Access и не мог поверить в то, что увидел: RAID был полностью разрушен. «Живыми» оказались всего 2 винчестера, но данных на них не было.

Примерно за час до того, как мне сообщили о катастрофе, я увидел, что произошла авария. Proxmox-Бэкап работает. Но может ли это быть причиной краха всего HDD?

Я не совсем уверен, что мне делать, чтобы этого не допустить ...

Но могло ли это быть действительно причиной отказа всех HDD?

Это кажется маловероятным, но, возможно, стоит проверить Proxmox возможно?

Я не совсем уверен, что мне делать, чтобы этого не допустить ...

Чтобы это не повторилось, нужно понять, почему это произошло.

Для этого вам нужно использовать свой (или чей-то еще) инструментарий системного администратора, чтобы разобраться с проблемой и провести анализ первопричин.

Я нахожу старый добрый Научный метод идеальный инструмент для этого.

Вот некоторые Вопросы и ответы, которые я подготовил ранее что должно помочь.

Я полагаю, что в вашем случае чтение ваших журналов для получения соответствующей информации было бы хорошим началом.