У меня были катастрофические выходные; Я запускаю сервер с некоторыми виртуализацией (KVM); каждый из них обслуживает около 100 пользователей. Нагрузка весь день на уровне 0,40-0,89, у машины 128гб ОЗУ.
Что ж: В субботу сервер был недоступен. Я сразу использовал свой IPMI-Access и не мог поверить в то, что увидел: RAID был полностью разрушен. «Живыми» оказались всего 2 винчестера, но данных на них не было.
Примерно за час до того, как мне сообщили о катастрофе, я увидел, что произошла авария. Proxmox
-Бэкап работает. Но может ли это быть причиной краха всего HDD
?
Я не совсем уверен, что мне делать, чтобы этого не допустить ...
Но могло ли это быть действительно причиной отказа всех HDD?
Это кажется маловероятным, но, возможно, стоит проверить Proxmox возможно?
Я не совсем уверен, что мне делать, чтобы этого не допустить ...
Чтобы это не повторилось, нужно понять, почему это произошло.
Для этого вам нужно использовать свой (или чей-то еще) инструментарий системного администратора, чтобы разобраться с проблемой и провести анализ первопричин.
Я нахожу старый добрый Научный метод идеальный инструмент для этого.
Вот некоторые Вопросы и ответы, которые я подготовил ранее что должно помочь.
Я полагаю, что в вашем случае чтение ваших журналов для получения соответствующей информации было бы хорошим началом.