Есть ли какая-либо передовая практика, когда дело доходит до проверки оборудования нового сервера перед его запуском в производство?
Например, прогонять его через аппаратный тест производителя или запускать на нем memtest в течение x часов?
-Джош
Мне нравится запускать быстрые тесты memtest, но на самом деле они не создают большой нагрузки, поэтому это скорее проверка того, что все в порядке, чем выгорание системы.
Затем я устанавливаю и запускаю kcbench -a -r -n -n 50
. Это запускает компиляцию ядра в цикле (с использованием всех процессоров), что приблизительно соответствует нашей реальной нагрузке, а kcbench доступен в Fedora и EPEL, так что до него легко добраться. И в качестве бонуса я получаю простой результат теста, который дает мне представление о производительности нового оборудования.
После этого проверьте dmesg на наличие ошибок.
Фраза, которую вы ищете, - "прожечь". Обычно я использую UCBD, запускаю memtest в течение нескольких дней и выполняю расширенный тест диска для любого производителя жесткого диска. У меня не было достаточно проблем с новыми процессорами, чтобы убедить меня протестировать и их.
Для получения дополнительной информации посетите эту вики сообщества.
Лично я никогда не делал ничего подобного на производственной коробке. Если я получу коробку стоимостью в несколько тысяч долларов от HP, Sun или кого-то еще, я ожидаю, что они отправят мне рабочий модуль. Все неудачи в раннем детстве, которые у меня были, произошли в первый день или около того. Зачем тратить время на приработку, если вы можете просто определить проблему при установке ОС или настройке машины?
Опять же, все наши машины автоматически настраиваются Puppet, поэтому, если что-то умирает прямо перед запуском в производство, мы просто устанавливаем еще одну машину и снова нажимаем кнопку «Go» ...