Позвольте мне начать с объяснения, почему я хочу это сделать. Все шло нормально. Я импортировал моментальный снимок базы данных MySQL на другой сервер при подготовке к настройке репликации мастер-мастер (этот снимок станет основным в массиве после его настройки). Я включил подчиненную репликацию MySQL, и она наверстывала упущенное. У меня также была передача rsync через cygwin. Я что-то забыл, поэтому выдал STOP SLAVE
команду в MySQL. Это привело к буквально зависанию всего сервера. Нет ответа на пинг, ничего. Примерно через 15 минут в этом состоянии устройство было вручную жестко перезагружено.
У меня возникает вопрос, могу ли я доверять серверу. STOP SLAVE
это совсем не интенсивный вызов. Я не понимаю, почему это привело бы к сбою MySQL, но в одиночку всей операционной системы. Так что теперь мне интересно, не проблема ли это в оборудовании. Мы только что установили новый Ram (32 ГБ) на сервере, но они никогда не запускали memtest на нем. Поскольку у меня нет физического доступа к серверу (в другой стране), они не запустят memtest до утра понедельника. Я хочу провести как можно больше тестов за выходные.
У меня была аналогичная проблема в Linux несколько лет назад, которая была вызвана неисправной BIOS, когда при высоких нагрузках ввода-вывода коробка просто зависала. Что я сделал затем, чтобы воспроизвести это, так это то, что несколько скриптов python сгенерировали несколько больших (10 ГБ +) файлов, а затем случайным образом искали разные позиции среди этих файлов. Это привело к остановке машины в течение нескольких минут.
Это заставило меня задуматься, почему бы не сделать то же самое. Поэтому я написал программу на Python для чтения и записи в серию файлов (выполняемых в 4 процессах), чтобы, надеюсь, заполнить диски. Затем я написал еще один, чтобы просто попробовать съесть как можно больше барана (сейчас он 32 ГБ и он поднимается), при этом произвольно читая и записывая позиции в его списке. Он проворачивается уже около часа и все еще работает (подкачка тормозит, но все еще стабильно).
Итак, я пришел сюда, чтобы спросить, есть ли какие-либо пользовательские способы стресс-тестирования 2k8, которые на самом деле не зависят от приложения? Как только MySQL догонит, я напишу сценарий для случайного запроса, чтобы увеличить объем операций ввода-вывода и памяти. Но я больше хочу протестировать машину и ОС, чем приложение ... Но до этого момента я хочу наказать эту машину за остановку.
Спасибо
Для тестирования жесткого диска запустите полное сканирование поверхности от производителя диска, если хотите, несколько раз.
Для тестирования процессора и памяти существует довольно много программных пакетов. Скорее всего, вы ищете «прочные» тесты, но большинство программных тестов можно зациклить, чтобы нагружать компьютер. Я фанат SiSoft Sandra пакет, хотя я не использовал его годами.
Если вы ищете что-то более близкое к вашим скриптам Python, попробуйте IOZone
Я мог бы сказать очевидное здесь, но проверяли ли вы журналы событий на сервере, чтобы узнать, может ли это помочь определить, что именно вызвало сбой?
Я не уверен, что это мое обманчивое суеверие, поскольку у меня нет диаграммы, чтобы доказать это, но я замечаю, что в большинстве случаев я видел проблему с сервером, это была ошибка программного обеспечения / ОС.