В настоящее время я управляю некоторыми серверами для клиента, на котором работает около 40 веб-сайтов, почти половина из которых - веб-сайты WordPress. В настоящее время мы используем 4 VPS от Linode, при этом сайты распределены по 4 серверам относительно равномерно. Серверы работают под управлением последней версии CentOS и имеют около 1 ГБ оперативной памяти каждый.
Мы сталкивались с периодическими отключениями, но отключение прошлой ночью было самым странным. Веб-сайты перестали работать, поэтому я вошел в систему в Webmin, и наш веб-сервер, сервер БД, DNS-сервер и т. Д. Были отключены. Я запустил их резервную копию и вошел через SSH, чтобы обнаружить, что сервер сканирует. Запуск TOP показал, что ничто не сильно ударило по серверу, и он не выглядел как нехватка ресурсов. Глядя на графики Linode, все было в порядке, вплоть до отключения (насколько я мог видеть), затем произошло резкое падение CPU%, IO, сетевой активности и т. Д. Незадолго до этого IO диска было довольно высоким, поскольку наши ночные резервные копии делались, но это было единственное серьезное мероприятие.
Я немного не понимаю, где мне продолжать дальше. Клиент очень расстроен, и это справедливо.
Какие у вас есть предложения по устранению неполадок и решению этой проблемы?
Ваша помощь очень ценится.
Я смотрел свои журналы и обращался за помощью к Линоде.
Вы смотрели в журналах?
Возможно, память закончилась, и убийца OOM отключил их. Быстрая проверка: запустить dmesg
, должно быть легко видно в этом.
Кстати, я действительно не понимаю, зачем вам запускать 4 VPS, каждый размером 1 ГБ, вместо одного VPS с 4 ГБ RAM.