За последний год у нас постоянно были случайные всплески, из-за которых apache использовал всю память и выгружал ее.
Время работы сервера
У меня есть пример последнего сбоя (5:30 - 12:00 по всемирному координированному времени).
Дамп ядра OOM
Журналы EC2
Журналы RDS
404 ошибки до сбоя
Я не хочу увеличивать ресурсы экземпляра ec2, поскольку в нормальных условиях этого достаточно для обработки трафика.
Что я могу сделать, чтобы зарегистрировать источник этих всплесков, а также предложить решение, чтобы эти всплески не приводили к падению веб-сайта?
Обновить
Я могу подтвердить, что два предыдущих сбоя произошли сразу после значительного количества запросов 404 от группы IP-адресов, принадлежащих ChinaNetCenter Ltd.
Обновление 2:
Решил проблему, уменьшив объем памяти, необходимый для обслуживания 404 страниц.
Было бы полезно взглянуть на журналы Apache во время сбоя. У вас может быть что-то столь же простое, как выполнение задания cron, которое вызывает сбой службы apache, или у вас может быть включен apache, чтобы принимать только указанное количество одновременных подключений и приток вашей базы пользователей в разное время дня, вызывая этот предел достиг.
У вас даже может быть запущена ротация журналов, которая вызывает резкий скачок ресурсов. Невозможно сказать наверняка без журнала ошибок apache, но это некоторые возможности для проверки.