Один из наших серверов с особыми настройками очень чувствителен к неизвестным событиям.
Оборудование:
Конфигурация:
Нагрузка:
Проблема:
Но иногда, например, когда у нас есть задание резервного копирования, включая mysqldump, у нас возникает проблема, когда один за другим виртуальные хосты сигнализируют «достигнуто max_children» и перестают отвечать. Конечно, мы выполняем резервное копирование при небольшом трафике, и мы бы согласились на кратковременное «отсутствие ответа», но этот тупик или блокада никогда не заканчиваются сами по себе. Все в порядке после перезапуска php-fpm вручную.
Нормальное поведение этой системы даже в условиях интенсивного движения является безупречным и молниеносным. Большинство ядер находятся в идеальном состоянии, а другие параметры, которые я знаю, в порядке.
Конечно, никаких записей в лог-файле подсказок нет ни в журнале сообщений (кроме «max_children loaded»), ни в каких-либо журналах apache / vhosts. И да, использование памяти и количество открытых процессов быстро увеличиваются.
У кого-нибудь была настройка, подобная нашей (я знаю, что внутри этого монстра есть много особенных вещей), и были ли такие же или похожие проблемы и отличная идея, как отладить эти проблемы?