Я программист популярного веб-сайта, размещенного на двух веб-серверах с apache. Мы находимся в диапазоне ранга алекса ~ 1000, чтобы дать вам представление. Я не администратор сервера.
Только у одного из них (всегда одного и того же) возникла проблема, которая впервые началась на прошлой неделе: каждые 2-3 дня он выполняет сканирование до полной остановки по таймауту всех HTTP-соединений и SSH-соединений. Если вы уже используете SSH, ввод команд либо очень медленный (за 20-30 минут до их появления), либо не работает вообще.
Единственный способ временно решить обнаруженную проблему - это перезагрузить сервер.
Я заметил это на наших графиках:
Каждый пик соответствует остановке сервера, а каждое падение - перезагрузке, которую мы были вынуждены сделать.
Как я могу отладить это дальше? Есть ли способ узнать, какой процесс использует больше всего inodes? Что бы вы сделали?
Встроенные графики показывают использование в памяти inodes, а не тот, который присутствует на диске. Увеличение очень вероятно из-за того, что количество открытых дескрипторов (файлов) в этой системе тоже увеличивается. Может быть, один из ваших процессов протекающие ручкипроверьте вывод "lsof", чтобы убедиться в этом.