Назад | Перейти на главную страницу

Сервер Ubuntu зависает и не может найти причину

У меня есть VPS-сервер Ubuntu 12.04 512 МБ, работающий на Linode. У меня он настроен для обслуживания около 6 веб-сайтов на Wordpress.

Вот уже несколько недель он разбивается ежедневно, по 2-3 раза. Linode автоматически перезагружает компьютер, но если я отключу это, я либо вообще не могу подключиться по SSH, либо если я это сделаю, сервер будет реагировать очень медленно.

Буквально вчера вечером я переключил все с Apache на nginx, но это не помогло.

Глядя на файлы журналов, я обнаружил, что последняя запись почти всегда

Mar 28 06:05:01 cappicola CRON[10852]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)

Хотя иногда до перезагрузки остается несколько минут. Иногда я также нахожу

Mar 28 06:09:01 cappicola CRON[10860]: (root) CMD (  [ -x /usr/lib/php5/maxlifetime ] && [ -d /var/lib/php5 ] && find /var/lib/php5/ -depth -mindepth 1 -maxdepth 1 -type f -cmin +$(/usr/lib/php5/maxlifetime) ! -execdir fuser -s {} 2>/dev/null \; -delete)

Единственные другие записи в файле журнала - это предупреждения, связанные с postfix и fail2ban. Любые идеи?

Вторая строка журнала вызвана вашей активностью cron, которая ищет незанятые php-сессии и уничтожает их. Чтобы решить эту проблему, отредактируйте /usr/lib/php5/maxlifetime файл, как указано здесь (https://stackoverflow.com/questions/3865303/debian-based-systems-session-killed-at-30-minutes-in-special-cron-how-to-overri).

Если это не поможет, вам следует попытаться получить больше статистики о работе вашей системы перед перезагрузкой. Чтобы справиться с этим, посмотрите ответ здесь (http://www.unix.com/linux/110432-system-getting-crashed.html).

Скорее всего, fail2ban замораживает машину.

Попробуйте вообще отключить все rules / fail2ban и проверьте реакцию. Я предполагаю, что это как-то связано с тем, что Python сходит с ума при работе в качестве сервера. Также обратите внимание, что подход к чтению файлов журналов может быть деградацией, если файлы журналов становятся очень большими и система должна загружать файлы в память, чтобы найти определенные совпадения.

Также: проверьте файловые системы: [sudo] shutdown -Fr now

Есть ли у вас мониторинг, как Zabbix? Будет полезно войти в статистику. Вы также можете использовать sar (1). Как насчет средней нагрузки?