У нас есть два сервера Red Hat, которые регулярно «зависают». Системы перестают отвечать на запросы в течение 20–30 секунд, а затем возвращаются в «нормальное состояние». Системы не виртуализированы и работают на собственном выделенном оборудовании.
Когда я говорю, что система перестает отвечать, я знаю это, потому что в системе запускается сценарий, который каждые 5 секунд (1) выводит текущее время, (2) выполняет wget для веб-сайта в системе, (3 ) снова выводит время окончания и (4) спит на 5 секунд. Из журнала мы видим, что «сон в течение 5 секунд» иногда занимает 20-30 секунд, и наш мониторинг Nagios подтверждает, что система не может быть достигнута в течение того же периода времени.
По сути, это чистая установка Red Hat 6.5 под управлением Tomcat6. Кроме того, монтируется общий ресурс NFS к хранилищу GlusterFS. На этом диске немного активности. Кроме того, веб-приложения Tomcat6 несколько потребляют много памяти, требуя от 7 до 15 ГБ ОЗУ.
Мы пытались выяснить, что вызывает это уже пару недель, и мы вроде подошли к точке, где у нас заканчиваются идеи. Приложения Tomcat были тщательно изучены, мы пробовали всевозможные варианты монтирования NFS, мы экспериментировали с SELinux, и этот список можно продолжить. Однако проблема не устранена.
Есть ли у кого-нибудь идеи о том, что может привести к зависанию всей системы?
Система зависла >> Может быть причина; Использование ресурсов, таких как RAM, CPU, HDD и т. Д. + Некоторое условие, которое к этому приводит.
Возможности: - Проблема с NFS - Попробуйте использовать вариант мягкого монтирования вместо Hardmount.