Назад | Перейти на главную страницу

Что может привести к «зависанию» всего сервера Red Hat?

У нас есть два сервера Red Hat, которые регулярно «зависают». Системы перестают отвечать на запросы в течение 20–30 секунд, а затем возвращаются в «нормальное состояние». Системы не виртуализированы и работают на собственном выделенном оборудовании.

Когда я говорю, что система перестает отвечать, я знаю это, потому что в системе запускается сценарий, который каждые 5 секунд (1) выводит текущее время, (2) выполняет wget для веб-сайта в системе, (3 ) снова выводит время окончания и (4) спит на 5 секунд. Из журнала мы видим, что «сон в течение 5 секунд» иногда занимает 20-30 секунд, и наш мониторинг Nagios подтверждает, что система не может быть достигнута в течение того же периода времени.

По сути, это чистая установка Red Hat 6.5 под управлением Tomcat6. Кроме того, монтируется общий ресурс NFS к хранилищу GlusterFS. На этом диске немного активности. Кроме того, веб-приложения Tomcat6 несколько потребляют много памяти, требуя от 7 до 15 ГБ ОЗУ.

Мы пытались выяснить, что вызывает это уже пару недель, и мы вроде подошли к точке, где у нас заканчиваются идеи. Приложения Tomcat были тщательно изучены, мы пробовали всевозможные варианты монтирования NFS, мы экспериментировали с SELinux, и этот список можно продолжить. Однако проблема не устранена.

Есть ли у кого-нибудь идеи о том, что может привести к зависанию всей системы?

Система зависла >> Может быть причина; Использование ресурсов, таких как RAM, CPU, HDD и т. Д. + Некоторое условие, которое к этому приводит.

  1. Собирайте данные о максимальной производительности и временные интервалы возникновения проблем. используйте Nagios и SAR и т. д. - для этого, если время такое же, создайте сценарий оболочки для захвата запущенного процесса и всего использования ресурсов процесса, это поможет вам идентифицировать процесс удара.

Возможности: - Проблема с NFS - Попробуйте использовать вариант мягкого монтирования вместо Hardmount.