CentOS 5.10 / VMWare ESX 5.1
У меня есть старый почтовый сервер под управлением CentOS 5.10 (с SendMail), и он периодически зависает, когда система полностью перестает отвечать на запросы. В это время я вообще не могу подключиться к нему, а виртуальная консоль не отвечает.
Странно то, что наша группа администраторов VMWare не видит явных всплесков ресурсов, которые свидетельствовали бы о недостаточных ресурсах, скачках нагрузки и т. Д. Кроме того, когда я просматриваю системные журналы (например, журнал почты, сообщения и т. Д.), Обнаруживается заметное отсутствие во ВСЕХ действиях журнала во время зависания, что свидетельствует о том, что эти сбои достаточно серьезны, чтобы предотвратить ведение журнала (или, возможно, есть проблема с файловой системой / диском).
Единственная ненормальность заключается в том, что логирование sendmail на ящике было довольно высоким (98 вместо обычного уровня 9). Я скоро верну его к норме.
Я не понимаю, где можно найти дополнительную информацию здесь. Есть ли дамп потока, который бы сказал мне, над чем работала ОС во время зависания?
2.6.18-371.4.1.el5 #1 SMP Thu Jan 30 06:09:24 EST 2014 i686 i686 i386 GNU/Linux
Итак, 32-битная CentOS 5.10 ... Это не обязательно проблема ...
Но ты всегда должен иметь установленные инструменты VMware при работе с операционной системой, поддерживаемой VMware. Это может быть чрезвычайно полезно, когда память хоста vSphere / ESXi ограничена, плюс он добавляет драйвер всплывающего окна памяти, улучшенные параметры интерфейса NIC (для вашей системы EL5) и управление питанием.
В общем, посмотрите, что делает SAN в момент возникновения этих проблем. Кроме того, если вы не используете инструменты VMware, велика вероятность, что ESXi не на стабильный уровень ревизии. Сообщите, пожалуйста, номер сборки ESXi. Вы увидите его в верхней части клиента vSphere при подключении к хосту.
Редактировать:
Поскольку это кластер vSphere, не могли бы вы попросить команду проверить распределение памяти. Я видел, как виртуальные машины Linux зависают или зависают из-за неправильной конфигурации памяти. Это может включать в себя установку ограничения ОЗУ в клиенте vSphere для рассматриваемой виртуальной машины. Это также может включать ситуации, когда ваш кластер слишком загружен ОЗУ и / или когда виртуальным машинам было выделено слишком много ОЗУ.
Любой более глубокий анализ потребует просмотра некоторых экранов состояния кластера / ресурса VMware.
Я просто хотел замкнуть петлю на этом. Загадочные зависания перестали происходить после того, как мы уменьшили ведение журнала SendMail с 99 до 9 (по умолчанию). По общему признанию, это была действительно высокая настройка уровня журнала, но я никогда не видел, чтобы это полностью приводило к остановке сервера. Также не знаю, как долго это было настроено таким образом.
Я предполагаю, что прерывистый характер этого происходил из-за комбинации посредственной скорости дискового ввода-вывода и случайных всплесков нагрузки SMTP.
Спасибо всем за вашу помощь.