Назад | Перейти на главную страницу

Как лучше всего отслеживать / регистрировать проблемы на eth0?

Я вручную настроил почтовый сервер - очень простая конфигурация, и я не делал никаких сложных сетей. Я просто открыл только соответствующие порты через iptables.

Однако каждые 10-15 дней eth0 просто исчезает, и вся работа в сети прекращается. Журналы по умолчанию не дают мне никаких указаний на то, что происходит. Когда это происходит, единственное, что я делаю, чтобы исправить это (и, кажется, единственный способ исправить это), - это перезагружать сервер через KVM-доступ.

Вопрос в том, какие инструменты мониторинга / ведения журнала я могу установить, чтобы увидеть, что идет не так? Я хочу сделать все возможное, прежде чем сообщать о проблеме с оборудованием хостинговой компании.

Я использую сервер CentOS 6.

На всякий случай я наконец обнаружил, в чем проблема.

Фактически это было связано с ядром CentOS из-за того, что регистр управления timesync tx не установлен должным образом.

Ссылки: https://groups.google.com/forum/#!topic/springdale-users/bBqrE545sYo http://bugs.centos.org/view.php?id=6810

В конце концов, эта проблема решилась сама собой после того, как я перешел на новый сервер.

Если его нет в / var / log / messages или dmesg из ядра, тогда я не уверен, какая утилита предоставит вам информацию, чтобы понять это. Я бы попытался настроить ведение журнала на отладку в /etc/rsyslog.conf, найти строку с / var / log / messages и изменить информацию для отладки.

По моему опыту, исчезновение eth0 в CentOS связано с NetworkManager. Убедитесь, что вы отключили Networkmanager, а затем включили сеть. Я видел это, когда вручную настраивал сеть, создавая / изменяя /etc/sysconfig/network-scripts/ifcfg-eth0 но забыл chkconfig networkmanager off затем chkconfig network on.

Лучше всего, вероятно, устранить неполадки в режиме реального времени через KVM, когда это произойдет в следующий раз. Еще одна вещь, которую я могу попробовать, - это цикл, который запускает что-то вроде ethtool чтобы получать статус связи каждые 30-60 секунд, чтобы получить временные рамки, когда произойдет сбой. Чтение журналов намного проще, если у вас есть временная метка или действительно небольшой таймфрейм, на котором нужно сосредоточиться. :)

Наконец, если что-то действительно происходит с /etc/sysconfig/network-scripts/ifcfg-eth0 затем вы можете создать и проверить политику, чтобы отслеживать изменения в этом файле.