Назад | Перейти на главную страницу

Блок SUSE зависает, возможно, из-за проблемы с разделом Reiserfs

У меня есть SUSE-бокс с 8 ГБ ОЗУ и файловой системой Reiserfs, который работает без сбоев более 4 лет без проблем, связанных с o / s и h / w. Коробка обслуживает пару (управляемых базой данных) сайтов с низким или умеренным трафиком, что требует низкого ввода-вывода, использования процессора и памяти.

На днях машина зависала 3 раза за 10 дней. Это происходило нерегулярно (например, не каждый раз в 00:00). ЦП, память и жесткий диск в значительной степени недоиспользуются, и я подтвердил, что они также недостаточно используются во время остановки, поэтому сайты не несут ответственности.

Каждый раз, когда ящик зависает, он может отвечать только на ping, но никакие другие службы не могут использоваться (ssh, www и т. Д.). Затем я перезагружаю коробку, и все возвращается в нормальное состояние (до следующей остановки).

То, что я обнаружил в /var/log/boot.msg (возможно, происходило до и во время остановки) во всех трех инцидентах, это Filesystem is NOT clean а затем Replaying journal который, кажется, делает много работы, но никогда не достигает 100%:

Reiserfs super block in block 16 on 0xfd03 of format 3.6 with standard journal
Blocks (total/free): 786432/540858 by 4096 bytes
Filesystem is NOT clean
Replaying journal: Trans replayed: mountid 39, transid 12424272, desc 7381, len 9, commit 7391, next trans offset 7374

Replaying journal: |                                        |  0.1%  1 trans
Trans replayed: mountid 39, transid 12424273, desc 7392, len 9, commit 7402, next trans offset 7385

Trans replayed: mountid 39, transid 12424274, desc 7403, len 9, commit 7413, next trans offset 7396
Trans replayed: mountid 39, transid 12424275, desc 7414, len 9, commit 7424, next trans offset 7407

Replaying journal: |                                        /  0.5%  4 trans
Trans replayed: mountid 39, transid 12424276, desc 7425, len 8, commit 7434, next trans offset 7417

Trans replayed: mountid 39, transid 12424277, desc 7435, len 9, commit 7445, next trans offset 7428
Trans replayed: mountid 39, transid 12424278, desc 7446, len 9, commit 7456, next trans offset 7439

Replaying journal: |                                        -  1.0%  7 trans

В первом случае этот показатель составил 33%, а в третьем - 58%.

Может ли остановка системы быть связана с переоборудованием?
Есть идеи, где мне посмотреть дальше?

большое спасибо

Похоже, у вас плохой жесткий диск (или другой). Если при обычном использовании на диске обнаруживается сбойный сектор ... система немедленно пытается восстановить данные и помечает диск как нечистый. Ему около 4 лет, и у него вполне могут быть проблемы с диском. На большинство дисководов для настольных ПК распространяется гарантия только на 1 или 3 года ... а на серверные накопители обычно предоставляется гарантия только на 3–5 лет. Вы также можете рассмотреть возможность запуска такой утилиты, как spinrite GRC, которая отлично справляется с поиском проблем, а также обновляет диски. (он отлично решает все проблемы с диском, не являющиеся результатом физического повреждения пластин)