Назад | Перейти на главную страницу

Кто-нибудь испытывает полное зависание системы с LUKS?

Я недавно установил пару новых серверов. На этот раз я шифрую большую часть своих разделов с помощью dmcrypt + LUKS. Однако эти новые серверы выходят из строя очень часто, каждые несколько дней. Полные зависания, ядро ​​не реагирует на клавиатуру, система не пингует. Согласно графикам Мунина и верхним записям, увеличения использования ресурсов не произошло. В локальных журналах системного журнала нет соответствующих записей журнала. На нашем удаленном хосте журнала (на который новые серверы пересылают системный журнал) нет соответствующих записей. Нет соответствующих сообщений netconsole (новые серверы пересылают все сообщения ядра с помощью netconsole на хост журнала). Ядро даже ничего не печатало в TTY. Я попросил хостинговую компанию провести полный тест оборудования, но они ничего не нашли. Я подозреваю ЛУКС. Кто-нибудь еще испытывает полную блокировку с LUKS? Единственная ссылка, которую я смог найти, это http://ubuntuforums.org/showthread.php?t=2125287.

У меня были аналогичные проблемы при попытке настроить систему Arch и Debian на dmcrypt + LUKS раздел. Проблема всегда возникала при безопасном стирании раздела LUKS с помощью dd if=/dev/zero of=/dev/mapper/crypt1 команда, после перезаписи 6-7 ГБ данных. Это оказался неисправный модуль памяти, один из 4х4Гб.

Пункт 4.3 на страница часто задаваемых вопросов cryptsetup описывает, как неисправная память может вызвать серьезное повреждение при записи на зашифрованные устройства, а также связанные с этим симптомы, такие как зависание и зависания, которые заставляют меня подозревать неисправную память.

На вашем месте я бы с подозрением отнесся к тому, как эта хостинговая компания проверяет свои системы. Скажите им, чтобы они отправили вам результаты хотя бы одного цикла Memtest86 + и Memtester.

НОТЫ

Для справки я перечисляю некоторые из сообщений / обсуждений, описывающих похожие проблемы, с которыми я столкнулся при поиске подсказок и решений:

  • Этот парень наблюдательные процессы сообщили о некоторых блокировках ЦП. Хотя кажется, что его проблема не связана с шифрованием или неисправной памятью, а скорее с неисправным вентилятором процессора, именно тогда я начал подозревать проблемы с оборудованием.
  • Эти ребята похоже, имеют похожие симптомы, и последнее предложение в ветке упоминает «большой объем оперативной памяти».
  • Эта ветка (также Вот) описывает проблему мягкой блокировки в версии ядра 2.6.24, давным-давно, для которой тогда был отправлен патч. Симптомы кажутся похожими, но основная причина для меня была другой. Эта почта похоже, тоже описывают ту же проблему.