Я недавно установил пару новых серверов. На этот раз я шифрую большую часть своих разделов с помощью dmcrypt + LUKS. Однако эти новые серверы выходят из строя очень часто, каждые несколько дней. Полные зависания, ядро не реагирует на клавиатуру, система не пингует. Согласно графикам Мунина и верхним записям, увеличения использования ресурсов не произошло. В локальных журналах системного журнала нет соответствующих записей журнала. На нашем удаленном хосте журнала (на который новые серверы пересылают системный журнал) нет соответствующих записей. Нет соответствующих сообщений netconsole (новые серверы пересылают все сообщения ядра с помощью netconsole на хост журнала). Ядро даже ничего не печатало в TTY. Я попросил хостинговую компанию провести полный тест оборудования, но они ничего не нашли. Я подозреваю ЛУКС. Кто-нибудь еще испытывает полную блокировку с LUKS? Единственная ссылка, которую я смог найти, это http://ubuntuforums.org/showthread.php?t=2125287.
У меня были аналогичные проблемы при попытке настроить систему Arch и Debian на dmcrypt + LUKS раздел. Проблема всегда возникала при безопасном стирании раздела LUKS с помощью dd if=/dev/zero of=/dev/mapper/crypt1
команда, после перезаписи 6-7 ГБ данных. Это оказался неисправный модуль памяти, один из 4х4Гб.
Пункт 4.3 на страница часто задаваемых вопросов cryptsetup описывает, как неисправная память может вызвать серьезное повреждение при записи на зашифрованные устройства, а также связанные с этим симптомы, такие как зависание и зависания, которые заставляют меня подозревать неисправную память.
На вашем месте я бы с подозрением отнесся к тому, как эта хостинговая компания проверяет свои системы. Скажите им, чтобы они отправили вам результаты хотя бы одного цикла Memtest86 + и Memtester.
НОТЫ
Для справки я перечисляю некоторые из сообщений / обсуждений, описывающих похожие проблемы, с которыми я столкнулся при поиске подсказок и решений: