У нас есть сервер, на котором диск raid 1 пытается перестроить или синхронизировать. Диск выполняет повторную синхронизацию, но сервер не отвечает. Невозможно установить ssh в ящик, и ни одна из служб не отвечает. Если вы находитесь в локальной сети, вы можете использовать ssh, но он очень медленный и бесполезный.
Что могло вызвать эту проблему? Мы недавно перестроили машину с новым диском, когда он вышел из строя около месяца назад. В любом случае нам нужно было увеличить размер диска, поэтому мы воспользовались возможностью. Теперь я не уверен, что это какой-то аппаратный сбой. Это диски sata, использующие программный рейд.
Обычно при выходе из строя одного диска или контроллера второй продолжает работать. Не уверен, что сейчас происходит.
Любая помощь приветствуется.
Скорость повторной синхронизации слишком высока для возможностей дискового ввода-вывода. Бегать echo 1000 >/proc/sys/dev/raid/speed_limit_max
и вы должны увидеть быстрое возвращение к отзывчивости. Как только это будет под контролем, настройте ограничение скорости до уровня, подходящего для вашего оборудования.
Возможно, ваши разделы неправильно выровнены. У меня была система с двумя дисками WD1000EARS, у которых разделы не были выровнены. У него была такая же проблема. Я переразметил диск, создав разделы с разбивкой и проверкой выравнивания. Скорость восстановления подскочила до 60-70 МБ / с, и система работала очень быстро. Нагрузка была заметно ниже, а ожидание загрузки процессора ввода-вывода было очень низким по сравнению с предыдущей ситуацией.