В настоящее время у нас есть несколько серверов в местах, где по разным причинам часто пропадает электричество. На всех серверах работает ESX с несколькими гостями Linux. Вставлять здесь ИБП пока непрактично, поэтому я ищу способы снизить риск повреждения файловых систем.
Первоначально я рассматривал RAID-контроллеры (не специально для резервирования дисков), но я читал, что использование таких функций, как кэширование, на самом деле может увеличить риск потери данных. Также кажется, что могут помочь контроллеры с кэш-батареями, но я не совсем уверен.
Кто-нибудь знает, действительно ли карты RAID-контроллера обеспечивают такую защиту, или есть что-нибудь еще, что мы можем сделать для снижения риска?
Контроллеры хранения могут поставляться с Кэш записи с резервным питанием от батареи и / или супер крышка (icitor) в случае SSD для защиты кэшированной записи при отключении электроэнергии.
Действительно, есть сценарии, когда они по-прежнему не защищают целостность ваших данных, хотя BBWC обеспечит лучшую защиту, чем использование кеша записи без батареи, полное отключение всех кешей записи (за счет некоторой производительности) может быть более надежным.
Но рекомендуемым инструментом по-прежнему является ИБП, поскольку даже небольшой инструмент позволит системам плавно выключиться, когда во время отключения электроэнергии батареи близки к разрядке (а также защитит оборудование от повторяющихся скачков напряжения).
Наличие одного хоста с одним RAID с включенным кешем с обратной записью, когда-нибудь наверняка станет проблемой повреждения данных.
Взгляните на программно-определяемое решение для хранения, которое обеспечивает => 2 допустимых сбоя (хранятся 2+ копии ваших данных). Наличие кластера узлов, каждый из которых имеет подключение к ИБП и общее хранилище, предоставленное поверх RAID 10/6, вероятно, уменьшит повреждение данных до нуля. Очевидно, к ИБП необходимо подключить 2 независимые силовые линии. Имея такую настройку, вы наверняка можете включить / использовать кеш.
RAID-контроллеры с BBU жестяная банка иногда снизить риск ошибок файловой системы при некорректном завершении работы. Иногда потому что вы не можете гарантировать, что ОС в ваших файловых системах не будет убита при записи какого-либо блока на ваш диск, поэтому ОС станет непригодной для использования (хотя и не обязательно файловая система). А пока я бы инвестировал в некоторые (очень маленькие) ИБП, например этот, чтобы серверы могли плавно завершить работу при отключении электроэнергии.
Изменить: Ну, @HBruijn меня опередил :)