Как инженеры справляются с циклами «переучивания» батареи RAID-контроллера?
Как отмечено в: Что такое «переучивание батареи» на LSI MegaRaid?, цикл повторного обучения разряжает батарею RAID-контроллера (BBWC или BBU), тем самым устраняя ускорение кэша записи. Срок службы батареи проверяется, и после зарядки кэш записи снова включается. Это оказывает очевидное влияние на производительность ввода-вывода сервера в течение цикла повторного обучения. я считать это происходит ежемесячно.
Было отмечено снижение производительности, особенно в системах баз данных:
Медленная база данных? Проверьте батарею RAID!
Мой опыт работы с серверами HP ProLiant, чьи Умный массив контроллеры не проходят это упражнение (или, по крайней мере, иметь более активный мониторинг срока службы батареи). Вроде ужасная особенность (максимальное неудобство, небольшая выгода), но я нахожусь в среде со многими контроллерами LSI (на Супермикро оборудование) и хотел бы узнать, можно ли применить общую политику к соответствующим системам.
Совсем недавно я прочитал статью одного из инженеров Godaddy на эту самую тему: Учимся справляться с обучением
На их оборудовании (карты Dell PERC) цикл обучения батарее происходит каждые 90 дней, но невозможно узнать, когда именно это произойдет, то есть в часы пик или непиковые часы.
Они говорили о разных решениях:
Напоследок отключите Battery Learning. Проблема с этой опцией заключается в том, что вы не будете знать состояние своей батареи, а также как долго и сколько она может удерживать заряд, поэтому в случае отключения вы можете рискнуть потерять данные.
Используйте другое оборудование. Некоторые контроллеры имеют 2 батареи и переключаются между ними во время таких циклов обучения. Кроме того, существуют RAID-контроллеры (например, Dell H710), которым не нужны батареи, а вместо этого используются энергонезависимые NVRAM для хранения незафиксированных данных.
Принудительная обратная запись (кэширование) независимо от состояния ваших батарей. Как и в первом решении, вы рискуете потерять данные.
В конечном итоге они настраивают CRON на часы непиковой нагрузки, которые отслеживают следующий цикл обучения, и если он наступит в течение следующих 24 часов, они заставляют это происходить немедленно. Таким образом, они сохраняют преимущество использования аккумуляторов, но не запускают их в часы пиковой нагрузки.