Назад | Перейти на главную страницу

Управление циклами повторного обучения батареи на LSI и аналогичных RAID-контроллерах

Как инженеры справляются с циклами «переучивания» батареи RAID-контроллера?

Как отмечено в: Что такое «переучивание батареи» на LSI MegaRaid?, цикл повторного обучения разряжает батарею RAID-контроллера (BBWC или BBU), тем самым устраняя ускорение кэша записи. Срок службы батареи проверяется, и после зарядки кэш записи снова включается. Это оказывает очевидное влияние на производительность ввода-вывода сервера в течение цикла повторного обучения. я считать это происходит ежемесячно.

Было отмечено снижение производительности, особенно в системах баз данных:

Медленная база данных? Проверьте батарею RAID!

Вспомните о своей батарее

Мой опыт работы с серверами HP ProLiant, чьи Умный массив контроллеры не проходят это упражнение (или, по крайней мере, иметь более активный мониторинг срока службы батареи). Вроде ужасная особенность (максимальное неудобство, небольшая выгода), но я нахожусь в среде со многими контроллерами LSI (на Супермикро оборудование) и хотел бы узнать, можно ли применить общую политику к соответствующим системам.

Совсем недавно я прочитал статью одного из инженеров Godaddy на эту самую тему: Учимся справляться с обучением

На их оборудовании (карты Dell PERC) цикл обучения батарее происходит каждые 90 дней, но невозможно узнать, когда именно это произойдет, то есть в часы пик или непиковые часы.

Они говорили о разных решениях:

  • Напоследок отключите Battery Learning. Проблема с этой опцией заключается в том, что вы не будете знать состояние своей батареи, а также как долго и сколько она может удерживать заряд, поэтому в случае отключения вы можете рискнуть потерять данные.

  • Используйте другое оборудование. Некоторые контроллеры имеют 2 батареи и переключаются между ними во время таких циклов обучения. Кроме того, существуют RAID-контроллеры (например, Dell H710), которым не нужны батареи, а вместо этого используются энергонезависимые NVRAM для хранения незафиксированных данных.

  • Принудительная обратная запись (кэширование) независимо от состояния ваших батарей. Как и в первом решении, вы рискуете потерять данные.

В конечном итоге они настраивают CRON на часы непиковой нагрузки, которые отслеживают следующий цикл обучения, и если он наступит в течение следующих 24 часов, они заставляют это происходить немедленно. Таким образом, они сохраняют преимущество использования аккумуляторов, но не запускают их в часы пиковой нагрузки.