Назад | Перейти на главную страницу

Измерение износа SSD за контроллером LSI MegaRAID?

Я пытаюсь выяснить, как измерить общее количество записанных байтов (или процент от ожидаемого максимума, это нормально) для нескольких RAID-массивов за контроллерами LSI. Все контроллеры - это контроллеры LSI MegaRAID SAS 9271-8i. Я пробовал использовать MegaRAID Storage Manager и MegaCLI, но ни один из них не показывает нужную мне информацию. Я нашел пару решений в Интернете, но они, похоже, предназначены только для Linux, где вы можете исправить ядро ​​или использовать smartctl нетрадиционными способами. У меня это не сработает в Windows.

Я действительно хотел бы избежать вытаскивания дисков, их установки на другой компьютер, тестирования с помощью SMART, а затем их установки обратно. Была бы настоящая боль в шее. Если это важно, каждый контроллер имеет две группы виртуальных дисков по 4 диска в каждой в RAID10 с твердотельными накопителями SAS, образующими группы.

Я бы не стал смотреть на износ SSD за аппаратным RAID-контроллером. Вы используете RAID не просто так, поэтому позвольте контроллеру справиться с этим.

Это бонус, который вы используете с корпоративными дисками SAS. Если SSD хорошо сочетается с рабочей нагрузкой (с интенсивной записью / оптимизацией для чтения / и т. д.), не нужно копаться глубже.

В этом случае ваш контроллер LSI 9271 имеет свои SSD Guard ™ технология (запускаемая по данным S.M.A.R.T., которые вы ищете), которая может использовать SSD с горячим резервом, если вас беспокоит быстрый износ или преждевременный отказ.

Я использую megacli и smartctl в Ubuntu Linux.

Сначала получите Идентификатор устройства одного из SSD-накопителей:

megacli -pdlist -aALL -NoLog | egrep '(Raw Size|Inquiry Data|Device Id)'

Например, идентификатор устройства 5. Затем вы выполняете:

smartctl -x -d megaraid,5  /dev/sda

Здесь показан обширный отчет S.M.A.R.T для SSD-накопителя, подключенного к контроллеру Broadcom / Avago / LSI MegaRAID.

В CentOS я, конечно, отслеживаю твердотельные накопители с помощью smartctl, для чтения в основном случайных архивов я использую стек Dell 12, 13 и 14 с другими, не относящимися к Dell Samsung EVO 840, 850 и 860. Не выбирайте Samsung PRO, хотя они более дорогие, они меняются случайным образом. довольно много людей, о которых сообщают на форумах Dell, и разрушают весь том. EVO просуществовал у нас 3 года, и даже RAID 5 уцелел. ~ 3 внезапно умерли из-за роста партии ~ 66 дисков.

В CentOS каждые x часов я запускаю цикл от 0 до 23 для PERC RAID на базе Dell R720 / 730 / 740xd LSI через скрипт Python и SSH и сравниваю отклонение важных значений с помощью команды, как показано ниже + пользовательский анализатор этого вывода и БД для хранения даты + значение для отслеживания отклонений:

smartctl -a -d sat+megaraid,0 /dev/sda

Я считаю важным следить за тем, приближаюсь ли я к гарантированным Samsung терабайтам, записанным через "241 Total_LBAs_Written", как если бы пользователи злоупотребляли лимитом записи, все они могут внезапно умирать, и RAID не поможет, а также перераспределение, которое может Подскажите, что вам скоро понадобится запасной.