Назад | Перейти на главную страницу

Обнаружение неисправного диска в массиве RAID 10

Мне сказали, что я могу только проверить, что мой HW RAID-массив идеально работает с KVM. Однако я хочу получать автоматическое уведомление, когда на моем сервере возникает проблема.

Есть ли способ через SSH (который будет вызываться через system () в php), который может обнаружить проблемы с диском? Мне не нужно определять, на каком именно диске.

Я придумал одну теорию, но не знаю, будет ли она работать на практике. Если бы мне пришлось запустить PHP-скрипт для fopen ('/ dev / [filesystem]', 'r') и искать каждый xGB для 1 байта, и он ищет позицию файловой системы, в которой возникли проблемы, он должен вернуть ошибку. Прав ли я, думая об этой идее?

Я использую файловую систему XFS, слышал о xfs_check, но в нем говорится, что ее нужно запускать в режиме только для чтения, что неудобно.

Я использую 3ware RAID-контроллер.

Установите инструменты 3Ware (tw_cli) на вашей машине.

После того, как вы их установили, получите id # контроллера (я никогда не разбирался в системе, стоящей за ним, насколько я знаю, это может быть случайным образом):

$ tw_cli show

Ctl   Model        (V)Ports  Drives   Units   NotOpt  RRate   VRate  BBU
------------------------------------------------------------------------
c0    9550SXU-4LP  4         2        1       0       1       1      -

Затем вы можете запросить статус массива с помощью

$ tw_cli /c0 show

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy
------------------------------------------------------------------------------
u0    RAID-1    OK             -       -       -       74.4951   ON     OFF

Port   Status           Unit   Size        Blocks        Serial
---------------------------------------------------------------
p0     NOT-PRESENT      -      -           -             -
p1     NOT-PRESENT      -      -           -             -
p2     OK               u0     74.53 GB    156301488     9QZ07NP2
p3     OK               u0     74.53 GB    156301488     9QZ08DS2

Очевидно, на вашем компьютере это будет выглядеть иначе. Этот пример взят из Вот.

Для активной проверки (очистки) ваших дисков используйте

$ tw_cli /c0/u0 start verify

Для автоматических уведомлений следует настроить систему мониторинга, например Nagios или Icinga и используйте плагин, который проверяет работоспособность массива с помощью tw_cli. Эти плагины прекрасно работают без Nagios / Icinga и могут быть легко использованы в минимальной системе мониторинга в виде задания cron, которое отправляет письмо о том, что плагин не возвращает 0.