Назад | Перейти на главную страницу

Как получить уведомление по электронной почте, если один из дисков raid 1 вышел из строя?

Мне нужно знать, как я могу получить уведомление по электронной почте, если один из дисков raid 1 не работает / вылетает. У меня CentOS 6.4 64bit, программный рейд.

Я сделал ошибку, следуя этот учебник, потому что это была нижняя нота

ПРИМЕЧАНИЕ. Было обнаружено, что mdadm не будет отправлять электронную почту, если раздел DEVICE разделов не существует в файле /etc/mdadm.conf. Если эти разделы не существуют, можно создать новый файл /etc/mdadm.conf с помощью следующей команды: mdadm –detail –scan> /etc/mdadm.conf "

Я выполнил эту строку, и мой файл mdadm.conf был пуст с этим ответом от ssh: "mdadm: An option must be given to set the mode before a second device (–scan) is listed"

Я также понимаю, что мне нужно запустить его, используя эту строку ssh: mdadm –monitor –scan –daemonize но я получаю этот ответ " mdadm: An option must be given to set the mode before a second device (–scan) is listed "

это 'cat / proc / mdstat':

  Personalities : [raid1]
  md0 : active raid1 sdb1[1] sda2[0]
  117153664 blocks super 1.1 [2/2] [UU]
  bitmap: 1/1 pages [4KB], 65536KB chunk

   unused devices: <none>

и

 mdadm -D /dev/md0
/dev/md0:
    Version : 1.1
  Creation Time : Sat Aug 17 09:19:15 2013
 Raid Level : raid1
  Array Size : 117153664 (111.73 GiB 119.97 GB)
 Used Dev Size : 117153664 (111.73 GiB 119.97 GB)
  Raid Devices : 2
 Total Devices : 2
 Persistence : Superblock is persistent

 Intent Bitmap : Internal

  Update Time : Mon Sep 16 18:55:19 2013
      State : active
  Active Devices : 2
 Working Devices : 2
 Failed Devices : 0
 Spare Devices : 0

       Name : trader:0
       UUID : 0944131a:0513ca86:cb8ad6c5:3baca49f
     Events : 1751

Number   Major   Minor   RaidDevice State
   0       8        2        0      active sync   /dev/sda2
   1       8       17        1      active sync   /dev/sdb1

Файл mdadm.conf, созданный 1 минуту назад с помощью mdadm --examine --scan> /etc/mdadm.conf:

  MAILADDR mymail@gmail.com
  ARRAY /dev/md/0 metadata=1.1 UUID=0944131a:0513ca86:cb8ad6c5:3baca49f name=trader:0

Достаточно ли этого, чтобы получать уведомления по электронной почте, если один жесткий диск выходит из строя в моем случае?

Блейзер, похоже, в процессе улучшения своего вопроса (который, кстати, теперь хороший), ты нашел свой собственный ответ. Молодец ты! Но есть еще кое-что, что можно было бы сказать с пользой.

Насколько я знаю, это mdadm.conf достаточно, чтобы получать автоматические уведомления. Конечно, мой выглядит немного иначе, и из недавнего теста на отказ я знаю, что получаю уведомления. (Мне немного интересно узнать о втором слэше в /dev/md/0, но если это то, что написала ваша система, очень вероятно, что это правильно.)

Но для профессионального системного администратора аксиомой является то, что, если вы что-то не протестировали, вы не можете точно знать, что это работает.

По крайней мере, вы захотите проверить, можете ли вы отправлять почту из этой системы как root на указанный адрес gmail.com и получать ее.

На вашем месте я бы, по крайней мере, провёл бы тест на мягкий отказ. Вы можете сделать это с помощью mdadm /dev/md0 -f /dev/sdb1. Это приведет к сбою второго раздела из массива и должно сгенерировать вам формальное уведомление (проверьте журналы электронной почты вашей системы, чтобы увидеть, исчез ли он). Проверьте вывод cat /proc/mdstat так что вы знаете, как выглядит полусложненный массив.

Вы можете повторно синхронизировать массив позже с помощью mdadm /dev/md0 -a /dev/sdb1, и убедитесь, что он синхронизирован с другим cat /proc/mdstat.

Если вы хотите полностью посвятить себя делу, запланируйте время простоя, попробуйте вытащить один из дисков и убедитесь, что система все еще может загружаться. Если метаустройство, о котором идет речь, является загрузочным разделом, люди иногда забывают включить загрузочный блок GRUB. обе диски, поэтому при выходе из строя второго их система перестает загружаться. Замените и повторно синхронизируйте диск позже.

Какие бы тесты вы ни решили провести, задокументируйте их, чтобы в случае реального сбоя вы знали, чего ожидать, и минимизировать вероятность того, что пилотная ошибка приведет к повреждению второго диска.

Нет, этого мало. Короче говоря, вам нужно установить nullmailer или другое почтовое программное обеспечение и настроить его.

Я боролся с этой самой настройкой, и, наконец, заставил ее работать. Вот мой пост об этом: nullmailer - Диагностический код: SMTP; 550 5.1.0 <root@external_email_server.com> отправитель отклонен (497)

nullmailer следует отправить электронное письмо с предупреждением на адрес alert_recipient@example.com с помощью внешнего почтового сервера в smtp.external_email_server.com.

Моя учетная запись smpt у внешнего почтового провайдера me@my_domain_hosted_by_provider.com

НАСТРОИТЬ

nullmailer

/ etc / mailname со значением:

external_email_server.com

/ etc / nullmailer / defaulthost также установлен на

external_email_server.com

/ и т.д. / nullmailer / adminaddr

me@my_domain_hosted_by_provider.com

/ и т.д. / nullmailer / allmailfrom

me@my_domain_hosted_by_provider.com

конфигурация mdadm

Я последовал за эти инструкции.

/etc/mdadm/mdadm.conf

...
# automatically tag new arrays as belonging to the local system 
HOMEHOST <system>

# instruct the monitoring daemon where to send mail alerts
#   is defined in /etc/aliases so no need to use MAILADDR
MAILADDR alertrecipient@examplesomewhereelse.com
MAILFROM me@my_domain_hosted_by_provider.com
...

/ etc / aliases

root: alertrecipient@examplesomewhereelse.com
postmaster: alertrecipient@examplesomewhereelse.com
default: alertrecipient@examplesomewhereelse.com