В настоящее время я запускаю CentOS 5 и ищу команду терминала, которая может позволить мне отслеживать состояние настройки RAID (то есть, если диск не работает) без необходимости заходить в ядро. В конце концов, это живой веб-сервер.
Обновление: спецификации - это dell sc1435 с контроллером SAS 5i / R.
Если вы используете программный RAID с обычным контроллером дисков, используйте:
mdadm --detail <dev>
где например / dev / md0. Это покажет вам текущий статус. Если диск выходит из строя, вы также увидите много неприятностей в / var / log / messages.
это зависит от рейда. для lsi [он есть на многих серверах dell и hp] вы используете инструмент под названием MegaCLI.
для карт 3ware - tw_cli
обычно он поставляется с «драйверами» или документацией для вашего оборудования.
Если это программный рейд (mdadm), и вы хотите посмотреть текущий статус, вы можете просто выполнить cat / proc / mdstat. Если вы хотите, чтобы экран обновлялся каждые 10 секунд, вы можете сделать смотреть -n 10 cat / proc / mdstat.
Dell наверное предоставить инструмент для его мониторинга, но я могу предположить, что он будет раздутым и будет реализован на Java, как и большинство унылых OEM-утилит.
К счастью, оказалось, что SC1435 поддерживается замечательным mpt-статус утилита. Просто убедитесь, что в вашем ядре включены следующие параметры:
CONFIG_FUSION=y
CONFIG_FUSION_SAS=y
CONFIG_FUSION_MAX_SGE=128
CONFIG_FUSION_CTL=y
Затем вы можете использовать mpt-status из интерфейса командной строки, чтобы просмотреть состояние вашего RAID-массива.
Лично я использую простой скрипт Python, вызываемый из cron, который периодически проверяет статус и отправляет нам оповещения по электронной почте. Подобно тому, как ведет себя mdadm. Вы, конечно, можете указать, как часто вы хотите проверять. Не стесняйтесь использовать его сами:
#!/usr/bin/env python
# Copyright (c) 2009 Dan Carley <dan.carley@gmail.com>
#
# Permission to use, copy, modify, and distribute this software for any
# purpose with or without fee is hereby granted, provided that the above
# copyright notice and this permission notice appear in all copies.
#
# THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
# WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
# MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
# ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
# WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
# ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
# OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
"""
Report failures from hardware RAID controllers.
Requires the supporting utilities:
mpt-status(8) for MPT controllers.
tw_cli(8) for 3ware controllers.
Intended to be scheduled from crontab as follows:
MAILTO="alert@your.domain"
0 */3 * * * /usr/local/sbin/hwraid_monitor.py options
"""
from re import search
from sys import exit
from os.path import isfile
from optparse import OptionParser
from subprocess import Popen, PIPE
def check_controller(type):
ret = True
if type == 'mpt':
cmd = [ '/usr/sbin/mpt-status', '-s' ]
array = {'regex': '^log_id$',
'pos': 2,
'string': 'OPTIMAL'}
drive = {'regex': '^phys_id$',
'pos': 2,
'string': 'ONLINE'}
elif type == 'tw':
cmd = [ '/sbin/tw_cli', 'info' ]
contr = {'regex': '^c\d+$'}
array = {'regex': '^u\d+$',
'pos': 2,
'string': 'OK'}
drive = {'regex': '^p\d+$',
'pos': 1,
'string': 'OK'}
if not isfile(cmd[0]):
print "%s: Utility not found" % cmd[0]
return False
if type == 'tw':
controllers = []
p = Popen(cmd, stdout=PIPE)
o, e = p.communicate()
if e:
print e
for c in o.split('\n'):
c = c.split()
if len(c) > 2 and search(contr['regex'], c[0]):
controllers.append(c[0])
elif type == 'mpt':
controllers = ['']
for c in controllers:
p = Popen(cmd + [c], stdout=PIPE)
o, e = p.communicate()
if e:
print e.split('\n')
for v in o.split('\n'):
v = v.split()
if len(v) > 2:
# Array check.
if search(array['regex'], v[0]) and v[array['pos']] != array['string']:
print "Array failure: \n\t%s" % '\t'.join(v)
ret = False
# Drive check.
if search(drive['regex'], v[0]) and v[drive['pos']] != drive['string']:
print "Drive failure: \n\t%s" % '\t'.join(v)
ret = False
return ret
def main():
usage = "usage: %prog options"
parser = OptionParser(usage=usage)
parser.add_option("--mpt", action="store_true", default=False,
dest="mpt", help="MPT controller support.")
parser.add_option("--tw", action="store_true", default=False,
dest="tw", help="3ware controller support.")
(options, args) = parser.parse_args()
if not options.mpt and not options.tw:
parser.print_help()
exit(2)
fail = False
if options.mpt:
if not check_controller('mpt'):
fail = True
if options.tw:
if not check_controller('tw'):
fail = True
if fail:
exit(1)
if __name__ == "__main__":
main()
mdadm предлагает подробную информацию о каждом аспекте программного рейда Linux.
смотреть -n 10 cat / proc / mdstat это будет настроено в вашей системе