Назад | Перейти на главную страницу

Мониторинг состояния RAID через терминал (CentOS 5)

В настоящее время я запускаю CentOS 5 и ищу команду терминала, которая может позволить мне отслеживать состояние настройки RAID (то есть, если диск не работает) без необходимости заходить в ядро. В конце концов, это живой веб-сервер.

Обновление: спецификации - это dell sc1435 с контроллером SAS 5i / R.

Если вы используете программный RAID с обычным контроллером дисков, используйте:

mdadm --detail <dev>

где например / dev / md0. Это покажет вам текущий статус. Если диск выходит из строя, вы также увидите много неприятностей в / var / log / messages.

это зависит от рейда. для lsi [он есть на многих серверах dell и hp] вы используете инструмент под названием MegaCLI.

для карт 3ware - tw_cli

обычно он поставляется с «драйверами» или документацией для вашего оборудования.

Если это программный рейд (mdadm), и вы хотите посмотреть текущий статус, вы можете просто выполнить cat / proc / mdstat. Если вы хотите, чтобы экран обновлялся каждые 10 секунд, вы можете сделать смотреть -n 10 cat / proc / mdstat.

Dell наверное предоставить инструмент для его мониторинга, но я могу предположить, что он будет раздутым и будет реализован на Java, как и большинство унылых OEM-утилит.

К счастью, оказалось, что SC1435 поддерживается замечательным mpt-статус утилита. Просто убедитесь, что в вашем ядре включены следующие параметры:

CONFIG_FUSION=y
CONFIG_FUSION_SAS=y
CONFIG_FUSION_MAX_SGE=128
CONFIG_FUSION_CTL=y

Затем вы можете использовать mpt-status из интерфейса командной строки, чтобы просмотреть состояние вашего RAID-массива.

Лично я использую простой скрипт Python, вызываемый из cron, который периодически проверяет статус и отправляет нам оповещения по электронной почте. Подобно тому, как ведет себя mdadm. Вы, конечно, можете указать, как часто вы хотите проверять. Не стесняйтесь использовать его сами:

#!/usr/bin/env python

# Copyright (c) 2009 Dan Carley <dan.carley@gmail.com>
#
# Permission to use, copy, modify, and distribute this software for any
# purpose with or without fee is hereby granted, provided that the above
# copyright notice and this permission notice appear in all copies.
#
# THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
# WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
# MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
# ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
# WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
# ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
# OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.

"""
Report failures from hardware RAID controllers.

Requires the supporting utilities:
    mpt-status(8)   for MPT controllers.
    tw_cli(8)       for 3ware controllers.

Intended to be scheduled from crontab as follows:
    MAILTO="alert@your.domain"
    0   */3 *   *   *   /usr/local/sbin/hwraid_monitor.py options
"""

from re import search
from sys import exit
from os.path import isfile
from optparse import OptionParser
from subprocess import Popen, PIPE

def check_controller(type):
    ret = True

    if type == 'mpt':
        cmd = [ '/usr/sbin/mpt-status', '-s' ]
        array = {'regex': '^log_id$',
                 'pos': 2,
                 'string': 'OPTIMAL'}
        drive = {'regex': '^phys_id$',
                 'pos': 2,
                 'string': 'ONLINE'}
    elif type == 'tw':
        cmd = [ '/sbin/tw_cli', 'info' ]
        contr = {'regex': '^c\d+$'}
        array = {'regex': '^u\d+$',
                 'pos': 2,
                 'string': 'OK'}
        drive = {'regex': '^p\d+$',
                 'pos': 1,
                 'string': 'OK'}

    if not isfile(cmd[0]):
        print "%s: Utility not found" % cmd[0]
        return False

    if type == 'tw':
        controllers = []
        p = Popen(cmd, stdout=PIPE)
        o, e = p.communicate()
        if e:
            print e
        for c in o.split('\n'):
            c = c.split()
            if len(c) > 2 and search(contr['regex'], c[0]):
                controllers.append(c[0])
    elif type == 'mpt':
        controllers = ['']

    for c in controllers:
        p = Popen(cmd + [c], stdout=PIPE)
        o, e = p.communicate()
        if e:
            print e.split('\n')
        for v in o.split('\n'):
            v = v.split()
            if len(v) > 2:
                # Array check.
                if search(array['regex'], v[0]) and v[array['pos']] != array['string']:
                    print "Array failure: \n\t%s" % '\t'.join(v)
                    ret = False
                # Drive check.
                if search(drive['regex'], v[0]) and v[drive['pos']] != drive['string']:
                    print "Drive failure: \n\t%s" % '\t'.join(v)
                    ret = False

    return ret

def main():
    usage = "usage: %prog options"
    parser = OptionParser(usage=usage)
    parser.add_option("--mpt", action="store_true", default=False,
                      dest="mpt", help="MPT controller support.")
    parser.add_option("--tw", action="store_true", default=False,
                      dest="tw", help="3ware controller support.")
    (options, args) = parser.parse_args()

    if not options.mpt and not options.tw:
        parser.print_help()
        exit(2)

    fail = False

    if options.mpt:
        if not check_controller('mpt'):
            fail = True

    if options.tw:
        if not check_controller('tw'):
            fail = True

    if fail:
        exit(1)

if __name__ == "__main__":
    main()

mdadm предлагает подробную информацию о каждом аспекте программного рейда Linux.

смотреть -n 10 cat / proc / mdstat это будет настроено в вашей системе