Назад | Перейти на главную страницу

Должен ли я быть обеспокоен частыми предупреждающими сообщениями RAID (неожиданный смысл - команда прервана)?

У меня есть хост Fujitsu (PRIMERGY RX300 S6) под управлением Windows Server 2008 R2 и Hyper-V (версия 6.1) с двумя виртуальными серверами (один Windows Server 2008 R2 и один Windows Server 2012). Наши 25 сотрудников постоянно подключены к виртуальным серверам в течение рабочего дня и читают и записывают файлы в общие папки.

Контроллер хранилища на хосте - это RAID Ctrl SAS 6G 5/6 512 МБ (D2616) от LSI Corp.

Недавно я обнаружил, что диспетчер Raid очень часто отображает предупреждающие сообщения. Почти один раз в минуту, а иногда до 15 или 20 в минуту.

Каждое предупреждающее сообщение выглядит следующим образом:

-------
Event: Warning
Date: Mar 18, 2015, 1:04:49 PM
Source: TOSHIBA MBF2600RC (1:0)
ID: 10909
Event: Adapter FTS RAID Ctrl SAS 6G 5/6 512MB (D2616) (0): Unexpected sense: 
     Disk (1:0), CDB:28 00 1B 02 B5 80 00 00 80 00, Sense:(command aborted)72 0B 4B 04 00 00 00 20 80 1E 00 28 52 08 01 00 50 03 00 57 00 F3 3F 40 50 06 05 B0 00 02 72 BF 00 01 0C 00 00 00 00 00 
------

К сожалению, мне не удалось узнать, когда начало появляться это предупреждающее сообщение.

Причина, по которой меня несколько беспокоят эти предупреждения - помимо того, что они кажутся мне странными - заключается в том, что выполнение Backup Exec внезапно стало на 3-4 часа дольше, чем обычно, и теперь занимает около 22-23 часов. Сравнивая свойства задания, я вижу, что скорость выполнения задания Backup Exec для этого конкретного сервера снизилась с 800 МБ / мин до 550 МБ / мин.

Мой поставщик оборудования сообщил мне, что сообщение носит чисто информационный характер и что нам, вероятно, следует заменить сервер. Ему 3,5 года, и я думаю, мы должны заменить его в течение года, но я все же хотел бы разобраться в этом вопросе.

Код ошибки: Bh / 4Bh / 0Bh = ABORTED_COMMAND / NAK_RECEIVED. Я написал свой собственный инструмент для их расшифровки и попытался дать базовую оценку на http://scsi.ev-en.org/

Эти ошибки указывают на то, что у вас где-то плохой канал, чаще всего это плохой кабель, но это также может быть плохой порт с любой стороны (диск или слот).

Да, вам следует беспокоиться. Не чрезвычайно обеспокоены, но изучите это и - при необходимости - замените некоторые детали.

Ошибки SCSI обычно вызвано: проблемами с драйверами / прошивкой или аппаратными сбоями.

Ссылаться на: http://en.wikipedia.org/wiki/Key_Code_Qualifier

Однако, как минимум, ошибка SCSI означает «что-то пошло не так». Это может быть лишь незначительная проблема, но часто возникающая незначительная проблема является гораздо более серьезной проблемой и означает, что что-то более глубокое идет не так.