Назад | Перейти на главную страницу

Dell PowerEdge 2950 получает ошибку уменьшения ширины канала PCIe: слот для внутреннего хранилища

У меня есть Dell PowerEdge 2950, ​​который получает сообщение «Ошибка ширины канала связи PCIe: внутренний слот для хранения данных». Гарантия истекла, поэтому я не могу беспокоить Dell по этому поводу, подумал, что посмотрю, испытал ли кто-нибудь это здесь.

Я уже снял и переустановил объединительную плату, переходную плату, RAID-контроллер и RAM на контроллере. Даже удалил и переустановил все диски и загрузил сервер без карты RAID, затем выключил и установил карту RAID. Я не получил сообщение об ошибке, когда карта RAID была удалена, поэтому я думаю, что ошибка каким-то образом напрямую связана с картой RAID ... однако я все еще могу получить доступ к RAID BIOS и увидеть состояние всех дисков, которые показывает, что все в порядке. Однако я не могу получить доступ к Dell BIOS.

Ваша карта RAID-контроллера (вероятно, PERC 5 / i) находится в многополосном слоте PCIe (вероятно, x8), но она работает с меньшим количеством дорожек, чем оптимально (вероятно, x4 или x1). Он может по-прежнему работать нормально, но если он работает, его максимальная пропускная способность для последовательных операций чтения / записи будет ниже, чем обычно.

Шаги по устранению неполадок:

  1. Попробуйте использовать тот же RAID-контроллер в другом слоте PCIe.
  2. Попробуйте использовать другой RAID-контроллер в том же слоте PCIe.
  3. Попробуйте другую переходную карту PCIe.
  4. Попробуйте другую материнскую плату.

В качестве примечания: если вы используете негарантийное оборудование в производственной среде, важно быть самодостаточным с запасными серверами и запасными компонентами.

Я только что столкнулся с этой проблемой с моим сервером 2950. В моем случае это произошло, когда я добавил к машине новый четырехпортовый адаптер gigE. У меня уже был двухпортовый адаптер gigE на той же переходной плате pcie (с левой стороны, если смотреть спереди). Если я вынул карту с двумя портами, ошибка исчезла. Я предполагаю, что проблема в том, что переходная плата на самом деле не предоставляет достаточно каналов для поддержки полной пропускной способности для обоих слотов pcie на переходной плате и, возможно, делит каналы с картой perc 6 / i. Позже я попытаюсь вставить одну из плат в переходник с правой стороны, но сейчас я не могу снова выключить машину.

Как ни странно, ответ на Spiceworks вопрос предполагает, что это может зависеть от того, какие USB-устройства подключены.

Мой коллега сказал мне, что он только что решил эту ошибку на PowerEdge 1950, удалив все USB-устройства, которые, как мне кажется, были просто стандартной клавиатурой и мышью.

Мне это кажется долгим шансом, но попробовать это, по крайней мере, безболезненно.

Значит, ваш RAID-контроллер как-то сломан.

Если вам повезло, и вы использовали RAID1, то сработает следующее:

  • Выключить сервер
  • вытащить все диски
  • Включите, войдите в BIOS и переключите RAID на SCSI или SAS для всех каналов
  • вернуть диски
  • Подтвердите «y» для смены RAID на SCSI во время загрузки для каждого канала.

Теперь вы сможете получить доступ к своим дискам как JBOD. Вы должны иметь возможность загружаться с disk1 - после этого вы можете создать программный raid1 с помощью средств ОС (я недавно сделал это на старом 2850 с PERC4i / SCSI и Linux без потери данных).