У меня есть Dell PowerEdge 2950, который получает сообщение «Ошибка ширины канала связи PCIe: внутренний слот для хранения данных». Гарантия истекла, поэтому я не могу беспокоить Dell по этому поводу, подумал, что посмотрю, испытал ли кто-нибудь это здесь.
Я уже снял и переустановил объединительную плату, переходную плату, RAID-контроллер и RAM на контроллере. Даже удалил и переустановил все диски и загрузил сервер без карты RAID, затем выключил и установил карту RAID. Я не получил сообщение об ошибке, когда карта RAID была удалена, поэтому я думаю, что ошибка каким-то образом напрямую связана с картой RAID ... однако я все еще могу получить доступ к RAID BIOS и увидеть состояние всех дисков, которые показывает, что все в порядке. Однако я не могу получить доступ к Dell BIOS.
Ваша карта RAID-контроллера (вероятно, PERC 5 / i) находится в многополосном слоте PCIe (вероятно, x8), но она работает с меньшим количеством дорожек, чем оптимально (вероятно, x4 или x1). Он может по-прежнему работать нормально, но если он работает, его максимальная пропускная способность для последовательных операций чтения / записи будет ниже, чем обычно.
Шаги по устранению неполадок:
В качестве примечания: если вы используете негарантийное оборудование в производственной среде, важно быть самодостаточным с запасными серверами и запасными компонентами.
Я только что столкнулся с этой проблемой с моим сервером 2950. В моем случае это произошло, когда я добавил к машине новый четырехпортовый адаптер gigE. У меня уже был двухпортовый адаптер gigE на той же переходной плате pcie (с левой стороны, если смотреть спереди). Если я вынул карту с двумя портами, ошибка исчезла. Я предполагаю, что проблема в том, что переходная плата на самом деле не предоставляет достаточно каналов для поддержки полной пропускной способности для обоих слотов pcie на переходной плате и, возможно, делит каналы с картой perc 6 / i. Позже я попытаюсь вставить одну из плат в переходник с правой стороны, но сейчас я не могу снова выключить машину.
Как ни странно, ответ на Spiceworks вопрос предполагает, что это может зависеть от того, какие USB-устройства подключены.
Мой коллега сказал мне, что он только что решил эту ошибку на PowerEdge 1950, удалив все USB-устройства, которые, как мне кажется, были просто стандартной клавиатурой и мышью.
Мне это кажется долгим шансом, но попробовать это, по крайней мере, безболезненно.
Значит, ваш RAID-контроллер как-то сломан.
Если вам повезло, и вы использовали RAID1, то сработает следующее:
Теперь вы сможете получить доступ к своим дискам как JBOD. Вы должны иметь возможность загружаться с disk1 - после этого вы можете создать программный raid1 с помощью средств ОС (я недавно сделал это на старом 2850 с PERC4i / SCSI и Linux без потери данных).