У нас есть Supermicro Blade с 2 узлами. 2 узла идентичны, точно такое же оборудование.
Мы используем этот узел для кластеризации сервера Hyper-V. Они построены на Windows Server 2012 R2.
Первый узел работает очень хорошо, вся наша виртуальная машина может работать на нем без проблем. Второй узел сводит нас с ума. Когда мы включаем его без нагрузки (я имею в виду только Windows), узел в порядке и работает несколько дней без ошибок. Но когда мы загружаем его (он же виртуальная машина, да, даже одна виртуальная машина), система зависает примерно через 2 часа. Под зависанием я имею в виду только черный экран, как будто в спящем режиме. не могу разбудить его с помощью мыши или клавиатуры. Система больше не будет отвечать на пинг. Единственный способ вернуться в окна - это перезагрузить его. Мы не обнаружили никаких журналов ни в Windows о зависании, ни в интерфейсе Blade. Все по датчику температуры выглядят нормально.
Итак, мы многое перепробовали. Сначала мы переустановили Windows, Hyper-V ... (много раз) Мы поменяли местами процессор с первого узла на второй. Второй узел по-прежнему делает то же самое. Мы поменяли местами память с первого узла на второй узел. Второй узел все еще виснет.
Мы поменяли HardDrive (сатадом). Удаляем все остальное оборудование (два внешних NIC). Изменено размещение узла в клинке. Поменял, биос, IPMi, прошивку ...
По-прежнему то же самое.
Мы попросили замену платы у Supermicro.
И!!!! У нас все еще есть это зависание, только на втором узле блейда, только когда мы помещаем виртуальную машину в Hyper-V. Единственное, что мы не изменили, так это корпус.
Наш первый узел может запустить около 30 виртуальных машин без каких-либо проблем, а второй узел не может запустить одну без зависания. Есть ли у кого-нибудь идея, которая могла бы нам помочь? (Было бы здорово, если бы это не означало поджигание второго узла, моему боссу эта идея не нравится)
Технические характеристики оборудования: Корпус Supermicro SBE-710Q Узел: B9DRG (SBI-7127-RG)
Спасибо