У меня есть несколько серверов, на которых установлены карты GRID K2 nvidia Tesla.
Первоначально они работали нормально. Но недавно я обновил драйвер ядра и обнаружил проблему, когда приложения на основе CUDA больше не обнаруживали наличие графического процессора.
При ближайшем рассмотрении подробности из / proc / drivers / nvidia / gpus / * / information больше не предоставляют действительный UUID графического процессора и сведения о видео BIOS. Вместо этого я получаю следующее. На рабочем узле получаются нормальные детали (нет,?).
Bus Location: 0000:89:00.0
Model: GRID K2
IRQ: 46
GPU UUID: GPU-????????-????-????-????-????????????
Video BIOS: ??.??.??.??.??
Bus Type: PCIe
DMA Size: 37 bits
DMA Mask: 0x1fffffffff
Bus Location: 0000:8a:00.0
Я попытался выполнить «холодную» перезагрузку машин до предыдущей известной рабочей версии конфигурации (эти серверы загружены по сети), и проблема также сохраняется со старыми драйверами.
Что здесь может быть не так? Карты тосты?