У меня два процессора заблокировались на одном из серверов. Из dmesg
:
BUG: soft lockup - CPU#1 stuck for 23s! [vmx-vcpu-0:6148]
и позже:
BUG: soft lockup - CPU#2 stuck for 23s! [vmx-vcpu-0:6148]
Я пытаюсь понять, почему это могло произойти; процессор имеет 4 ядра с гиперпоточностью, поэтому ОС видит его как 8 ядер. Но мой главный вопрос связан с этим:
Глядя на htop
после замораживания из SSH я вижу, что процессоры №2 и №3 (предполагая, что они соответствуют №1 и №2 из dmesg) застряли на 100%, и, по-видимому, никакие процессы не используют их:
Ни один из процессов не использовал более 5% ЦП. Почему они показывают 100% использование? Считаются ли они заблокированными ядром?
Как сообщается в сообщении, это ошибка в коде уровня ядра.
Эти процессоры застревают в коде ядра (vmx-cpu-0), который не передает () управление процессором в течение длительного периода времени.
Что же делать - открыть тикет с VMware. vmx-cpu-0
похоже на их код, но я не совсем уверен.