У меня есть виртуальная машина VMWare на хосте ESX с разделами LVM. Я настроил kdump с очень простой конфигурацией - ext /dev/mapper/logical-volume-name
и path /data/crash
. Когда я вызываю сбой системы, оно загружает ядро kdump и показывает логические тома, загружает их и показывает, что сохраняет дамп памяти, а экспорт около 2,5 ГБ занимает около 30 секунд, что нормально. Проблема в том, что когда он перезагружается, он возвращается, но нет подключения к сети (не может выйти и не может войти через сеть), однако все сетевые службы работают, и простая перезагрузка (без сбоев) устраняет этот. Дополнительно, другая проблема - сохраненный дамп памяти vmcore фактически не сохранялся. Я тестировал это на виртуальной машине на VirtualBox, и это работает под управлением CentOS, эквивалентного серверу RHEL, который в настоящее время находится в производстве и в настоящее время имеет эти проблемы с kdump.
Есть идеи или вещи, на которые я должен обратить внимание?
Я поговорил с одним из разработчиков KDump и подтвердил, что это известная ошибка. В настоящее время я не могу вносить какие-либо изменения в производственную среду, но у меня есть очень подозрительная идея, что необходимо обновить ядро и / или что-то между виртуальной машиной и ее хостом необходимо изучить.
from Eric W. Biederman to Drew Decker cc jbarnes@sgi.com, khalid.aziz@hp.com, hari@in.ibm.com, tjd21@cl.cam.ac.uk date Tue, Jan 25, 2011 at 1:50 PM subject Re: KDump Question/Issues (Need a developer's eyes) That does sound like a bug in the RHEL kernel interacting with VMware. The fact that the reboot doesn't reset the hardware is frankly scary. At this point any RHEL kernel is old and has not been updated by the many many bug fixes that have happened between when they branched off linus's tree and the present, and presumably comes with a support contract by people that are paid to help you, and understand those details, so I recommend you talk to the fine people at Red Hat. They should be able to help. Usually problems like this come down to driver issues of some sort, not issues in the actual kexec on panic infrastructure. Although in this case I would also suspect how the kdump kernel is calling reboot. Good luck to you, Eric