У нас возникают сбои на наших SSD VPS, все работают на KVM: сбои происходят по разным причинам; спешу восстановить службу, которую моя команда использует для перезагрузки предыдущего снимка машины и никогда не сохраняет журналы.
Как бы то ни было, среди всех различных обстоятельств аварий повторяющимся фактом является corruption of in-memory data
: наш провайдер VPS сказал нам, что их оборудование работает нормально, но я не знаю, как читать плохой журнал, который мне дали.
Что происходит при обнаружении «повреждения данных в памяти»? Могло ли это быть из-за неработающей оперативной памяти или других видов повреждения памяти?
Забавно: провайдер VPS, использующий VMware, никогда не доставлял нам хлопот, тот, кто использует KVM, действительно сводит нас с ума из-за этих сбоев.
Редактировать 1: Я ни в коем случае не требую, чтобы вы вывели решение из этого жалкого журнала. Я застрял в этой проблеме, где нет достойного журнала, memtest
бесполезен, так как оборудование эмулируется, и провайдер VPS подтвердил, что его оборудование в порядке и ни один экземпляр KVM или QEMU не сломался. corruption of in-memory data detected
преследует меня, и я не могу придумать какой-либо продуктивный подход к дальнейшему исследованию этой проблемы.
«Обнаружено повреждение данных в памяти» не обязательно означает, что аппаратная RAM плохая. Это также может указывать на то, что блок был прочитан или записан неправильно, хранилище немного перевернулось или неисправно, возможно, ошибки файловой системы и несколько других причин.
Возврат к моментальному снимку, вероятно, не решит проблему, если есть скрытое повреждение файловой системы; он просто появится снова позже.
Вместо этого вам следует xfs_repair
файловая система, но поскольку это корневая файловая система, вам необходимо загрузиться с установочного носителя или аварийную среду, предоставленную вашим провайдером VPS.
Если xfs_repair
не может восстановить файловую систему, вы можете запустить xfs_repair -L
который очистит журнал XFS (который сам может быть поврежден), а затем снова попытается восстановить файловую систему.