Краткое объяснение проблемы-
Время от времени я испытываю перезапуск виртуальной машины. Итак, какой бы диск мы ни подключили, он автоматически отключается. Итак, согласно рекомендациям, мы добавили монтирование диска с uuid в fstab. Мы протестировали изменения, перезапустив виртуальные машины, и каждый раз при подключении дисков все работало нормально. Мы внесли эти изменения во все виртуальные машины, которые мы используем в Azure. Вчера мы увидели проблему с одной из наших виртуальных машин (xxxxxxxxxxxxxxxx.cloudapp.net), когда мы использовали ssh, мы не могли видеть смонтированные диски с «df -h», а также диск ОС был заполнен, с «fdisk -l» я мог видеть размонтированные диски. Затем я попробовал несколько вещей
Затем мы попытались сбросить пароль виртуальной машины, который выглядел примерно и через час мы видим, что портал показывает сообщение об ошибке. После этого, когда мы выполняем «ssh azureuser@xxxxxxxxxxxxxxxx.cloudapp.net», мы получаем это «ssh: connect to host xxxxxxxxxxxxxxxx.cloudapp.net порт 22: соединение отклонено», просматривая журнал аудита, мы обнаружили эту ошибку
НАЗВАНИЕ ОПЕРАЦИИ Microsoft.Resources / deployments / write
СТАТУС Не удалось
Ошибка уровня
НАЗВАНИЕ ОПЕРАЦИИ Microsoft.ClassicCompute / virtualMachines / extensions / write
СТАТУС Не удалось
Ошибка уровня
СВОЙСТВА statusCode: RequestTimeout statusMessage: {"error": {"code": "ResourceDeploymentFailure", "message": "Операция по предоставлению ресурса не была завершена в течение разрешенного периода ожидания. См. Http://aka.ms/arm-deploy для подробностей использования. "}}
Я включил опцию диагностики загрузки в виртуальной машине, а затем попытался перезапустить, и теперь я мог видеть журнал ошибок в диагностике загрузки. С этой ошибкой я вижу, потому что диск заполнен, ОС не загружается.
Traceback (most recent call last):
File "/usr/bin/cloud-init", line 618, in <module>
sys.exit(main())
File "/usr/bin/cloud-init", line 614, in main
get_uptime=True, func=functor, args=(name, args))
File "/usr/lib/python2.7/dist-packages/cloudinit/util.py", line 1875, in log_time
ret = func(*args, **kwargs)
File "/usr/bin/cloud-init", lne 489, in stats_wrapper
atomic_write_json(status_path, status)
File "/usr/bin/cloud-init", line 434, in atomic_write_json
raise e
IOError: [Errno28] No space left on device