При запуске, пытаясь переместить наши приложения на новый сервер, мы столкнулись с зависанием Ubuntu 16.04 на новом сервере, отвечающим на эхо-запросы, но с зависанием ssh
debug1: Entering interactive session.
и при попытке войти напрямую с экрана + клавиатуры не отображается логин.
После включения и выключения питания сервер загрузился без каких-либо ошибок, но некоторые (или все?) Файлы, которые были открыты приложениями, такими как файлы журналов, имели несколько блоков нулей на конце, поэтому файлы кажутся поврежденными.
Наша дисковая установка выглядит следующим образом:
3 x SSD, configured as Software Raid 5 (mdadm) with LVM on top:
- 1x ext4 Logical Volume for Host OS(Ubuntu 16.04)
- 1x ext4 Logical Volume holding mysql datadir used from a Virtual Machine
3 x HDD, configuredd as Software Raid 5 (mdadm) with LVM on top.
- Raid is congigured for 4 disks, with one missing that we'll add later
- 1x ext4 Logical Volume for data storage
Конфигурация сервера:
384 GB Ram
2x Xeon E5-2620 v4
Мои вопросы:
Мои предположения таковы:
Что делала эта система, когда была заблокирована? Для размышлений о причинах нужна дополнительная информация ...
Я был бы обеспокоен базой данных mysql или чем-либо еще важным, что было написано. Проверьте свою базу данных! Выполните очистку данных для каждого массива и fsck для каждой файловой системы, возможно, это поправимо. Если есть какие-либо опасения по поводу целостности данных, восстановите их из резервной копии.
https://wiki.archlinux.org/index.php/Software_RAID_and_LVM#Scrubbing
Я не вижу причин, по которым программный RAID или LVM, медленные твердотельные накопители, кеш FS и т. Д. Следует рассматривать здесь в качестве основных виновников. Могло быть много других причин. В первую очередь меня беспокоят проблемы с оборудованием (например, с ОЗУ). Вы также можете проверить это с помощью различных инструментов.
Вы не упоминаете - поврежден ли хост или это виртуальная машина?