Вчера у меня возникла проблема с питанием в моем центре обработки данных, мои nobreaker вышли из строя через 30 минут, что привело к одному из худших сценариев, которые я когда-либо видел до сих пор. Я использую сервер freeNas, использующий raidz1-0. После включения я заметил критическое предупреждение:
Состояние Raid тома (ZFS) УСТАРЕЛО: на одном или нескольких устройствах произошла ошибка, приводящая к повреждению данных. Это может повлиять на приложения.
Итак, я проверил статус диска, он более серьезный, чем я думал, запустив "zpool status -v"
я получил следующее сообщение:
pool: Raid
state: DEGRADED
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://illumos.org/msg/ZFS-8000-8A
scan: scrub in progress since Sun Feb 11 19:47:09 2018
14.0T scanned out of 18.1T at 155M/s, 7h48m to go
8K repaired, 77.14% done
config:
NAME STATE READ WRITE CKSUM
Raid DEGRADED 0 0 75.1K
raidz1-0 DEGRADED 0 0 150K
gptid/d5a65a3d-4eac-11e6-aebb-b083fed00972 DEGRADED 0 0 0 too many errors (repairing)
gptid/d642db6c-4eac-11e6-aebb-b083fed00972 DEGRADED 0 0 0 too many errors (repairing)
gptid/d6d69c95-4eac-11e6-aebb-b083fed00972 DEGRADED 0 0 0 too many errors (repairing)
gptid/d7860535-4eac-11e6-aebb-b083fed00972 DEGRADED 0 0 0 too many errors
gptid/d82ec964-4eac-11e6-aebb-b083fed00972 DEGRADED 0 0 0 too many errors
gptid/aec9036c-4f4b-11e6-a2f2-b083fed00972 DEGRADED 0 0 0 too many errors
gptid/d97ceea1-4eac-11e6-aebb-b083fed00972 DEGRADED 0 0 9 too many errors (repairing)
gptid/da14eaee-4eac-11e6-aebb-b083fed00972 DEGRADED 0 0 0 too many errors (repairing)
gptid/dabd3055-4eac-11e6-aebb-b083fed00972 DEGRADED 0 0 0 too many errors (repairing)
gptid/db58a590-4eac-11e6-aebb-b083fed00972 DEGRADED 0 0 0 too many errors (repairing)
Весь мой дисковый массив вышел из строя, но мигающий светодиод показывает «ОК». Прямо сейчас я пробую скраб, может это не сработает. Я в панике, потому что есть два тома ISCSI, содержащих 6 серверов ВМ. Я смонтировал эти диски iscsi на Linux-машине, чтобы переместить оттуда файлы сервера, но у меня возникла ошибка ввода-вывода при запуске cp и rsync.
Кто-то такое испытывал? Есть чем заняться?
Моя установка сервера: Сервер хранения Dell PowerEdge R720 10x HD Dell 4 ТБ 15 тыс. Об / мин 65 ГБ ОЗУ Intel (R) Xeon (R) CPU E5-2650 v2 @ 2,60 ГГц
Любое предложение будет оценено.