У нас есть DB2 LUW, работающая на сервере RHEL. У нас произошел сбой DB2, и IBM вернулась и сказала, что файл, к которому DB2 пытается получить доступ (через open64 ()), отключен или стал недействительным.
Мы ничего не сделали, кроме перезапуска базы данных, и, похоже, все работает нормально. Кроме того, рассматриваемый файл теперь выглядит совершенно нормально:
$ cd /db/log/TEAMS/tmsinst/NODE0000/TEAMS/T0000000/
$ ls -l
total 557604
-rw------- 1 tmsinst tmsinst 570425344 Jan 14 10:24 C0000000.CAT
$ file C0000000.CAT
C0000000.CAT: data
$ lsattr C0000000.CAT
------------- C0000000.CAT
$ ls -l
total 557604
-rw------- 1 tmsinst tmsinst 570425344 Jan 14 10:24 C0000000.CAT
С учетом этих фактов (пожалуйста, поправьте меня, если я неверно интерпретирую имеющиеся данные), что может привести к «самопроизвольному отключению файловой системы или ее кратковременной недействительности»?
Каким должен быть мой следующий шаг?
Это на оборудовании Dell, и мы запустили их диагностические инструменты на оборудование, и оно вернулось чистым.
Я предполагаю, что это основная проблема с оборудованием, например, отключение диска и повторное подключение к шине. Экзамен /var/log/messages
(и беги dmesg
) и ищите необычные сообщения scsi или sata о разъединениях и т. д.