Вчера получил новый сервер (IBM x3500), установил на него Fedora 12 и подумал, что запустим какой-нибудь код, чтобы посмотреть, как он работает.
Примерно через 7 часов работы система, кажется, остановилась.
Симптомы были: вентиляторы все еще были включены, т.е. система звучала так, как будто она работала. Монитор, мышь и клавиатура не получали питание и были отключены. Лоток для компакт-дисков все еще открыт / закрыт. Индикатор связи мигал.
Моей первой мыслью была температура, но я не могу найти никакой информации / журналов о температуре.
После перезагрузки я не могу найти ни одного файла журнала, который выглядел бы как системный журнал.
где искать причины?
РЕДАКТИРОВАТЬ: подробнее
только что случилось снова при аналогичных обстоятельствах.
3,5 часа здоровенной процедуры: поп!
В то время у меня был "топ":
top - 15:26:41 up 4:26, 4 users, load average: 2.67, 2.38, 2.37
Tasks: 246 total, 3 running, 243 sleeping, 0 stopped, 0 zombie
Cpu(s): 48.2%us, 1.5%sy, 0.0%ni, 48.4%id, 1.1%wa, 0.0%hi, 0.9%si, 0.0%st
Mem: 8252304k total, 8192272k used, 60032k free, 23592k buffers
Swap: 10354680k total, 146024k used, 10208656k free, 6350148k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3934 pstanton 20 0 1881m 322m 3900 S 99.5 4.0 141:57.88 java
3894 pstanton 20 0 1881m 336m 3896 S 95.2 4.2 169:54.01 java
3914 pstanton 20 0 1881m 315m 3936 S 84.6 3.9 151:52.13 java
3875 pstanton 20 0 1881m 271m 3948 S 73.3 3.4 179:25.13 java
3893 pstanton 20 0 317m 208m 206m S 31.2 2.6 33:22.98 postgres
3932 pstanton 20 0 317m 208m 206m S 16.9 2.6 63:02.05 postgres
3912 pstanton 20 0 317m 208m 206m R 6.6 2.6 43:27.91 postgres
4292 pstanton 20 0 325m 13m 4032 S 1.3 0.2 0:00.37 postgres
4288 pstanton 20 0 325m 22m 12m S 0.7 0.3 0:03.45 postgres
59 root 15 -5 0 0 0 S 0.3 0.0 0:03.81 ata/1
358 root 15 -5 0 0 0 S 0.3 0.0 0:04.54 kjournald2
1585 root 20 0 165m 7204 2168 S 0.3 0.1 1:37.06 Xorg
2002 root 20 0 42192 380 308 S 0.3 0.0 0:04.03 devkit-disks-da
3968 pstanton 20 0 288m 7280 3760 S 0.3 0.1 0:02.08 gnome-terminal
4291 pstanton 20 0 325m 13m 4076 S 0.3 0.2 0:01.41 postgres
4337 pstanton 20 0 15036 1244 848 R 0.3 0.0 0:00.09 top
1 root 20 0 4056 596 492 S 0.0 0.0 0:00.91 init
Я вижу, что использую память подкачки, что нехорошо, но это не должно останавливать сервер?
Кроме того, на этот раз у меня уже были подключены клавиатура, мышь и монитор, и есть питание для клавиатуры и мыши, но монитор пустой (даже не курсор).
Я думаю, вам нужно будет войти в BMC, чтобы получить журналы ошибок для оборудования, или вам нужно запустить IBM Director.
Кроме того, если у вас есть карта RSA на сервере, вы можете перейти на веб-страницу карты RSA, и она покажет вам последние обнаруженные аппаратные ошибки.
Вероятно, это было из-за плохих двоичных файлов Fedora. с тех пор мы без проблем установили 2 другие ОС. спасибо за ответы.
Журнал системных ошибок должен сообщить вам, что происходит; Я был бы склонен просто заявить о неисправности по гарантии и позволить IBM разобраться с этим - хотя вам, вероятно, придется воспроизвести проблему на поддерживаемой ОС, прежде чем они отнесутся к вам серьезно.