Это произошло в 64-битной капле DigitalOcean Ubuntu 14.04:
Apr 22 02:17:02 localhost CRON[32514]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Apr 22 03:16:59 localhost kernel: [211877.884132] show_signal_msg: 12 callbacks suppressed
Apr 22 03:16:59 localhost kernel: [211877.884140] python[2376]: segfault at 24 ip 00000000004c278f sp 00007fbad163caa0 error 6 in python2.7[400000+2bd000]
Примерно в 3:16 AM CPU подскочил до 100%, и машина перестала отвечать на ping, SSH и (удаленную) консоль:
Как могло появиться троттлинг "обратный вызов подавлен" перед первый segfault?
http://lxr.free-electrons.com/source/arch/x86/mm/fault.c#L727
В общем, как несколько ошибок сегментации могут привести к зависанию ядра? Процесс нарушения был в течение:; сделать python script.py; сон 1; done '(ПРИМЕЧАНИЕ, сон), работал с' nice 10 'и имел увеличенный oom_adj, чтобы ядро сначала его убило:
open('/proc/self/oom_adj', 'w').write('10')
os.nice(10)
Пока что выглядит вот такая ошибка ядра:
http://blog.nitrous.io/2014/03/10/stability-and-a-linux-oom-killer-bug.html