Назад | Перейти на главную страницу

Oracle использует oom-killer, даже когда RAM и SWAP достаточно свободны?

Подскажите, пожалуйста, по какой причине этот процесс Oracle был убит? Похоже, много свободной RAM и много SWAP. Затем были убиты несколько других процессов оракула. Виртуальная машина имеет 16 ГБ vMem и 8 виртуальных ЦП. Но я публикую здесь первый убитый процесс оракула:

 Mar  1 20:00:58 ******* kernel: oracle invoked oom-killer: gfp_mask=0x280da, order=0, oom_adj=0, oom_score_adj=0
Mar  1 20:00:58 ******* kernel: oracle cpuset=/ mems_allowed=0
Mar  1 20:00:58 ******* kernel: Pid: 2370, comm: oracle Not tainted 2.6.32-431.el6.x86_64 #1
Mar  1 20:00:58 ******* kernel: Call Trace:
Mar  1 20:00:58 ******* kernel: [] ? cpuset_print_task_mems_allowed+0x91/0xb0
Mar  1 20:00:58 ******* kernel: [] ? dump_header+0x90/0x1b0
Mar  1 20:00:58 ******* kernel: [] ? security_real_capable_noaudit+0x3c/0x70
Mar  1 20:00:58 ******* kernel: [] ? oom_kill_process+0x82/0x2a0
Mar  1 20:00:58 ******* kernel: [] ? select_bad_process+0xe1/0x120
Mar  1 20:00:58 ******* kernel: [] ? out_of_memory+0x220/0x3c0
Mar  1 20:00:58 ******* kernel: [] ? __alloc_pages_nodemask+0x8ac/0x8d0
Mar  1 20:00:58 ******* kernel: [] ? alloc_pages_vma+0x9a/0x150
Mar  1 20:00:58 ******* kernel: [] ? handle_pte_fault+0x73d/0xb00
Mar  1 20:00:58 ******* kernel: [] ? free_pgtables+0xce/0x120
Mar  1 20:00:58 ******* kernel: [] ? unmap_region+0xcd/0x130
Mar  1 20:00:58 ******* kernel: [] ? vma_prio_tree_add+0x75/0xd0
Mar  1 20:00:58 ******* kernel: [] ? handle_mm_fault+0x22a/0x300
Mar  1 20:00:58 ******* kernel: [] ? __do_page_fault+0x138/0x480
Mar  1 20:00:58 ******* kernel: [] ? do_mmap_pgoff+0x335/0x380
Mar  1 20:00:58 ******* kernel: [] ? do_page_fault+0x3e/0xa0
Mar  1 20:00:58 ******* kernel: [] ? page_fault+0x25/0x30
Mar  1 20:00:58 ******* kernel: Mem-Info:
Mar  1 20:00:58 ******* kernel: Node 0 DMA per-cpu:
Mar  1 20:00:58 ******* kernel: CPU    0: hi:    0, btch:   1 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    1: hi:    0, btch:   1 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    2: hi:    0, btch:   1 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    3: hi:    0, btch:   1 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    4: hi:    0, btch:   1 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    5: hi:    0, btch:   1 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    6: hi:    0, btch:   1 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    7: hi:    0, btch:   1 usd:   0
Mar  1 20:00:58 ******* kernel: Node 0 DMA32 per-cpu:
Mar  1 20:00:58 ******* kernel: CPU    0: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    1: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    2: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    3: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    4: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    5: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    6: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    7: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: Node 0 Normal per-cpu:
Mar  1 20:00:58 ******* kernel: CPU    0: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    1: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    2: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    3: hi:  186, btch:  31 usd:  20
Mar  1 20:00:58 ******* kernel: CPU    4: hi:  186, btch:  31 usd:  32
Mar  1 20:00:58 ******* kernel: CPU    5: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: CPU    6: hi:  186, btch:  31 usd: 184
Mar  1 20:00:58 ******* kernel: CPU    7: hi:  186, btch:  31 usd:   0
Mar  1 20:00:58 ******* kernel: active_anon:2673615 inactive_anon:368657 isolated_anon:0
Mar  1 20:00:58 ******* kernel: active_file:3541 inactive_file:3962 isolated_file:32
Mar  1 20:00:58 ******* kernel: unevictable:0 dirty:3 writeback:2770 unstable:0
Mar  1 20:00:58 ******* kernel: free:33763 slab_reclaimable:16555 slab_unreclaimable:28221
Mar  1 20:00:58 ******* kernel: mapped:1517627 shmem:1730877 pagetables:906135 bounce:0
Mar  1 20:00:58 ******* kernel: Node 0 DMA free:15132kB min:60kB low:72kB high:88kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:0kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:14740kB mlocked:0kB dirty:0kB writeback:0kB mapped:0kB shmem:0kB slab_reclaimable:0kB slab_unreclaimable:0kB kernel_stack:0kB pagetables:0kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? yes
Mar  1 20:00:58 ******* kernel: lowmem_reserve[]: 0 3000 16130 16130
Mar  1 20:00:58 ******* kernel: Node 0 DMA32 free:64904kB min:12556kB low:15692kB high:18832kB active_anon:2064816kB inactive_anon:516452kB active_file:492kB inactive_file:188kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:3072096kB mlocked:0kB dirty:0kB writeback:0kB mapped:2319432kB shmem:2352892kB slab_reclaimable:7420kB slab_unreclaimable:3620kB kernel_stack:832kB pagetables:24672kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:1 all_unreclaimable? no
Mar  1 20:00:58 ******* kernel: lowmem_reserve[]: 0 0 13130 13130
Mar  1 20:00:58 ******* kernel: Node 0 Normal free:55016kB min:54964kB low:68704kB high:82444kB active_anon:8629644kB inactive_anon:958176kB active_file:13672kB inactive_file:15660kB unevictable:0kB isolated(anon):0kB isolated(file):128kB present:13445120kB mlocked:0kB dirty:12kB writeback:11080kB mapped:3751076kB shmem:4570616kB slab_reclaimable:58800kB slab_unreclaimable:109264kB kernel_stack:5360kB pagetables:3599868kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:160 all_unreclaimable? no
Mar  1 20:00:58 ******* kernel: lowmem_reserve[]: 0 0 0 0
Mar  1 20:00:58 ******* kernel: Node 0 DMA: 3*4kB 2*8kB 2*16kB 3*32kB 2*64kB 2*128kB 1*256kB 0*512kB 0*1024kB 1*2048kB 3*4096kB = 15132kB
Mar  1 20:00:58 ******* kernel: Node 0 DMA32: 1225*4kB 859*8kB 878*16kB 547*32kB 184*64kB 34*128kB 0*256kB 0*512kB 0*1024kB 1*2048kB 1*4096kB = 65596kB
Mar  1 20:00:58 ******* kernel: Node 0 Normal: 9165*4kB 1804*8kB 46*16kB 2*32kB 1*64kB 1*128kB 1*256kB 1*512kB 1*1024kB 1*2048kB 0*4096kB = 55924kB
Mar  1 20:00:58 ******* kernel: 1760824 total pagecache pages
Mar  1 20:00:58 ******* kernel: 22460 pages in swap cache
Mar  1 20:00:58 ******* kernel: Swap cache stats: add 6636857, delete 6614397, find 15635455/16141480
Mar  1 20:00:58 ******* kernel: Free swap  = 33548340kB
Mar  1 20:00:58 ******* kernel: Total swap = 36184056kB
Mar  1 20:00:58 ******* kernel: 4194288 pages RAM
Mar  1 20:00:58 ******* kernel: 111808 pages reserved
Mar  1 20:00:58 ******* kernel: 59252583 pages shared
Mar  1 20:00:58 ******* kernel: 2502605 pages non-shared
Mar  1 20:00:58 ******* kernel: [ pid ]   uid  tgid total_vm      rss cpu oom_adj oom_score_adj name
Mar  1 20:00:58 ******* kernel: [  612]     0   612     2769       42   2     -17         -1000 udevd
Mar  1 20:00:58 ******* kernel: [ 1872]     0  1872    47365      204   7       0             0 vmtoolsd
Mar  1 20:00:58 ******* kernel: [ 1980]     0  1980    23294      109   6     -17         -1000 auditd
Mar  1 20:00:58 ******* kernel: [ 1996]     0  1996    62898      842   4       0             0 rsyslogd
Mar  1 20:00:58 ******* kernel: [ 2025]     0  2025     2738       93   3       0             0 irqbalance
Mar  1 20:00:58 ******* kernel: [ 2039]    32  2039     4744       68   4       0             0 rpcbind
Mar  1 20:00:58 ******* kernel: [ 2071]    29  2071     5837       61   3       0             0 rpc.statd
Mar  1 20:00:58 ******* kernel: [ 2092]     0  2092     5773       31   1       0             0 rpc.idmapd
Mar  1 20:00:58 ******* kernel: [ 2211]     0  2211    39323      127   5       0             0 pbx_exchange
Mar  1 20:00:58 ******* kernel: [ 2223]     0  2223    48106      158   5       0             0 winbindd
Mar  1 20:00:58 ******* kernel: [ 2237]     0  2237     1020       48   4       0             0 acpid
Mar  1 20:00:58 ******* kernel: [ 2323]     0  2323    49766      281   0       0             0 winbindd
Mar  1 20:00:58 ******* kernel: [ 2540]     0  2540    26827       11   5       0             0 rpc.rquotad
Mar  1 20:00:58 ******* kernel: [ 2544]     0  2544     5414       41   5       0             0 rpc.mountd
Mar  1 20:00:58 ******* kernel: [ 2580]     0  2580     1570       23   0       0             0 mcelog
Mar  1 20:00:58 ******* kernel: [ 2592]     0  2592    16651       78   5     -17         -1000 sshd
Mar  1 20:00:58 ******* kernel: [ 2600]     0  2600     5545      105   3       0             0 xinetd
Mar  1 20:00:58 ******* kernel: [ 2608]    38  2608     7147      132   5       0             0 ntpd
Mar  1 20:00:58 ******* kernel: [ 2618]   498  2618    25741       57   2       0             0 uuidd
Mar  1 20:00:58 ******* kernel: [ 2630]     0  2630    43170      139   3       0             0 vnetd
Mar  1 20:00:58 ******* kernel: [ 2638]     0  2638    52398      158   2       0             0 bpcd
Mar  1 20:00:58 ******* kernel: [ 2655]     0  2655   198335      478   4       0             0 nbdisco
Mar  1 20:00:58 ******* kernel: [ 2676]     0  2676    76958       82   2       0             0 mtstrmd
Mar  1 20:00:58 ******* kernel: [ 2707]     0  2707    22314      141   0       0             0 sendmail
Mar  1 20:00:58 ******* kernel: [ 2716]    51  2716    19658       80   4       0             0 sendmail
Mar  1 20:00:58 ******* kernel: [ 2734]     0  2734   200856      353   7       0             0 avagent.bin
Mar  1 20:00:58 ******* kernel: [ 2747]     0  2747    44287      178   3       0             0 tuned
Mar  1 20:00:58 ******* kernel: [ 2757]     0  2757    29333      103   6       0             0 crond
Mar  1 20:00:58 ******* kernel: [ 2778]     0  2778    27431      167   7       0             0 saphostexec
Mar  1 20:00:58 ******* kernel: [ 2805]   600  2805   545016     4031   5       0             0 sapstartsrv
Mar  1 20:00:58 ******* kernel: [ 2885]   834  2885   100602      294   3       0             0 sapstartsrv
Mar  1 20:00:58 ******* kernel: [ 2904]     0  2904     5385       31   6       0             0 atd
Mar  1 20:00:58 ******* kernel: [ 2928]     0  2928    26005       69   5       0             0 rhsmcertd
Mar  1 20:00:58 ******* kernel: [ 2935]     0  2935     8154     1110   0       0             0 saposcol
Mar  1 20:00:58 ******* kernel: [ 3098]   834  3098    13538       50   3       0             0 sapstart
Mar  1 20:00:58 ******* kernel: [ 3128]   834  3128    43278      119   5       0             0 jc.sapDAA_SMDA9
Mar  1 20:00:58 ******* kernel: [ 3144]   834  3144  1276839    57796   4       0             0 jstart
Mar  1 20:00:58 ******* kernel: [ 3211]   703  3211    33752      378   5       0             0 perl
Mar  1 20:00:58 ******* kernel: [ 3288]   703  3288  1181563    62355   0       0             0 java
Mar  1 20:00:58 ******* kernel: [ 3497]     0  3497     1016       34   1       0             0 mingetty
Mar  1 20:00:58 ******* kernel: [ 3499]     0  3499     1016       34   1       0             0 mingetty
Mar  1 20:00:58 ******* kernel: [ 3502]     0  3502     1016       34   1       0             0 mingetty
Mar  1 20:00:58 ******* kernel: [ 3504]     0  3504     1016       34   2       0             0 mingetty
Mar  1 20:00:58 ******* kernel: [ 3506]     0  3506     1016       34   1       0             0 mingetty
Mar  1 20:00:58 ******* kernel: [ 3508]     0  3508     1016       34   1       0             0 mingetty
Mar  1 20:00:58 ******* kernel: [ 3515]     0  3515     3098       41   2     -17         -1000 udevd
Mar  1 20:00:58 ******* kernel: [ 3516]     0  3516     3098       41   4     -17         -1000 udevd
Mar  1 20:00:58 ******* kernel: [13764]     0 13764    48089       89   7       0             0 winbindd
Mar  1 20:00:58 ******* kernel: [13765]     0 13765    48089       92   7       0             0 winbindd
Mar  1 20:00:58 ******* kernel: [13873]   703 13873  2403434     6196   5       0             0 oracle
Mar  1 20:00:58 ******* kernel: [13875]   703 13875  2402873      651   3       0             0 oracle
Mar  1 20:00:58 ******* kernel: [13880]   703 13880  2402873      423   4       0             0 oracle
Mar  1 20:00:58 ******* kernel: [13875]   703 13875  2402873      651   3       0             0 oracle
Mar  1 20:00:58 ******* kernel: [13880]   703 13880  2402873      423   4       0             0 oracle

.. Примечание: здесь удалена куча процессов оракула, чтобы ограничить длину символа для публикации здесь. Всего запущено 296 процессов оракула.
..
Mar  1 20:00:59 ******* kernel: [18644]     0 18644    44207      371   1       0             0 bpclntcmd
Mar  1 20:00:59 ******* kernel: [18647]   703 18647    57442      240   3       0             0 oracle
Mar  1 20:00:59 ******* kernel: [18656]   703 18656    57442      185   6       0             0 oracle
Mar  1 20:00:59 ******* kernel: [18657] 54329 18657     9279      196   1       0             0 nrpe
Mar  1 20:00:59 ******* kernel: [18660] 54329 18660     9314      255   2       0             0 nrpe
Mar  1 20:00:59 ******* kernel: [18662]     0 18662    39263      289   5       0             0 crond
Mar  1 20:00:59 ******* kernel: [18663]     0 18663     5745      341   1       0             0 saposcol
Mar  1 20:00:59 ******* kernel: [18664] 54329 18664     9315      146   3       0             0 nrpe
Mar  1 20:00:59 ******* kernel: [18665] 54329 18665     5730       76   0       0             0 check_open_file
Mar  1 20:00:59 ******* kernel: [18666] 54329 18666     6611      191   4       0             0 xinetd
Mar  1 20:00:59 ******* kernel: [18667]     0 18667     8389      183   1       0             0 sapcimb
Mar  1 20:00:59 ******* kernel: [18669]     0 18669     6610      171   0       0             0 xinetd
Mar  1 20:00:59 ******* kernel: [18670]     0 18670     6610      171   0       0             0 xinetd
Mar  1 20:00:59 ******* kernel: [18677]     0 18677     6610      177   5       0             0 xinetd
Mar  1 20:00:59 ******* kernel: [18678]   703 18678    29497      275   4       0             0 perl
Mar  1 20:00:59 ******* kernel: [18682]   703 18682    29497      252   7       0             0 perl
Mar  1 20:00:59 ******* kernel: [18683]   703 18683    29497      231   0       0             0 perl
Mar  1 20:00:59 ******* kernel: [18687]     0 18687     2620       92   1       0             0 .SAPOSCOL_00000
Mar  1 20:00:59 ******* kernel: [18688]     0 18688     6610      186   5       0             0 xinetd
Mar  1 20:00:59 ******* kernel: [18689]     0 18689     6610      189   2       0             0 xinetd
Mar  1 20:00:59 ******* kernel: [18690]     0 18690     6610      191   3       0             0 xinetd
Mar  1 20:00:59 ******* kernel: [18691]     0 18691     6610      194   2       0             0 xinetd
Mar  1 20:00:59 ******* kernel: Out of memory: Kill process 13900 (oracle) score 77 or sacrifice child
Mar  1 20:00:59 ******* kernel: Killed process 13900, UID 703, (oracle) total-vm:9622308kB, anon-rss:5180kB, file-rss:4028040kB
 

Сверху, я думаю, эти строки говорят, что у меня много оперативной памяти и свопинга. право?:

Node 0 DMA free:15132kB
Node 0 DMA32 free:64904kB
Node 0 Normal free:55016kB
Free swap  = 33548340kB
Total swap = 36184056kB

Интересно, что означает «all_unreclaimable? Yes» для DMA узла 0 и «all_unreclaimable? No» Узел 0 DMA31 и узел 0 Нормальный!

Кроме того, вот информация, которая может дать больше информации о настройках сервера:

 $sudo sysctl -p
net.ipv4.ip_forward = 0
net.ipv4.conf.default.rp_filter = 1
net.ipv4.conf.default.accept_source_route = 0
kernel.sysrq = 0
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
error: "net.bridge.bridge-nf-call-ip6tables" is an unknown key
error: "net.bridge.bridge-nf-call-iptables" is an unknown key
error: "net.bridge.bridge-nf-call-arptables" is an unknown key
kernel.msgmnb = 65536
kernel.msgmax = 65536
kernel.shmmax = 68719476736
kernel.msgmni = 1024
kernel.sem = 1250 256000 100 8192
vm.max_map_count = 1000000
kernel.shmall = 1152921504606846720
fs.file-max = 19801952
net.core.rmem_default = 1048576
net.core.wmem_default = 262144
net.core.rmem_max = 4194304
net.core.wmem_max = 1048576
fs.aio-max-nr = 1048576
net.ipv4.ip_local_port_range = 9000 65500
vm.swappiness = 0
vm.dirty_background_ratio = 3
vm.dirty_ratio = 15
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 100
kernel.shmmni = 4096

У вас совсем мало свободной памяти.

Первый, vm.swappiness = 0 Делайте это только в том случае, если вы точно уверены, что у вас достаточно. Установка низкого значения на 10 или около того может предотвратить состояние нехватки памяти. И действительно будет использовать ваше пространство подкачки.

Исходя из сводки узла 0, ваши 16 ГБ - это примерно четверть страницы таблиц, четверть разделяемой памяти, полуанонимная программная память и некоторые различные мелочи. Обратите внимание, что доступная файловая память, плюс свободная, составляет всего десятки МБ, а не большой. Он не сможет предоставить вам еще один ГБ или около того общей памяти.

Таблицы страниц съедают вас заживо. Возможно, у вас не включены огромные страницы, которые Oracle рекомендует для баз данных, и Red Hat тоже.