У меня старый устаревший сервер со странной проблемой подкачки.
Я знаю, что раздел подкачки слишком мал, я собираюсь добавить файл подкачки, но через несколько часов после перезагрузки ситуация такова:
free -m
total used free shared buffers cached
Mem: 15922 15806 116 0 313 13345
-/+ buffers/cache: 2147 13775
Swap: 2047 2042 4
База данных Oracle установлена, но почти не используется. Хотелось бы понять, почему так происходит распределение памяти. Я имею ввиду 13345 кешированных, значит бесплатно. Зачем заливать своп?
Предыдущий системный администратор настраивал подкачку для: 3.
Огромные страницы не настроено.
Я видел похожий пост, но без решения для понимания. Ответ здесь: linux redhat 5.4 - свопинг, пока память еще доступна говорит о numa, поэтому я немного покопался (я dba, а не системный администратор, извините, если я что-то пропущу).
grep NUMA=y /boot/config-`uname -r`
CONFIG_NUMA=y
CONFIG_K8_NUMA=y
CONFIG_X86_64_ACPI_NUMA=y
CONFIG_ACPI_NUMA=y
dmesg | grep -i numa
NUMA: Using 63 for the hash shift.
Итак, вопрос: как я могу понять почему эта машина меняет местами?
Обновить С помощью: vmstat 2
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b swpd free buff cache si so bi bo in cs us sy id wa st
4 0 2090852 122224 324056 13679328 320 0 498 1898 1088 3555 32 10 56 2 0
1 0 2090724 139740 324068 13680984 64 0 76 932 1028 3534 7 2 90 2 0
0 0 2090724 132416 324068 13681436 0 0 16 240 1016 3401 3 1 96 1 0
4 0 2090660 116916 324084 13683404 0 0 72 1396 1070 3617 11 9 80 1 0
0 0 2090420 126544 324084 13687008 128 0 188 1872 1068 3436 35 8 56 2 0
Обновление 3
ipcs -ma
------ Shared Memory Segments --------
key shmid owner perms bytes nattch status
0x61a4d538 5210113 oracle 660 4096 0
0xba8cafdc 5242883 oracle 660 4096 0
0x16621634 5308420 oracle 660 4096 0
0xc15f3dac 5373957 oracle 660 4096 0
------ Semaphore Arrays --------
key semid owner perms nsems
0x24690d60 98304 oracle 660 125
0x24690d61 131073 oracle 660 125
0x24690d62 163842 oracle 660 125
0x24690d63 196611 oracle 660 125
0x24690d64 229380 oracle 660 125
0x24690d65 262149 oracle 660 125
0x24690d66 294918 oracle 660 125
0x24690d67 327687 oracle 660 125
0x24690d68 360456 oracle 660 125
0x6285541c 491529 oracle 660 125
0x6285541d 524298 oracle 660 125
0x6285541e 557067 oracle 660 125
0x6285541f 589836 oracle 660 125
0x62855420 622605 oracle 660 125
0x62855421 655374 oracle 660 125
0x62855422 688143 oracle 660 125
0x62855423 720912 oracle 660 125
0x62855424 753681 oracle 660 125
0xaee7ccbc 884754 oracle 660 125
0xaee7ccbd 917523 oracle 660 125
0xaee7ccbe 950292 oracle 660 125
0xaee7ccbf 983061 oracle 660 125
0xaee7ccc0 1015830 oracle 660 125
0xaee7ccc1 1048599 oracle 660 125
0xaee7ccc2 1081368 oracle 660 125
0xaee7ccc3 1114137 oracle 660 125
0xaee7ccc4 1146906 oracle 660 125
0xfb4a455c 1277979 oracle 660 125
0xfb4a455d 1310748 oracle 660 125
0xfb4a455e 1343517 oracle 660 125
0xfb4a455f 1376286 oracle 660 125
0xfb4a4560 1409055 oracle 660 125
0xfb4a4561 1441824 oracle 660 125
0xfb4a4562 1474593 oracle 660 125
0xfb4a4563 1507362 oracle 660 125
0xfb4a4564 1540131 oracle 660 125
------ Message Queues --------
key msqid owner perms used-bytes messages
Не хорошо. Если у вас есть что-нибудь, кроме очень случайного si
ты в основном вне области "хорошего обмена". И ваша система делает это все время. SwapIn означает, что какая-то программа ожидает, и это потенциально означает, что пользователь испытывает замедление (локальный или удаленный пользователь).
Я все о том хорошем обмене. Что означает в основном so
вытеснить раздутый хлам из вашей драгоценной оперативной памяти; поскольку он раздут, он находится на диске, и никем не используется с очень-очень-очень случайной активностью подкачки.
С Oracle вы столкнулись с забавной вещью, которую я видел раньше: каким-то образом Oracle сообщает о своем SGA как о «кэше» (если я правильно помню, потому что это анонимный mmap
). Но будучи анонимным, это не память, которую система может просто удалить в любой момент, поэтому она не free
! Напротив, он очень часто используется. Oracle часто использует также фактический оставшийся системный кеш при чтении файлов данных, что может вызвать большую нагрузку на кеш-память (поведение по умолчанию).
Так что это один из многих случаев, когда free
вводит вас в заблуждение, что весь «кеш» следует рассматривать как «бесплатный». Это эмпирическое правило применимо только для файлового сервера, доступного в основном только для чтения. (Думаю, поэтому авторы free
поставили строку, в которой говорится, что "кеш" используется " выше строка, где подразумевается "кеш", "свободна".)
И не настраивайся swappiness
вообще до тех пор, пока система занята свопом на 100%. Это ... неразумно.
Бьюсь об заклад, ваш SGA не 2 ГБ, а может быть больше 10 ГБ или даже больше. Я думаю, что если вы сконфигурируете SGA на 6 ГБ, вы увидите, что количество свопингов уменьшится, и гораздо меньше вещей будет отправлено на свопинг. По мере того, как вы будете увеличивать его шаг за шагом, вы увидите, как возрастает давление.
Если у вас нет большого количества активных страниц (si / so в vmstat), то вам не о чем беспокоиться. Ядро предпочитает помещать части программного кода, которые не используются активно, для подкачки, чтобы оно могло хранить больше файлов БД в ОЗУ (кэшироваться бесплатно).
Это отличная статья о свопе, которую я нашел, и о том, как ее использовать не всегда плохо. https://chrisdown.name/2018/01/02/in-defence-of-swap.html