Linux OOM-Kill warum?


7

. Grüße, Mitadministratoren. Ich poste in der Hoffnung, Licht in die OOM-Kills zu bringen, die eine der Maschinen meines Unternehmens heimsuchen. Ich kann mich nicht entscheiden, ob es sich um legitime OOMs handelt oder nicht.

Es ist ein Centos 6.x mit Kernel 2.6.32-279.1.1.el6.x86_64.

Ram 8 GB, CPU athlon2-x4.

Die großen Prozesse sind MySQL und VMware Player 4 mit maximal 2 bzw. 4 GB ständig zugewiesenem RAM plus etwas Overhead. (VMware wird aufgrund ihrer Größe getötet.)

Es laufen andere Dämonen als diese 2, aber sie sind sehr klein und sehr leicht geladen, so dass ich nicht verstehe, wo die verbleibenden 1 / 1,5 Gig RAM verschwinden würden, ohne den riesigen Tausch zu zählen ...

Außerdem treten die Kills nur auf, während nachts die Backup-Cronjobs ausgeführt werden. (Dies sind einfache Shell-Skripte mit Standardtools, die einige Datenbanken sichern und einige Web- und Postfachverzeichnisse komprimieren.)

Hier hat es zum Beispiel einen mysqldump gemacht - und es ist das erste Mal, dass es mit dieser speziellen Aufgabe passiert. Es passierte fast jedes Mal, auch in Verbindung mit einem 'Seitenzuordnungsfehler', wenn ich Rsyncs oder Zips eines großen Verzeichnisbaums (~ 1 Million kleine Dateien) ausführte. ABER ich habe das alles auf eine andere Maschine mit zfs verschoben: Nach dieser Operation ließ mich der Mörder für eine Weile allein.

Ich hasse es, dass ich, nachdem ich monatelang mit dem Thema jongliert, jeden Thread im Internet gelesen und erneut gelesen habe, die Informationen immer noch nicht mit meinem Fall in Verbindung bringen kann. Es gibt Tausch, warum tauscht es nicht anstatt zu töten? Und wer nimmt überhaupt den ganzen Widder? (Am Anfang gab es ein paar legitime Speicherlecks und ich habe sie bekommen.) Kann auch keine Fragmentierung sein, da die fehlgeschlagenen Anforderungen in der Größenordnung Null sind.

Ich füge einige Daten vor den eigentlichen Kill-Protokollen ein:

vm.swappiness = 100
vm.vfs_cache_pressure = 5000
vm.min_free_kbytes = 262144

(Diese habe ich hinzugefügt, um das Problem zu beheben. Sie sind wahrscheinlich etwas extrem, aber es läuft trotzdem reibungslos.)

Ich habe vergeblich auch mit overcommit_memory = 2 experimentiert. Soll das nicht den Mörder deaktivieren?

Dies ist der normale Speicherstatus des Systems. Beachten Sie, dass der RAM von vmware aufgrund des mmap-ed vmem als Cache zählt. Übrigens ist vmware so eingestellt, dass der VM-Speicher zurückgefordert / ausgetauscht werden kann. Und das tut es niemals.

           Insgesamt verwendete kostenlose gemeinsam genutzte Puffer zwischengespeichert
Mem: 7800792 7400032 400760 0 61100 4449196
- / + Puffer / Cache: 2889736 4911056
Swap: 8388600 761588 7627012

SwapCached: 286648 kB
Seitentabellen: 40200 kB
CommitLimit: 15409312 kB
Committed_AS: 8099460 kB
AnonHugePages: 192512 kB

Knoten 0, Zone DMA 4 1 1 3 1 1 0 0 1 1 3 
Knoten 0, Zone DMA32 378 1476 2541 1491 328 240 74 28 8 0 0 
Knoten 0, Zone Normal 1555 124 956 1825 659 175 54 31 15 0 0 

Endlich die OOM:


2. Januar 21:37:38: vmware-vmx hat oom-kill aufgerufen: gfp_mask = 0xd0, order = 0, oom_adj = 0, oom_score_adj = 0
2. Januar 21:37:38: vmware-vmx cpuset = / mems_allowed = 0
2. Januar 21:37:38: Pid: 19635, comm: vmware-vmx Nicht verdorben 2.6.32-279.1.1.el6.x86_64 # 1
2. Januar 21:37:38: Anrufverfolgung:
2. Januar 21:37:38: []? cpuset_print_task_mems_allowed + 0x91 / 0xb0
2. Januar 21:37:38: []? dump_header + 0x90 / 0x1b0
2. Januar 21:37:38: []? __delayacct_freepages_end + 0x2e / 0x30
2. Januar 21:37:38: []? security_real_capable_noaudit + 0x3c / 0x70
2. Januar 21:37:38: []? oom_kill_process + 0x82 / 0x2a0
2. Januar 21:37:38: []? select_bad_process + 0xe1 / 0x120
2. Januar 21:37:38: []? out_of_memory + 0x220 / 0x3c0
2. Januar 21:37:38: []? __alloc_pages_nodemask + 0x89e / 0x940
2. Januar 21:37:38: []? alloc_pages_current + 0xaa / 0x110
2. Januar 21:37:38: []? __get_free_pages + 0xe / 0x50
2. Januar 21:37:38: []? __pollwait + 0xb4 / 0xf0
2. Januar 21:37:38: []? eventfd_poll + 0x7d / 0x80
2. Januar 21:37:38: []? do_sys_poll + 0x29b / 0x520
2. Januar 21:37:38: []? __pollwait + 0x0 / 0xf0
2. Januar 21:37:38: []? Pollwake + 0x0 / 0x60
2. Januar 21:37:38: []? Pollwake + 0x0 / 0x60
2. Januar 21:37:38: []? Pollwake + 0x0 / 0x60
2. Januar 21:37:38: []? Pollwake + 0x0 / 0x60
2. Januar 21:37:38: []? Pollwake + 0x0 / 0x60
2. Januar 21:37:38: []? Pollwake + 0x0 / 0x60
2. Januar 21:37:38: []? Pollwake + 0x0 / 0x60
2. Januar 21:37:38: []? Pollwake + 0x0 / 0x60
2. Januar 21:37:38: []? Pollwake + 0x0 / 0x60
2. Januar 21:37:38: []? read_tsc + 0x9 / 0x20
2. Januar 21:37:38: []? ktime_get_ts + 0xa9 / 0xe0
2. Januar 21:37:38: []? poll_select_set_timeout + 0x8d / 0xa0
2. Januar 21:37:38: []? sys_ppoll + 0x4c / 0x180
2. Januar 21:37:38: []? system_call_fastpath + 0x16 / 0x1b
2. Januar 21:37:38: Mem-Info:
2. Januar 21:37:38: Knoten 0 DMA pro CPU:
2. Januar 21:37:38: CPU 0: hi: 0, btch: 1 usd: 0
2. Januar 21:37:38: CPU 1: hi: 0, btch: 1 usd: 0
2. Januar 21:37:38: CPU 2: hi: 0, btch: 1 usd: 0
2. Januar 21:37:38: CPU 3: hi: 0, btch: 1 usd: 0
2. Januar 21:37:38: Knoten 0 DMA32 pro CPU:
2. Januar 21:37:38: CPU 0: hi: 186, btch: 31 usd: 175
2. Januar 21:37:38: CPU 1: hi: 186, btch: 31 usd: 40
2. Januar 21:37:38: CPU 2: hi: 186, btch: 31 usd: 180
2. Januar 21:37:38: CPU 3: hi: 186, btch: 31 usd: 152
2. Januar 21:37:38: Knoten 0 Normal pro CPU:
2. Januar 21:37:38: CPU 0: hi: 186, btch: 31 usd: 170
2. Januar 21:37:38: CPU 1: hi: 186, btch: 31 usd: 67
2. Januar 21:37:38: CPU 2: hi: 186, btch: 31 usd: 108
2. Januar 21:37:38: CPU 3: hi: 186, btch: 31 usd: 63
2. Januar 21:37:38: active_anon: 1467089 inactive_anon: 263165 isoliertes_anon: 64
2. Januar 21:37:38: active_file: 12404 inactive_file: 65792 isoliert_file: 96
2. Januar 21:37:38: nicht vorhersehbar: 2 schmutzig: 66080 Rückschreiben: 1 instabil: 0
2. Januar 21:37:38: kostenlos: 73888 slab_reclaimable: 8971 slab_unreclaimable: 10661
2. Januar 21:37:38: zugeordnet: 780904 shmem: 1035969 pagetables: 10566 bounce: 0
2. Januar 21:37:38: Knoten 0 DMA frei: 15688 kB min: 500 kB niedrig: 624 kB hoch: 748 kB active_anon: 0 kB inactive_anon: 0 kB active_file: 0 kB inactive_file: 0 kB nicht vorhersehbar: 0 kB isoliert (anon): 0 kB isoliert (Datei): 0 kB vorhanden: 15284kB mlocked: 0kB Dirty: 0kB Writeback: 0kB zugeordnet: 0kB shmem: 0kB slab_reclaimable: 0kB slab_unreclaimable: 0kB kernel_stack: 0kB pagetables: 0kB unstable: 0kB bounce: 0kB writeback_tmsc: 0kB bounce: 0kB writeback_tmsc: Ja
2. Januar 21:37:38: lowmem_reserve []: 0 3254 7799 7799
2. Januar 21:37:38: Knoten 0 DMA32 frei: 127608 kB min: 109180 kB niedrig: 136472 kB hoch: 163768 kB active_anon: 2209600 kB inactive_anon: 441980 kB active_file: 35784 kB inactive_file: 207948 kB nicht vorhersehbar: 8 kB isoliert (anon): vorhanden: 3333024kB mlocked: 8kB Dirty: 211888kB Writeback: 0kB zugeordnet: 955900kB shmem: 1376604kB slab_reclaimable: 20276kB slab_unreclaimable: 6460kB kernel_stack: 488kB pagetables: 8856kB unstable: Nein
2. Januar 21:37:38: lowmem_reserve []: 0 0 4545 4545
2. Januar 21:37:38: Knoten 0 Normal frei: 152256 kB min: 152456 kB niedrig: 190568 kB hoch: 228684 kB active_anon: 3658756 kB inactive_anon: 610680 kB active_file: 13832 kB inactive_file: 55220 kB nicht vorhersehbar: 0 kB isoliert (ank): vorhanden: 4654080kB mlocked: 0kB Dirty: 52432kB Writeback: 4kB zugeordnet: 2167716kB shmem: 2767272kB slab_reclaimable: 15608kB slab_unreclaimable: 36184kB kernel_stack: 3016kB pagetables: 33408kB 2: Nein
2. Januar 21:37:38: lowmem_reserve []: 0 0 0 0
2. Januar 21:37:38: Knoten 0 DMA: 4 * 4 kB 1 * 8 kB 1 * 16 kB 3 * 32 kB 1 * 64 kB 1 * 128 kB 0 * 256 kB 0 * 512 kB 1 * 1024 kB 1 * 2048 kB 3 * 4096 kB = 15688 kB
2. Januar 21:37:38: Knoten 0 DMA32: 240 * 4 kB 925 * 8 kB 1553 * 16 kB 748 * 32 kB 253 * 64 kB 152 * 128 kB 56 * 256 kB 28 * 512 kB 6 * 1024 kB 0 * 2048 kB 0 * 4096 kB = 127608 kB
2. Januar 21:37:38: Knoten 0 Normal: 1155 * 4 kB 1362 * 8 kB 2962 * 16 kB 860 * 32 kB 330 * 64 kB 113 * 128 kB 23 * 256 kB 18 * 512 kB 9 * 1024 kB 1 * 2048 kB 0 * 4096 kB = 152380 kB
2. Januar 21:37:38: 1162322 Seiten-Cache-Seiten insgesamt
2. Januar 21:37:38: 48040 Seiten im Swap-Cache
2. Januar 21:37:38: Cache-Statistiken austauschen: 3148787 hinzufügen, 3100747 löschen, 1726176/2015458 finden
2. Januar 21:37:38: Freier Tausch = 7750696kB
2. Januar 21:37:38: Total Swap = 8388600kB
2. Januar 21:37:38: 2031600 Seiten RAM
2. Januar 21:37:38: 81402 Seiten reserviert
2. Januar 21:37:38: 1987047 Seiten geteilt
2. Januar 21:37:38: 707527 Seiten nicht geteilt
2. Januar 21:37:38: [pid] uid tgid total_vm rss cpu oom_adj oom_score_adj name
2. Januar 21:37:38: [457] 0 457 2673 90 1 -17 -1000 udevd
2. Januar 21:37:38: [1261] 0 1261 62271 293 0 0 0 rsyslogd
2. Januar 21:37:38: [1275] 0 1275 1171 91 0 0 0 mdadm
2. Januar 21:37:38: [1284] 81 1284 5382 159 1 0 0 dbus-daemon
2. Januar 21:37:38: [1295] 70 1295 6946 160 2 0 0 Avahi-Daemon
2. Januar 21:37:38: [1296] 70 1296 6914 27 1 0 0 Avahi-Daemon
2. Januar 21:37:38: [1344] 68 1344 6292 346 0 0 0 hald
2. Januar 21:37:38: [1345] 0 1345 4524 152 0 0 0 Haldrunner
2. Januar 21:37:38: [1391] 0 1391 5053 87 2 0 0 hald-addon-inpu
2. Januar 21:37:38: [1406] 0 1406 6014 103 2 0 0 vmware-usbarbit
2. Januar 21:37:38: [1420] 0 1420 16028 119 1 -17 -1000 sshd
2. Januar 21:37:38: [1439] 38 1439 7539 146 0 0 0 ntpd
2. Januar 21:37:38: [1483] 0 1483 29309 135 2 0 0 crond
2. Januar 21:37:38: [1494] 0 1494 5362 47 2 0 0 atd
2. Januar 21:37:38: [1511] 501 1511 25371 5751 1 0 0 Xvnc
2. Januar 21:37:38: [1521] 501 1521 26513 66 0 0 0 sh
2. Januar 21:37:38: [1532] 512 1532 21634 461 0 0 0 Xvnc
2. Januar 21:37:38: [1541] 501 1541 5006 82 1 0 0 dbus-launch
2. Januar 21:37:38: [1542] 501 1542 5382 141 2 0 0 dbus-daemon
2. Januar 21:37:38: [1546] 501 1546 5629 283 0 0 0 xfconfd
2. Januar 21:37:38: [1551] 501 1551 28034 71 3 0 0 gpg-Agent
2. Januar 21:37:38: [1561] 501 1561 57668 351 1 0 0 xfce4-Sitzung
2. Januar 21:37:38: [1565] 501 1565 49604 290 2 0 0 xfsettingsd
2. Januar 21:37:38: [1567] 501 1567 55385 549 1 0 0 xfwm4
2. Januar 21:37:38: [1569] 501 1569 59719 1148 2 0 0 xfce4-panel
2. Januar 21:37:38: [1571] 501 1571 56642 311 1 0 0 Thunar
2. Januar 21:37:38: [1573] 501 1573 81823 695 3 0 0 xfdesktop
2. Januar 21:37:38: [1582] 501 1582 56799 339 1 0 0 xfce4-settings-
2. Januar 21:37:38: [1584] 0 1584 520550 188 1 0 0 console-kit-dae
2. Januar 21:37:38: [1650] 501 1650 55456 487 3 0 0 Panel-6-Systray
2. Januar 21:37:38: [1654] 512 1654 26513 65 0 0 0 sh
2. Januar 21:37:38: [1669] 512 1669 5006 68 2 0 0 dbus-launch
2. Januar 21:37:38: [1670] 512 1670 5383 135 0 0 0 dbus-daemon
2. Januar 21:37:38: [1674] 512 1674 5629 264 3 0 0 xfconfd
2. Januar 21:37:38: [1680] 512 1680 28034 70 3 0 0 gpg-Agent
2. Januar 21:37:38: [1683] 500 1683 27549 6909 2 0 0 Xvnc
2. Januar 21:37:38: [1694] 512 1694 57667 346 2 0 0 xfce4-Sitzung
2. Januar 21:37:38: [1699] 512 1699 55386 461 1 0 0 xfwm4
2. Januar 21:37:38: [1701] 512 1701 66152 1404 2 0 0 xfce4-panel
2. Januar 21:37:38: [1703] 512 1703 56617 235 0 0 0 Thunar
2. Januar 21:37:38: [1705] 512 1705 85537 529 1 0 0 xfdesktop
2. Januar 21:37:38: [1707] 512 1707 49604 285 1 0 0 xfsettingsd
2. Januar 21:37:38: [1715] 512 1715 56799 312 0 0 0 xfce4-settings-
2. Januar 21:37:38: [1717] 512 1717 55456 438 3 0 0 Panel-4-Systray
2. Januar 21:37:38: [1721] 500 1721 26513 66 0 0 0 sh
2. Januar 21:37:38: [1740] 500 1740 5006 68 1 0 0 dbus-start
2. Januar 21:37:38: [1741] 500 1741 5383 167 2 0 0 dbus-daemon
2. Januar 21:37:38: [1745] 500 1745 5629 275 1 0 0 xfconfd
2. Januar 21:37:38: [1757] 500 1757 28070 139 3 0 0 gpg-Agent
2. Januar 21:37:38: [1758] 0 1758 1542 83 3 0 0 pptpd
2. Januar 21:37:38: [1774] 500 1774 57667 356 0 0 0 xfce4-Sitzung
2. Januar 21:37:38: [1779] 500 1779 55674 785 2 0 0 xfwm4
2. Januar 21:37:38: [1781] 500 1781 65790 1363 1 0 0 xfce4-panel
2. Januar 21:37:38: [1783] 500 1783 82194 451 0 0 0 Thunar
2. Januar 21:37:38: [1785] 500 1785 85642 813 2 0 0 xfdesktop
2. Januar 21:37:38: [1790] 500 1790 49604 283 2 0 0 xfsettingsd
2. Januar 21:37:38: [1800] 500 1800 38863 313 3 0 0 xterm
2. Januar 21:37:38: [1807] 500 1807 56798 353 3 0 0 xfce4-settings-
2. Januar 21:37:38: [1808] 500 1808 55456 470 1 0 0 Panel-6-Systray
2. Januar 21:37:38: [1811] 500 1811 27074 69 2 0 0 Bash
2. Januar 21:37:38: [1823] 0 1823 4704 145 0 0 0 smartd
2. Januar 21:37:38: [1831] 0 1831 1014 48 2 0 0 mingetty
2. Januar 21:37:38: [1833] 0 1833 1014 48 0 0 0 mingetty
2. Januar 21:37:38: [1835] 0 1835 1014 48 1 0 0 mingetty
2. Januar 21:37:38: [1837] 0 1837 1014 48 2 0 0 mingetty
2. Januar 21:37:38: [1839] 0 1839 1014 49 3 0 0 mingetty
2. Januar 21:37:38: [1843] 0 1843 1014 48 0 0 0 mingetty
2. Januar 21:37:38: [2025] 0 2025 25340 59 2 0 0 vmnet-bridge
2. Januar 21:37:38: [2033] 0 2033 25333 15 1 0 0 vmnet-netifup
2. Januar 21:37:38: [2058] 0 2058 27069 101 0 0 0 vmnet-natd
2. Januar 21:37:38: [2060] 0 2060 25333 15 1 0 0 vmnet-netifup
2. Januar 21:37:38: [2097] 0 2097 30105 82 2 0 0 vmware-authdlau
2. Januar 21:37:38: [2981] 500 2981 36335 76 0 0 0 su
2. Januar 21:37:38: [2984] 0 2984 27074 233 1 0 0 Bash
2. Januar 21:37:38: [6347] 500 6347 39207 406 2 0 0 xterm
2. Januar 21:37:38: [6349] 500 6349 27074 70 0 0 0 Bash
2. Januar 21:37:38: [6407] 500 6407 36335 77 0 0 0 su
2. Januar 21:37:38: [6410] 0 6410 27074 251 0 0 0 Bash
2. Januar 21:37:38: [6481] 0 6481 57857 154 0 0 0 mysql
2. Januar 21:37:38: [6911] 0 6911 19820 120 1 0 0 master
2. Januar 21:37:38: [6914] 89 6914 19889 122 0 0 0 qmgr
2. Januar 21:37:38: [6918] 89 6918 19839 141 0 0 0 tlsmgr
2. Januar 21:37:38: [17572] 0 17572 103460 2142 3 0 0 Thunar
2. Januar 21:37:38: [21227] 500 21227 38801 594 0 0 0 xterm
2. Januar 21:37:38: [21229] 500 21229 27074 73 0 0 0 Bash
2. Januar 21:37:38: [29713] 500 29713 36870 214 3 0 0 lftp
2. Januar 21:37:38: [32170] 500 32170 38815 184 0 0 0 xterm
2. Januar 21:37:38: [32172] 500 32172 27074 77 1 0 0 bash
2. Januar 21:37:38: [32189] 500 32189 36335 86 1 0 0 su
2. Januar 21:37:38: [32197] 0 32197 27074 93 1 0 0 Bash
2. Januar 21:37:38: [16025] 0 16025 2070 89 3 0 0 pptpctrl
2. Januar 21:37:38: [16026] 0 16026 5544 108 1 0 0 pppd
2. Januar 21:37:38: [31174] 0 31174 27073 175 1 0 0 mysqld_safe
2. Januar 21:37:38: [31909] 27 31909 1143356 587238 1 0 0 mysqld
2. Januar 21:37:38: [32037] 0 32037 26546 169 0 0 0 mysqld_safe
2. Januar 21:37:38: [32437] 495 32437 136524 7673 1 0 0 mysqld
2. Januar 21:37:38: [32449] 0 32449 26546 169 2 0 0 mysqld_safe
2. Januar 21:37:38: [368] 493 368 211813 3831 0 0 0 mysqld
2. Januar 21:37:38: [884] 500 884 27074 310 1 0 0 Bash
2. Januar 21:37:38: [1065] 501 1065 122130 2881 3 0 0 vmplayer
2. Januar 21:37:38: [2031] 500 2031 38570 281 0 0 0 xterm
2. Januar 21:37:38: [2034] 500 2034 27074 180 0 0 0 Bash
2. Januar 21:37:38: [2051] 500 2051 36335 140 0 0 0 su
2. Januar 21:37:38: [2055] 0 2055 27074 181 2 0 0 Bash
2. Januar 21:37:38: [16591] 501 16591 77851 712 3 0 0 vmware-unit-he
2. Januar 21:37:38: [16803] 0 16803 26883 237 1 0 0 Uhr
2. Januar 21:37:38: [19635] 501 19635 1693624 793343 1 0 0 vmware-vmx
2. Januar 21:37:38: [2186] 0 2186 38139 158 0 0 0 proftpd
2. Januar 21:37:38: [5289] 500 5289 38992 979 3 0 0 xterm
2. Januar 21:37:38: [5291] 500 5291 27074 188 2 0 0 Bash
2. Januar 21:37:38: [5344] 500 5344 36335 148 1 0 0 su
2. Januar 21:37:38: [5361] 0 5361 27074 350 0 0 0 Bash
2. Januar 21:37:38: [18529] 500 18529 26514 227 0 0 0 mysql-workbench
2. Januar 21:37:38: [18534] 500 18534 26514 226 1 0 0 catchsegv
2. Januar 21:37:38: [18536] 500 18536 26514 77 2 0 0 catchsegv
2. Januar 21:37:38: [18537] 500 18537 227088 7571 2 0 0 mysql-workbench
2. Januar 21:37:38: [409] 0 409 131527 1556 1 0 0 geany
2. Januar 21:37:38: [410] 0 410 2054 92 2 0 0 gnome-pty-helpe
2. Januar 21:37:38: [411] 0 411 27074 238 1 0 0 Bash
2. Januar 21:37:38: [5750] 0 5750 2672 92 0 -17 -1000 udevd
2. Januar 21:37:38: [5753] 0 5753 2672 87 0 -17 -1000 udevd
2. Januar 21:37:38: [5788] 0 5788 10640 594 3 0 0 openvpn
2. Januar 21:37:38: [5792] 0 5792 10640 598 3 0 0 openvpn
2. Januar 21:37:38: [5800] 99 5800 11135 587 3 0 0 openvpn
2. Januar 21:37:38: [21552] 0 21552 110137 2111 1 0 0 httpd
2. Januar 21:37:38: [21555] 48 21555 139593 7684 3 0 0 httpd
2. Januar 21:37:38: [21558] 48 21558 140002 8513 3 0 0 httpd
2. Januar 21:37:38: [23283] 497 23283 9846 193 1 0 0 dkim-filter
2. Januar 21:37:38: [23284] 497 23284 33979 524 1 0 0 dkim-filter
2. Januar 21:37:38: [6819] 0 6819 2070 152 3 0 0 pptpctrl
2. Januar 21:37:38: [6820] 0 6820 5544 237 1 0 0 pppd
2. Januar 21:37:39: [17208] 48 17208 112903 4566 0 0 0 httpd
2. Januar 21:37:39: [17209] 48 17209 138359 5895 0 0 0 httpd
2. Januar 21:37:39: [17210] 48 17210 138693 7341 3 0 0 httpd
2. Januar 21:37:39: [1255] 0 1255 24571 713 0 0 0 sshd
2. Januar 21:37:39: [1278] 0 1278 13874 396 1 0 0 SFTP-Server
2. Januar 21:37:39: [14064] 48 14064 138202 6622 3 0 0 httpd
2. Januar 21:37:39: [14065] 48 14065 139625 7776 1 0 0 httpd
2. Januar 21:37:39: [16899] 48 16899 138543 7523 3 0 0 httpd
2. Januar 21:37:39: [32639] 89 32639 19924 722 0 0 0 Abholung
2. Januar 21:37:39: [4973] 48 4973 136179 4973 3 0 0 httpd
2. Januar 21:37:39: [4976] 48 4976 138478 7371 0 0 0 httpd
2. Januar 21:37:39: [4977] 48 4977 136173 4777 3 0 0 httpd
2. Januar 21:37:39: [5662] 0 5662 35030 336 0 0 0 crond
2. Januar 21:37:39: [5663] 0 5663 2297 282 2 0 0 sh
2. Januar 21:37:39: [5664] 0 5664 2298 302 0 0 0 Bash
2. Januar 21:37:39: [5665] 0 5665 15910 437 0 0 0 mutt
2. Januar 21:37:39: [5947] 0 5947 2298 337 1 0 0 Bash
2. Januar 21:37:39: [6416] 48 6416 110170 2070 3 0 0 httpd
2. Januar 21:37:39: [6625] 48 6625 110170 1895 0 0 0 httpd
2. Januar 21:37:39: [6642] 0 6642 32679 1632 2 0 0 mysqldump
2. Januar 21:37:39: Nicht genügend Speicher: Töte den Prozess 19635 (vmware-vmx) mit 199 oder opfere das Kind
2. Januar 21:37:39: Abgebrochener Prozess 19635, UID 501, (vmware-vmx) gesamt-vm: 6774496 kB, anon-rss: 74020 kB, Datei-rss: 3099352 kB


Antworten:


7

Nun, ich denke deine min_free_kbytes sind wirklich hoch. Ich habe eine 16 GB Maschine und meine min ist 67584kB.

Beachten Sie, dass der RAM von vmware aufgrund des mmap-ed vmem als Cache zählt

Das ist nicht immer richtig. Nur wenn die Datei mmapped () in MAP_SHARED geöffnet ist, ist dies wahr. Andernfalls werden schmutzige Seiten ausgetauscht. Welches ist der Fall für Sie, wie es scheint. Wenn Sie die gemeldete Verwendung dieses Prozesses am Ende Ihrer Ausgabe addieren und in Seiten konvertieren (4 KB). Dies entspricht dem RSS, der im Task-Dump für diesen Prozess gemeldet wurde.

rss:74020kB, file-rss:3099352kB
74020 + 3099352 = 3173372
3173372 / 4 = 793343

entspricht ..

[19635]   501 19635  1693624   793343   1       0        0 vmware-vmx

Warum du OOM-tötest. Das ist etwas kniffliger.

Wenn Sie minden Kernel erreichen , möchten Sie Speicher bis zu highWasserzeichenbytes wiederherstellen . Der Kernel hat also eine Prüfung; Wenn die Menge an Speicher, die zum Zurückfordern aus dem Datei-Cache verfügbar ist, nicht ausreicht, um Sie wieder in das highWasserzeichen dieser Zone zu versetzen , wird es nicht die Mühe machen, den Datei-Cache freizugeben und direkt mit dem Zurückfordern aus dem anonymen Speicher fortzufahren.

Wir fordern nie zurückactive . Damit -

if (file_inactive > zone_high - free_mem) then
   reclaim (zone_high - free_mem) file inactive pages
else
   reclaim from anonymous pool

In deinem Fall ist das so 55220 is not greater than 228684-152456 (76428).

Der Grund, warum dies ein OOM-Kill und kein Tausch ist, ist, dass minder Kernel in einen direct_reclaimModus wechselt, wenn Sie das Wasserzeichen durchbrechen . In diesem Modus kann das Ausführen von E / A zum Freigeben von Speicher nicht ausgeführt werden, da dies zu einem Deadlock führen kann.

Ihr Host hätte zu diesem Zeitpunkt getauscht, aber Ihr Host hat schneller zugewiesen, als er austauschen kann.

Der beste Weg, dies zu beheben, besteht darin, das minWasserzeichen auf einen niedrigeren Wert zu reduzieren - oder besser noch mehr Speicher zu erhalten und / oder die Anzahl der auf dem Computer ausgeführten Dinge zu reduzieren.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.