Meine Probleme wurden durch ein fehlerhaftes Speichermodul und möglicherweise eine defekte Kernel-Binärdatei verursacht.
Ich habe gerade meinen PC mit brandneuer Hardware gebootet. Ich habe Debian 6.0 AMD64 schon einmal ausgeführt und dort keine Änderung vorgenommen (im wahrsten Sinne des Wortes; ich habe nur die Festplatten vom alten Motherboard getrennt und sie wieder mit dem neuen verbunden), aber etwas Merkwürdiges gefunden:
- Ich habe 4 x 8 GB RAM physisch installiert
- Das UEFI / BIOS-Setup meldet 16383 MB RAM
- Linux
free -m
meldet 2985 MB RAM
2985 MB scheinen zu nahe an der magischen 3-GB-Marke zu liegen, als dass es sich um einen reinen Zufall handeln könnte, sondern um uname -r
Drucke 2.6.32-5-amd64
. eindeutig ein 64-Bit-Kernel, der alles ist, was jemals auf dem von mir verwendeten Systemlaufwerk installiert wurde. Das neue Motherboard ist ein Asus M5A97 Pro mit vier DDR3-Steckplätzen, die angeblich 8-GB-Module unterstützen. Die Speichermodule selbst sind identisch, vier Corsair XMS3 PC12800 8 GB, zusammen gekauft.
Ich habe mich nicht im Detail im UEFI-Setup umgesehen, sondern es durchsucht und nichts gesehen, was geändert werden müsste, um große Mengen an RAM zu aktivieren.
Bearbeiten: Weitere Bestätigung, dass ich wirklich 64-Bit verwende:
# file `which free`
/usr/bin/free: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.18, stripped
#
Was ist damit los und was kann ich dagegen tun?
Bearbeiten Sie 2: dmesg, dmidecode und meminfo, wie gewünscht. Ich habe momentan keinen physischen Zugriff auf das System, muss also bis heute Abend warten, um einige Module herauszuholen und zu sehen, was das bewirkt. (Beachten Sie, dass dmidecode 3 x 8 GB plus einen leeren DIMM-Steckplatz meldet. Beachten Sie auch die MTRR-Nichtübereinstimmungsnachricht vom Kernel, die zu einem Verlust von 13 GB führt, was zumindest dem entspricht, was das Motherboard selbst meldet.)
# dmidecode --type memory
# dmidecode 2.9
SMBIOS 2.7 present.
Handle 0x0026, DMI type 16, 23 bytes
Physical Memory Array
Location: System Board Or Motherboard
Use: System Memory
Error Correction Type: Multi-bit ECC
Maximum Capacity: 32 GB
Error Information Handle: Not Provided
Number Of Devices: 4
Handle 0x0028, DMI type 17, 34 bytes
Memory Device
Array Handle: 0x0026
Error Information Handle: Not Provided
Total Width: 64 bits
Data Width: 64 bits
Size: 8192 MB
Form Factor: DIMM
Set: None
Locator: DIMM0
Bank Locator: BANK0
Type: <OUT OF SPEC>
Type Detail: Synchronous
Speed: 1333 MHz (0.8 ns)
Manufacturer: Manufacturer0
Serial Number: SerNum0
Asset Tag: AssetTagNum0
Part Number: Array1_PartNumber0
Handle 0x002A, DMI type 17, 34 bytes
Memory Device
Array Handle: 0x0026
Error Information Handle: Not Provided
Total Width: 64 bits
Data Width: 64 bits
Size: 8192 MB
Form Factor: DIMM
Set: None
Locator: DIMM1
Bank Locator: BANK1
Type: <OUT OF SPEC>
Type Detail: Synchronous
Speed: 1333 MHz (0.8 ns)
Manufacturer: Manufacturer1
Serial Number: SerNum1
Asset Tag: AssetTagNum1
Part Number: Array1_PartNumber1
Handle 0x002C, DMI type 17, 34 bytes
Memory Device
Array Handle: 0x0026
Error Information Handle: Not Provided
Total Width: 64 bits
Data Width: 64 bits
Size: 8192 MB
Form Factor: DIMM
Set: None
Locator: DIMM2
Bank Locator: BANK2
Type: <OUT OF SPEC>
Type Detail: Synchronous
Speed: 1333 MHz (0.8 ns)
Manufacturer: Manufacturer2
Serial Number: SerNum2
Asset Tag: AssetTagNum2
Part Number: Array1_PartNumber2
Handle 0x002E, DMI type 17, 34 bytes
Memory Device
Array Handle: 0x0026
Error Information Handle: Not Provided
Total Width: Unknown
Data Width: 64 bits
Size: No Module Installed
Form Factor: DIMM
Set: None
Locator: DIMM3
Bank Locator: BANK3
Type: Unknown
Type Detail: Synchronous
Speed: Unknown
Manufacturer: Manufacturer3
Serial Number: SerNum3
Asset Tag: AssetTagNum3
Part Number: Array1_PartNumber3
#
======================================================================
# cat /proc/meminfo
MemTotal: 3056820 kB
MemFree: 1470820 kB
Buffers: 390204 kB
Cached: 194660 kB
SwapCached: 0 kB
Active: 488024 kB
Inactive: 419096 kB
Active(anon): 231112 kB
Inactive(anon): 96660 kB
Active(file): 256912 kB
Inactive(file): 322436 kB
Unevictable: 0 kB
Mlocked: 0 kB
SwapTotal: 0 kB
SwapFree: 0 kB
Dirty: 8 kB
Writeback: 0 kB
AnonPages: 322320 kB
Mapped: 33012 kB
Shmem: 5472 kB
Slab: 613952 kB
SReclaimable: 597404 kB
SUnreclaim: 16548 kB
KernelStack: 2384 kB
PageTables: 19472 kB
NFS_Unstable: 0 kB
Bounce: 0 kB
WritebackTmp: 0 kB
CommitLimit: 1528408 kB
Committed_AS: 621464 kB
VmallocTotal: 34359738367 kB
VmallocUsed: 294484 kB
VmallocChunk: 34359429080 kB
HardwareCorrupted: 0 kB
HugePages_Total: 0
HugePages_Free: 0
HugePages_Rsvd: 0
HugePages_Surp: 0
Hugepagesize: 2048 kB
DirectMap4k: 9216 kB
DirectMap2M: 2054144 kB
DirectMap1G: 1048576 kB
#
======================================================================
# dmesg | grep -i memory
[ 0.000000] WARNING: BIOS bug: CPU MTRRs don't cover all of memory, losing 13295MB of RAM.
[ 0.000000] WARNING: at /tmp/buildd/linux-2.6-2.6.32/debian/build/source_amd64_none/arch/x86/kernel/cpu/mtrr/cleanup.c:1092 mtrr_trim_uncached_memory+0x2e6/0x311()
[ 0.000000] [<ffffffff814f7f1e>] ? mtrr_trim_uncached_memory+0x2e6/0x311
[ 0.000000] [<ffffffff814f7f1e>] ? mtrr_trim_uncached_memory+0x2e6/0x311
[ 0.000000] [<ffffffff814f7f1e>] ? mtrr_trim_uncached_memory+0x2e6/0x311
[ 0.000000] initial memory mapped : 0 - 20000000
[ 0.000000] init_memory_mapping: 0000000000000000-00000000bdf00000
[ 0.000000] PM: Registered nosave memory: 000000000009d000 - 000000000009e000
[ 0.000000] PM: Registered nosave memory: 000000000009e000 - 00000000000a0000
[ 0.000000] PM: Registered nosave memory: 00000000000a0000 - 00000000000e0000
[ 0.000000] PM: Registered nosave memory: 00000000000e0000 - 0000000000100000
[ 0.000000] PM: Registered nosave memory: 00000000bd94d000 - 00000000bd99c000
[ 0.000000] PM: Registered nosave memory: 00000000bd99c000 - 00000000bd9a6000
[ 0.000000] PM: Registered nosave memory: 00000000bd9a6000 - 00000000bdade000
[ 0.000000] PM: Registered nosave memory: 00000000bdade000 - 00000000bdaef000
[ 0.000000] PM: Registered nosave memory: 00000000bdaef000 - 00000000bdb02000
[ 0.000000] PM: Registered nosave memory: 00000000bdb02000 - 00000000bdb04000
[ 0.000000] PM: Registered nosave memory: 00000000bdb04000 - 00000000bdb0d000
[ 0.000000] PM: Registered nosave memory: 00000000bdb0d000 - 00000000bdb13000
[ 0.000000] PM: Registered nosave memory: 00000000bdb13000 - 00000000bdb75000
[ 0.000000] PM: Registered nosave memory: 00000000bdb75000 - 00000000bdd78000
[ 0.000000] Memory: 3046732k/3111936k available (3075k kernel code, 4728k absent, 60476k reserved, 1879k data, 584k init)
[ 1.636730] Freeing initrd memory: 9501k freed
[ 1.647370] Freeing unused kernel memory: 584k freed
[ 4.876602] [TTM] Zone kernel: Available graphics memory: 1528410 kiB.
[ 4.876615] [drm] radeon: 256M of VRAM memory ready
[ 4.876617] [drm] radeon: 512M of GTT memory ready.
[ 25.571018] VBoxDrv: dbg - g_abExecMemory=ffffffffa051d6c0
#
Grepping für e820 zeigt eine Reihe von Bereichen, die mit abrunden e820 update range: 00000000bdf00000 - 000000043f000000 (usable) ==> (reserved)
. 43f000000 ist 16 GiB, bdf00000 ist 3039 MiB. Ich nicht sehen , dass sein zufällig.
# dmesg | grep -i e820
[ 0.000000] BIOS-e820: 0000000000000000 - 000000000009d800 (usable)
[ 0.000000] BIOS-e820: 000000000009d800 - 00000000000a0000 (reserved)
[ 0.000000] BIOS-e820: 00000000000e0000 - 0000000000100000 (reserved)
[ 0.000000] BIOS-e820: 0000000000100000 - 00000000bd94d000 (usable)
[ 0.000000] BIOS-e820: 00000000bd94d000 - 00000000bd99c000 (ACPI NVS)
[ 0.000000] BIOS-e820: 00000000bd99c000 - 00000000bd9a6000 (ACPI data)
[ 0.000000] BIOS-e820: 00000000bd9a6000 - 00000000bdade000 (reserved)
[ 0.000000] BIOS-e820: 00000000bdade000 - 00000000bdaef000 (ACPI NVS)
[ 0.000000] BIOS-e820: 00000000bdaef000 - 00000000bdb02000 (reserved)
[ 0.000000] BIOS-e820: 00000000bdb02000 - 00000000bdb04000 (ACPI NVS)
[ 0.000000] BIOS-e820: 00000000bdb04000 - 00000000bdb0d000 (reserved)
[ 0.000000] BIOS-e820: 00000000bdb0d000 - 00000000bdb13000 (ACPI NVS)
[ 0.000000] BIOS-e820: 00000000bdb13000 - 00000000bdb75000 (reserved)
[ 0.000000] BIOS-e820: 00000000bdb75000 - 00000000bdd78000 (ACPI NVS)
[ 0.000000] BIOS-e820: 00000000bdd78000 - 00000000bdf00000 (usable)
[ 0.000000] BIOS-e820: 00000000fec00000 - 00000000fec01000 (reserved)
[ 0.000000] BIOS-e820: 00000000fec10000 - 00000000fec11000 (reserved)
[ 0.000000] BIOS-e820: 00000000fec20000 - 00000000fec21000 (reserved)
[ 0.000000] BIOS-e820: 00000000fed00000 - 00000000fed01000 (reserved)
[ 0.000000] BIOS-e820: 00000000fed61000 - 00000000fed71000 (reserved)
[ 0.000000] BIOS-e820: 00000000fed80000 - 00000000fed90000 (reserved)
[ 0.000000] BIOS-e820: 00000000fef00000 - 0000000100000000 (reserved)
[ 0.000000] BIOS-e820: 0000000100001000 - 000000043f000000 (usable)
[ 0.000000] e820 update range: 0000000000000000 - 0000000000010000 (usable) ==> (reserved)
[ 0.000000] e820 update range: 00000000bdf00000 - 000000043f000000 (usable) ==> (reserved)
[ 0.000000] update e820 for mtrr
#
EDIT 3/4 - Teilerfolg:
- Ein Upgrade des UEFI-BIOS von der Version
0705 x64 08/23/2011
auf1007 02/10/2012
hat nicht geholfen: Es blieb genau das gleiche Problem. - Durch das Entfernen eines DIMM-Moduls (ich hatte die glückliche Vermutung, welcher Steckplatz # 4 war: der am weitesten von der CPU entfernte) konnte das BIOS die verbleibenden 24 GB erkennen und verwenden, obwohl eine Drei-DIMM-Konfiguration laut dem nicht "empfohlen" wird Diagramm in der Bedienungsanleitung. Wenn Sie eines der verbleibenden DIMMs in Steckplatz 4 einsetzen, kann es weiterhin verwendet werden, sodass der Steckplatz in Ordnung ist. Durch das erneute Einsetzen des "ursprünglichen" DIMM in diesen Steckplatz bin ich wieder an meinem Ausgangspunkt angelangt.
- Das Booten von der Debian 6.0.3 AMD64-Installations-CD in eine Rettungsumgebung und das Überprüfen der
dmesg
Ausgabe zeigt keine ähnlichen MTRR-Fehler . In dieser Umgebung mit 3 x 8 GB werden 24 GB (plus oder minus Epsilon mal pi oder so; ich habe nicht genau gerechnet) als verwendbar angezeigtfree
. - Das Aktualisieren / Neuinstallieren des Kernels (es war ein kleines Upgrade verfügbar) scheint auch die MTRR-Probleme behoben zu haben.
dmesg
meldet jetzt insgesamt 26198016 KB und keine MTRR-Fehler, was mit dem übereinstimmt, was ich bei 3 x 8 GB erwartet hätte.free -m
Jetzt werden 24114 MB Gesamtspeicher gemeldet, was mir ehrlich gesagt nahe genug ist.
Dies riecht nach einem Barfed-DIMM und einem Kernel, der aus irgendeinem Grund beschädigt wurde. Letzteres ist möglicherweise während des Stromausfalls passiert (obwohl ich sagen muss, dass der Kernel auf seltsame Weise kaputt geht!). Das nicht funktionierende DIMM wird zum Reseller zurückkehren, sobald ich mit ihm spreche (hoffentlich morgen).
(hoffentlich) FINAL EDIT
Ich habe eines der beiden DIMM-Paare per RMA erhalten, es wurde vom Wiederverkäufer als beschädigt akzeptiert und sie haben mir ein neues Paar geschickt, das anscheinend einwandfrei funktioniert. Ich bin jetzt also im Grunde dort, wo ich es vor fast einem Monat ursprünglich beabsichtigt hatte (obwohl ein großer Teil dieser Zeit nicht wirklich auf den Reseller zurückzuführen war), mit 32 GB RAM nutzbar; free -m
meldet 32194 MB Gesamtspeicher, und der Kernel meldet 34586624k
RAM bei der Initialisierung, die beide meinen Erwartungen entsprechen.
dmidecode --type memory
und die ersten hundert Zeilen der Ausgabe von dmesg
(stellen Sie sicher, dass Sie alles einschließen, was so aussieht, als ob es sich um Speicher handelt).
WARNING: BIOS bug: CPU MTRRs don't cover all of memory, losing 13295MB of RAM.
Nun, da fehlt dein 13G.