Momentan baue ich eine Instanz auf EC2, auf der der gesamte Planet.osm-Snapshot der gesamten Datenmenge der Erde für einige Projekte, an denen wir arbeiten, importiert werden kann. Ich habe eine große Ubuntu x64-Instanz hochgefahren und viel separaten Speicher auf einem EBS-Volume für die Postgres-Datenbank hinzugefügt und geändert, um die PGSQL-Daten dort unterzubringen.
Jetzt hat der Server Probleme osm2pgsql
beim Importieren des Snapshots ... Nach einigen Versuchen mit verschiedenen Speicherkonfigurationen und so weiter gibt der Prozess "Killed" aus, nachdem er den größten Teil des Weges hinter sich gebracht hat. Sobald es getötet wurde, während "ausstehende Wege durchlaufen", und beim nächsten Mal, nachdem der schmale Cache leicht angepasst wurde, erreichte es "verarbeitende Wege", bevor es abstürzte. Nach dem, was ich gelesen habe, ist dies im Allgemeinen auf Speicherprobleme zurückzuführen.
Hier ist mein letzter Versuch, den Import auszuführen:
osm2pgsql -v -U osm -s -C 4096 -S default.style -d osm /data/osm/planet-latest.osm.bz2
Und hier sind die Spezifikationen für eine große Instanz von EC2:
Große Instanz 7,5 GB Speicher, 4 EC2-Recheneinheiten (2 virtuelle Kerne mit jeweils 2 EC2-Recheneinheiten), 850 GB lokaler Instanzspeicher, 64-Bit-Plattform
Meine Frage ist - gibt es einige gute Benchmark-Ressourcen, um die Optimierungsanforderungen für osm2pgsql und Postgres zu bestimmen? Die Importgeschwindigkeit ist mir nicht einmal so wichtig, ich möchte nur sicherstellen, dass der Vorgang sicher abgeschlossen wird, auch wenn es 4 oder 5 Tage dauert ... Ich habe Frederick Ramms " Optimierung des Renderings " gelesen chain "(PDF) aus dem letztjährigen SOTM, aber gibt es noch andere gute Meinungen / Ressourcen?