Als «large-datasets» getaggte Fragen

schwierig zu verarbeiten und zu verwalten, da die Größe normalerweise größer ist als die Grenzwerte, mit denen Software normalerweise umgehen kann.

2
Auf der Suche nach der schnellsten Lösung für die Point-in-Polygon-Analyse von 200 Millionen Punkten
Ich habe eine CSV mit 200 Millionen Beobachtungen in folgendem Format: id,x1,y1,x2,y2,day,color 1,"-105.4652334","39.2586939","-105.4321296","39.2236632","Monday","Black" 2,"-105.3224523","39.1323299","-105.4439944","39.3352235","Tuesday","Green" 3,"-104.4233452","39.0234355","-105.4643990","39.1223435","Wednesday","Blue" Für jeden Koordinatensatz (x1 / y1 und x2 / y2) möchte ich den US-amerikanischen Zensus-Trakt oder den Zensus-Block zuweisen, in den er fällt (das TIGER-Shapefile des Zensus-Trakts habe ich hier heruntergeladen: ftp://ftp2.census.gov/ geo / tiger …




1
Clusterverarbeitungsressourcen für 50 Gb DEM benötigt?
Für "Mietzwecke" muss ich die Computerressourcen angeben, die ich vom Rechenzentrum meiner Universität benötige. Ich habe sehr wenig Ahnung, wonach ich fragen soll. Können Sie unter Berücksichtigung der folgenden Informationen etwas vorschlagen? Dies ist der Computercluster: "Ein 10-Blade-Server mit jedem Blade, bestehend aus 2 Quad Core Intel Xeon 2,33-GHz-CPUs mit …




9
WMS mit Zugriffskontrolle (ACL) für verschiedene Benutzer? Oder Lösung für Tausende von Punkten auf der Webkarte?
Ich habe eine Reihe von Websites zu Tausenden. Nicht alle Benutzer sehen dieselben Sites auf der Karte - also ACL. Daten werden in einer Nicht-GIS-Datenbank (mssql, ora usw.) gespeichert und jetzt mit einer Standard-SQL-Abfrage abgerufen und mit einer JSP an den Client (OpenLayers) zurückgegeben. Der aktuelle Code ist bereits optimiert, …

4
Abfragen, die sehr große Datenmengen in PostGIS zurückgeben
Ich habe eine PostGIS-Abfrage, die mehrere Millionen Zeilen zurückgibt: SELECT t1.id AS id1, t2.id AS id2, ABS(t1.mean_h - t2.mean_h) AS h_diff, ST_Distance(t1.the_geom, t2.the_geom) AS dist FROM tas_ponds as t1, tas_ponds as t2 WHERE (t1.gid > t2.gid) AND ST_DWithin(t1.the_geom, t2.the_geom, 17000) Beim Einlaufen psqlerhalte ich eine out of memory for query …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.