Diese Antwort beschreibt eine objektive Methode zur Messung beliebiger Diskrepanzen zwischen zwei räumlichen Datensätzen. Solche Abweichungen können Positionsverschiebungen, Formänderungen und Merkmale umfassen, die in einem Datensatz vorhanden sind, in einem anderen jedoch nicht. Diese Antwort ist nicht bietet keine Mittel , um zu bestimmen , welche ist „besser“ , weil das auf viel mehr hängt als nur die Daten und es hängt vor allem ab , was die Daten für verwendet werden.
Hintergrund
Eine gute Grundlage für eine große Anzahl solcher Messungen ist die euklidische Abstandstransformation jedes Datensatzes. Dadurch wird jeder Datensatz als eine Sammlung von Punkten in der Ebene dargestellt. Nennen wir diese Sammlungen B für die blauen Merkmale und R für die roten Merkmale.
Für einen beliebigen Punkt x in der Ebene, Transformation der euklidische Abstand eines Punktes Satz A die größte untere der Abstände zwischen gebundenen berechnet x und A . Wir können uns diese Transformation als eine "Oberfläche" vorstellen, deren Höhe bei x dem kürzesten Abstand von x zu A entspricht . Somit hat diese Oberfläche Täler an allen Punkten von A , wo ihre Höhe Null ist, und steigt mit einer Neigung von 1: 1 von A weg an . Es ist klar, dass die Entfernungstransformation wiederum A bestimmt (oder technisch den metrischen Abschluss , der für GIS-Datensätze mit A identisch ist) als Menge aller Punkte in einer Höhe von Null. Somit erfasst die Entfernungstransformation vollständig alle räumlichen Informationen von A , die das GIS darstellen kann.
Diese Abbildung zeigt die Abstandstransformationen von B (links) und R (rechts) im Pseudorelief.
Vergleich zweier Datensätze
Um B und R zu vergleichen , überlagern Sie sie jeweils mit der Abstandstransformation des anderen:
Die Abstandswerte werden als Farben angezeigt, die von Blau (nahe 0) bis Rot reichen.
Die linke Karte, zum Beispiel, zeigt die Punkte von B und Farben , um sie entsprechend ihre Abstände von R . Die Rollen von B und R werden in der rechten Karte vertauscht.
Bereits diese helfen dem Auge bei Vergleichen: Jede Karte zeigt die Punkte eines Datensatzes und hebt durch die Verwendung von Farbe die Punkte hervor, die weit von einem Punkt im anderen Datensatz entfernt sind. Beachten Sie, dass beide Karten für den Vergleich benötigt werden, da jede Punkte nicht auf der anderen zeigt.
Auf detaillierten Karten kann es schwierig sein, die Farbe zu erkennen. Daher können wir sie zur Präsentation oder visuellen Auswertung ein wenig verwischen:
NB: Die Farben sind zwischen den beiden Karten nicht vergleichbar: Innerhalb jeder Karte werden sie skaliert, um den gesamten Entfernungsbereich in dieser Karte anzuzeigen.
Statistische Analyse der Unterschiede
Das Schöne an diesem Ansatz liegt darin, was in der Nachbearbeitung getan werden kann. Mithilfe eines Rasters zur Darstellung der Entfernungstransformationen und ihrer Überlagerungen können wir leicht lokale und globale Statistiken erhalten, um die Diskrepanzen zu messen. Zum Beispiel könnten wir uns auf alle Entfernungen konzentrieren, die größer als ein kleiner Schwellenwert sind, und ihre Häufigkeitsverteilung untersuchen:
In diesem Histogramm stehen blaue Balken für die blauen Merkmale und rote Balken für die roten Merkmale. (Beachten Sie die logarithmische Skala auf der horizontalen Achse.) Dieses Histogramm zeigt die ursprünglichen überlagerten Daten, nicht die abgeleiteten unscharfen Daten. Es wurden nur die Abstände ausgewählt, die im Originalbild größer als drei Pixel sind.
Diese Histogramme zeigen, dass blaue Merkmale viel häufiger weit von roten Merkmalen entfernt sind als umgekehrt : Die blauen Balken sind höher als die roten und erstrecken sich über größere Entfernungen (rechts). Das gesamte Arsenal deskriptiver Statistiken steht jetzt zur Quantifizierung der Unterschiede zwischen den beiden Datensätzen zur Verfügung. Diese Statistiken können auf die gesamte Region von Interesse angewendet oder darüber "gefenstert" werden, um zu untersuchen, wie sich die beiden Datensätze je nach Standort unterscheiden.
Implementierung
Die meisten Raster GISes bietet eine euklidische Distanz (wie Transformation Euklidischer Abstand in ArcGIS und r.grow.distance in GRAS) und alle Unterstützung des einfachen (Maskierung) Overlay erforderlich , um diese Analyse zu tun. Falls gewünscht, kann die Unschärfe mit einem Nachbarschaftsmittelwert oder einer Kernelfaltung erfolgen (einschließlich der "Gaußschen Unschärfe", die in allen Bildverarbeitungsprogrammen verfügbar ist). Die meisten GIS bieten keine ausreichende Unterstützung für die vollständige statistische Analyse von Rasterdaten, aber sie können solche Daten gut in Formaten exportieren, die von statistischer und mathematischer Software wie R
oder Mathematica (die alle Zahlen hier erstellt hat) lesbar sind .