Einführung und Zusammenfassung
Toblers Gesetz der Geographie behauptet
Alles hängt mit allem anderen zusammen, aber nahe Dinge sind mehr verwandt als entfernte Dinge.
Kriging nimmt ein Modell jener Beziehungen an, in denen
"Dinge" sind numerische Werte an Orten auf der Erdoberfläche (oder im Weltraum), die normalerweise als euklidische Ebene dargestellt werden.
Es wird angenommen, dass diese numerischen Werte Realisierungen von Zufallsvariablen sind.
"Verwandt" wird als Mittelwert und Kovarianz dieser Zufallsvariablen ausgedrückt.
(Eine Sammlung von Zufallsvariablen, die mit Punkten im Raum verknüpft sind, wird als "stochastischer Prozess" bezeichnet.) Das Variogramm enthält die Informationen, die zur Berechnung dieser Kovarianzen erforderlich sind.
Was Kriging ist
Kriging ist speziell die Vorhersage von Dingen an Orten, an denen sie nicht beobachtet wurden. Um den Vorhersageprozess mathematisch nachvollziehbar zu machen, begrenzt Kriging die möglichen Formeln auf lineare Funktionen der beobachteten Werte. Das macht das Problem zu einem endlichen Problem bei der Bestimmung der Koeffizienten. Diese können gefunden werden, indem verlangt wird, dass das Vorhersageverfahren bestimmte Eigenschaften aufweist. Intuitiv ist eine hervorragende Eigenschaft, dass die Unterschiede zwischen dem Prädiktor und dem wahren (aber unbekannten) Wert tendenziell gering sein sollten: Das heißt, der Prädiktor sollte präzise sein . Eine andere Eigenschaft, die stark angepriesen wird, aber fragwürdiger ist, ist, dass der Prädiktor im Durchschnitt dem wahren Wert entsprechen sollte: Er sollte genau sein .
(Der Grund, warum das Bestehen auf perfekter Genauigkeit fraglich ist - aber nicht unbedingt schlecht - ist, dass es normalerweise jedes statistische Verfahren weniger präzise macht, dh variabler. Wenn Sie auf ein Ziel schießen, möchten Sie die Treffer lieber gleichmäßig auf das Ziel verteilen Rand und trifft selten auf die Mitte oder würden Sie Ergebnisse akzeptieren, die direkt neben, aber nicht genau auf die Mitte fokussiert sind? Ersteres ist genau, aber ungenau, während letzteres ungenau, aber präzise ist.)
Diese Annahmen und Kriterien - das heißt, Mittelwerte und Kovarianzen sind geeignete Methoden zur Quantifizierung der Verwandtschaft, dass eine lineare Vorhersage funktioniert und dass der Prädiktor so genau wie möglich sein sollte, sofern er vollkommen genau ist - führen zu einem Gleichungssystem mit a einzigartige Lösung, vorausgesetzt, die Kovarianzen wurden konsistent spezifiziert . Der resultierende Prädiktor wird dabei als "BLUP" bezeichnet: Bester linearer unverzerrter Prädiktor.
Woher kommt das Variogramm?
Um diese Gleichungen zu finden, muss das gerade beschriebene Programm operationalisiert werden. Dies geschieht durch Aufschreiben der Kovarianzen zwischen dem Prädiktor und den Beobachtungen , die als Zufallsvariablen betrachtet werden. Die Algebra der Kovarianzen bewirkt, dass die Kovarianzen unter den beobachteten Werten auch in die Kriging-Gleichungen eingehen.
An diesem Punkt erreichen wir eine Sackgasse, weil diese Kovarianzen fast immer unbekannt sind. Schließlich haben wir in den meisten Anwendungen nur eine Realisierung jeder der Zufallsvariablen beobachtet: nämlich unseren Datensatz, der an jedem einzelnen Ort nur eine Zahl darstellt. Geben Sie das Variogramm ein: Diese mathematische Funktion gibt an, wie die Kovarianz zwischen zwei beliebigen Werten sein soll. Es muss sichergestellt werden, dass diese Kovarianzen "konsistent" sind (in dem Sinne, dass es niemals eine Reihe von Kovarianzen gibt, die mathematisch unmöglich sind: Nicht alle Sammlungen numerischer Maße der "Verwandtschaft" bilden tatsächliche Kovarianzmatrizen ). Deshalb ist ein Variogramm für Kriging unerlässlich.
Verweise
Da die unmittelbare Frage beantwortet wurde, werde ich hier aufhören. Interessierte Leser können anhand guter Texte wie Journel & Huijbregts ' Mining Geostatistics (1978) oder Isaaks & Srivastavas Applied Geostatistics (1989) lernen, wie Variogramme geschätzt und interpretiert werden . (Beachten Sie, dass der Schätzprozess zwei Objekte einführt, die als "Variogramme" bezeichnet werden: ein aus Daten abgeleitetes empirisches Variogramm und ein daran angepasstes Modellvariogramm . Alle Verweise auf "Variogramm" in dieser Antwort beziehen sich auf das Modell. Der Aufruf vgm
in der Frage gibt eine Computerdarstellung eines Modellvariogramms zurück.) Für einen moderneren Ansatz, bei dem Variogrammschätzung und Kriging angemessen kombiniert werden, siehe Diggle &Modellbasierte Geostatistik (2007) (die auch ein erweitertes Handbuch für die R
Pakete GeoR
und ist GeoRglm
).
Bemerkungen
Unabhängig davon, ob Sie Kriging für die Vorhersage oder einen anderen Algorithmus verwenden, ist die quantitative Charakterisierung der Verwandtschaft, die das Variogramm bietet, nützlich, um jedes Vorhersageverfahren zu bewerten . Beachten Sie, dass alle räumlichen Interpolationsmethoden unter diesem Gesichtspunkt Prädiktoren sind - und viele von ihnen sind lineare Prädiktoren, wie z. B. IDW (Inverse Distance Weighted). Das Variogramm kann verwendet werden, um den Durchschnittswert und die Streuung (Standardabweichung) einer der Interpolationsmethoden zu bewerten. Somit ist es weit über seine Verwendung in Kriging hinaus anwendbar.
gstat
R-Paket mit denselben Maissdaten.