Angenommen, ist ein Vektor, von dem angenommen wird, dass er eine multivariate Verteilung des unbekannten Mittelwerts und der bekannten Varianz-Kovarianz-Matrix . Wir beobachten aus dieser Verteilung und möchten z 0 aus diesen Informationen unter Verwendung eines unverzerrten linearen Prädiktors vorhersagen : (μ,μ,…,μ)Σ ( z 1 , z 2 , … , z n )(Z0,Z1,…,Zn)(μ,μ,…,μ)Σ(z1,z2,…,zn) z0
- Linear bedeutet, dass die Vorhersage die Form annehmen muss, damit die Koeffizienten λ i bestimmt werden. Diese Koeffizienten können höchstens von dem abhängen, was im Voraus bekannt ist: nämlich den Einträgen von Σ .z0^=λ1z1+λ2z2+⋯+λnznλiΣ
Dieser Prädiktor kann auch als Zufallsvariable .Z0^=λ1Z1+λ2Z2+⋯+λnZn
- Unvoreingenommen bedeutet, dass die Erwartung von gleich dem (unbekannten) Mittelwert μ ist .Z0^μ
Das Aufschreiben gibt einige Informationen über die Koeffizienten:
μ=E[Z0^]=E[λ1Z1+λ2Z2+⋯+λnZn]=λ1E[Z1]+λ2E[Z2]+⋯+λnE[Zn]=λ1μ+⋯+λnμ=(λ1+⋯+λn)μ.
Die zweite Zeile ist auf die Linearität der Erwartung zurückzuführen, und der Rest ist einfache Algebra. Da angenommen wird, dass dieses Verfahren unabhängig vom Wert von funktioniert , müssen sich die Koeffizienten offensichtlich zu Eins summieren. Wenn die Koeffizienten in der Vektornotation λ = ( λ i ) 'geschrieben werden , kann dies sauber geschrieben werden 1 λ = 1 .μλ=(λi)′1λ=1
Unter der Menge all dieser unverzerrten linearen Prädiktoren suchen wir einen, der so wenig wie möglich vom realen Wert abweicht , gemessen im Raummittelwertquadrat. Dies ist wiederum eine Berechnung. Es beruht auf der Bilinearität und Symmetrie der Kovarianz, deren Anwendung für die Summierungen in der zweiten Zeile verantwortlich ist:
E.[ ( Z.0^- Z.0)2]]= E.[ ( λ1Z.1+ λ2Z.2+ ⋯ + λnZ.n- Z.0)2]]= ∑i = 1n∑j = 1nλichλjvar [ Z.ich, Z.j] - 2 ∑i = 1nλichvar [ Z.ich, Z.0] + var [ Z.0, Z.0]]= ∑i = 1n∑j = 1nλichλjΣich , j- 2 ∑i = 1nλichΣ0 , ich+ Σ0 , 0.
Woher können die Koeffizienten erhalten werden, indem diese quadratische Form unter der (linearen) Bedingung minimiert wird . Dies lässt sich leicht mit der Methode der Lagrange-Multiplikatoren lösen, wobei sich ein lineares Gleichungssystem ergibt, die "Kriging-Gleichungen".1 λ=1
In der Anwendung ist ein räumlicher stochastischer Prozess ("Zufallsfeld"). Dies bedeutet, dass für jeden gegebenen Satz fester (nicht zufälliger) Orte x 0 , … , x n der Wertevektor von Z an diesen Orten ( Z ( x 0 ) , … , Z ( x n ) ) zufällig mit ist eine Art multivariate Verteilung. Schreiben Sie Z i = Z ( x i ) und wenden Sie die vorstehende Analyse an, vorausgesetztZ.x0, … , X.nZ.( Z.( x0) , … , Z.( xn) )Z.ich= Z.( xich)Die Mittelwerte des Prozesses an allen Stellen x i sind gleich, und die Annahme der Kovarianzmatrix der Prozesswerte an diesen n + 1 Stellen ist mit Sicherheit bekannt.n + 1xichn + 1
Lassen Sie uns das interpretieren. Unter den Annahmen (einschließlich des konstanten Mittelwerts und der bekannten Kovarianz) bestimmen die Koeffizienten die minimale Varianz, die von jedem linearen Schätzer erreicht werden kann. Nennen wir diese Varianz ("OK" steht für "gewöhnliches Kriging"). Es kommt ausschließlich auf die Matrix Σ an . Es sagt uns, dass, wenn wir wiederholt von ( Z 0 , … , Z n ) abtasten und diese Koeffizienten verwenden würden, um die z 0 -Werte jedes Mal aus den verbleibenden Werten vorherzusagenσ2O K.Σ( Z.0, … , Z.n)z0
Im Durchschnitt wären unsere Vorhersagen korrekt.
z0σO K.z0
Es muss noch viel mehr gesagt werden, bevor dies auf praktische Situationen wie das Schätzen einer Oberfläche aus pünktlichen Daten angewendet werden kann: Wir benötigen zusätzliche Annahmen darüber, wie sich die statistischen Merkmale des räumlichen Prozesses von einem Ort zum anderen und von einer Realisierung zur anderen unterscheiden (obwohl) In der Praxis wird normalerweise immer nur eine Realisierung verfügbar sein. Diese Darstellung sollte jedoch ausreichen, um zu verfolgen, wie die Suche nach einem "besten" unverzerrten linearen Prädiktor ("BLUP") direkt zu einem System linearer Gleichungen führt.
ΣΣΣund Vorhersagen einer Sammlung von Werten an unbekannten Orten. Sie erfordern etwas stärkere Annahmen (multivariate Normalität), um dieses Kunststück zu erreichen.