Das Modell der Frage sei geschrieben als
wobei ein nicht beobachteter GP mit dem Index
und ein normaler Rauschbegriff mit ist Varianz . Der GP wird normalerweise als zentriert, stationär und nicht deterministisch angenommen. Beachten Sie, dass der Begriff
als (deterministischer) GP mit Kernel
wobei h(x)x∈Rdεiσ2ϕ(x)⊤βϕ(x)⊤B.
Yi=ϕ(xi)⊤β+h(xi)+εi(1)
h(x)x∈Rdεiσ2ϕ(x)⊤βB B : = ρϕ(x)⊤Bϕ(x)Bist eine Kovarianzmatrix mit unendlichem Wert. In der Tat erhalten wir die Kriging-Gleichungen der Frage , indem wir
mit . Dies wird häufig als
diffuser Prior für
. Ein korrekter Posterior für
ergibt sich nur, wenn die Matrix den vollen Rang hat. Das Modell schreibt also ebenso wie
wobei ein GP ist . Dieselbe Bayes-Interpretation kann mit Einschränkungen verwendet werden, wenn kein GP mehr ist, sondern ein GP
ρ → ∞ β β Φ Y i = ζ ( x i ) + ε i ζ ( x ) ζ ( x )B:=ρIρ→∞ββΦYi=ζ(xi)+εi(2)
ζ(x)ζ(x)Intrinsic Random Function (IRF). Die Ableitung findet sich im Buch von G. Wahba. Lesbare Darstellungen des IRF-Konzepts finden sich beispielsweise in dem Buch von N. Cressie und dem unten zitierten Artikel von Mardia et al. IRFs ähneln den bekannten integrierten Prozessen im zeitdiskreten Kontext (wie ARIMA): Ein IRF wird durch eine Art Differenzierungsoperation in einen klassischen GP umgewandelt.
Hier sind zwei Beispiele für IRF für . Betrachten Sie zunächst einen Wiener-Prozess dessen Anfangsbedingung durch eine diffuse Anfangsbedingung ersetzt wird: ist normal mit einer unendlichen Varianz. Sobald ein Wert bekannt ist, kann der IRF ebenso wie der Wiener GP vorhergesagt werden. Zweitens betrachten wir einen integrierten Wiener-Prozess , der durch die Gleichung wobei ist ein Wiener-Prozess. Um einen GP zu erhalten, benötigen wir jetzt zwei skalare Parameter: zwei Werte
und fürζ ( x ) ζ ( 0 ) = 0 ζ ( 0 ) ζ ( x ) d 2 ζ ( x ) / d x 2 = d W ( x ) / d x W ( x ) ζ ( x ) ζ ( x ' ) x ≠ x ' ζ ( x )d=1ζ(x)ζ(0)=0ζ(0)ζ(x)
d2ζ(x)/dx2=dW(x)/dx
W(x)ζ(x)ζ(x′)x≠x′oder die Werte
und bei einem ausgewählten . Wir können annehmen, dass die beiden zusätzlichen Parameter gemeinsam Gauß'sch mit einer unendlichen Kovarianzmatrix sind. In beiden Beispielen ist der IRF als GP nahezu fertig, sobald ein geeigneter endlicher Satz von Beobachtungen verfügbar ist. Außerdem haben wir einen Differentialoperator verwendet: und . Der Nullraum ist ein linearer Raum von Funktionen
so dass . Es enthält die konstante Funktion
ζ(x)x 2 × 2 L : = d / d x L : = d 2 / d x 2 F ϕ ( x ) L ϕ = 0 ϕ 1 ( x ) = 1 ϕ 1 ( x ) = 1 ϕ 2 ( x ) = x ζ ( xdζ(x)/dxx2×2L:=d/dxL:=d2/dx2Fϕ(x)Lϕ=0ϕ1(x)=1im ersten Fall und die Funktionen und
im zweiten Fall. Beachten Sie, dass im ersten Beispiel
GP für jedes feste im ersten Beispiel ist und in ähnlicher Weise ist im zweiten Fall ein GP.
ϕ1(x)=1ϕ2(x)=xδ ζ ( x - δ ) - 2 ζ ( x ) + ζ ( x + δ )ζ(x)−ζ(x+δ)δζ(x−δ)−2ζ(x)+ζ(x+δ)
Betrachten Sie für eine allgemeine Dimension einen linearen Raum von Funktionen, die in . Wir nennen ein Inkrement
relativ zu eine endliche Sammlung von Positionen
und reellen Gewichten so dass
Betrachten Sie als Nullraum unserer Beispiele. Für das erste Beispiel können wir zB mit und
beliebig und nehmenF R d F s x i ∈ R d s ν i s ∑ i = 1dFRdFsxi∈RdsνiF s = 2 × 1 × 2 [ 1 ,
∑i=1sνiϕ(xi)=0 for all ϕ∈F.
Fs=2x1x2s = 3 x i ν = [ 1 ,[1,−1] . Für das zweite Beispiel können wir s mit
gleichem Abstand und . Die Definition eines IRF beinhaltet einen Raum von Funktionen und eine Funktion die
bedingt positiv für , was bedeutet, dass
gilt, sobald ist ein Inkrement für . Von und
s=3xiF g ( x ,ν=[1,−2,1]F F s ∑ i = 1 s ∑ j = 1 ν i ν jg(x,x′)F[ ν i ,∑i=1s∑j=1sνiνjg(xi,x′j)≥0
F F g( x ,[νi,xi]si=1FFL F Lζ=g(x,x′)
Wir können einen Kovarianzkern erstellen, daher einen GP wie bei Mardia et al. Wir können von einem linearen Differentialoperator und den Nullraum als ; Die IRF hat dann eine Verbindung mit der Gleichung ein Gaußsches Rauschen.
LFLζ=
Die Berechnung der Vorhersage des IRF ist nahezu dieselbe wie in der Frage, wobei durch
, aber mit dem jetzt eine Basis von . Die zusätzliche Einschränkung
muss im Optimierungsproblem hinzugefügt werden, wodurch das gewährt wird
. Wir können bei Bedarf noch weitere Basisfunktionen hinzufügen, die nicht in
sind. Dies hat den Effekt, dass dem IRF
ein deterministischer GP hinzugefügt wird, z. B.
g( x ,k(x,x′) ϕ i ( x ) F Φ ⊤ α= 0 α ⊤ K α≥0 F ψ( x ) ⊤ γζ( x )g(x,x′)ϕi(x)FΦ⊤α=0α⊤Kα≥0Fψ(x)⊤γζ(x) in (2).
Der Dünnplatten-Spline hängt von einer ganzen Zahl so dass , der Raum Polynome mit geringem Grad enthält, wobei die Dimension von und abhängt . Es kann gezeigt werden, dass, wenn
die folgende Funktion für dann
definiert ein bedingt positives wrt . Die Konstruktion bezieht sich auf einen Differentialoperatorm > 2 d F p ( m ) m d E ( r ) r ≥ 0 E ( r ) : = { ( - 1 ) m + 1 + d / 2mm>2dFp(m)mdE(r)r≥0 g(x,
E(r):={(−1)m+1+d/2r2m−dlogrr2m−dd even,d odd,
g(x,x′):=E(∥x−x′∥)FL. Es stellt sich heraus, dass für und der Spline der dünnen Platte nichts anderes ist als der übliche natürliche kubische Spline, der sich auf das obige integrierte Wiener-Beispiel bezieht, mit . (2) ist also nichts anderes als das übliche Glättungs-Spline-Modell. Wenn und der Nullraum die Dimension
und wird durch die Funktionen , und .
d=1m=2g(x,x′)=|x−x′|3d=2m=2p(m)=31x1x2
Cressie N- Statistik für räumliche Daten . Wiley 1993.
Mardia KV, Kent JT, Goodall CR und Little JA. Kriging und Splines mit abgeleiteten Informationen. Biometrika (1996), 83,1, S. 207-221.
Wahba G Spline-Modelle für Beobachtungsdaten . SIAM 1990.
Wang, Y Glättung von Splines, Methoden und Anwendungen . Chapman and Hall, 2011.