"Räumliche Autokorrelation" bedeutet für verschiedene Menschen verschiedene Dinge. Ein übergeordnetes Konzept ist jedoch, dass ein Phänomen, das an Orten beobachtet wird, in gewisser Weise von (a) Kovariaten, (b) Orten und (c) ihren Werten an nahe gelegenen Orten abhängen kann . (Wo die technischen Definitionen in der Art der zu berücksichtigenden Daten variieren, welcher "bestimmte Weg" postuliert wird und was "in der Nähe" bedeutet: All dies muss quantitativ festgelegt werden, um fortzufahren.)z
Betrachten wir ein einfaches Beispiel für ein solches räumliches Modell, um die Topographie einer Region zu beschreiben. Die gemessene Höhe an einem Punkt sei y ( z ) . Ein mögliches Modell ist, dass y auf eine bestimmte mathematische Weise von den Koordinaten von z abhängt , die ich in dieser zweidimensionalen Situation schreiben werde ( z 1 , z 2 ) . Lassen wir ε (hypothetisch unabhängige) Abweichungen zwischen den Beobachtungen und dem Modell darstellen (von denen wie üblich angenommen wird, dass sie keine Erwartung haben), schreiben wirzy( z )yz(z1, z2)ε
y( z ) = β0+ β1z1+ β2z2+ ε ( z )
für ein lineares Trendmodell . Der Lineartrend (dargestellt durch die und β 2 Koeffizienten) ist ein Weg , um die Idee zu erfassen , die in die Nähe Wert y ( z ) und y ( z ' ) , für z die Nähe von z ' , sollen zueinander nahe sein neigen . Wir können dies sogar berechnen, indem wir den erwarteten Wert der Größe der Differenz zwischen y ( z ) und y ( z ′ ) , E [ |, berücksichtigen yβ1β2y(z)y(z′)zz′y(z)y(z′) . Es stellt sich heraus, dass die Mathematikvieleinfacher ist, wenn wir ein etwas anderes Differenzmaß verwenden: Stattdessen berechnen wir die erwartetequadratischeDifferenz:E[|y(z)−y(z′)|]
E[(y(z)−y(z′))2]=E[(β0+β1z1+β2z2+ε(z)−(β0+β1z′1+β2z′2+ε(z′)))2]=E[(β1(z1−z′1)+β2(z2−z2)′+ε(z)−ε(z′))2]=E[(β1(z1−z′1)+β2(z2−z2)′)2+2(β1(z1−z′1)+β2(z2−z2)′)(ε(z)−ε(z′))+(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]
Dieses Modell ist frei von jeglicher expliziten räumlichen Autokorrelation, da es keinen Term gibt, der direkt mit nahegelegenen Werten y ( z ′ ) in Beziehung setzt .y(z)y(z′)
Ein alternatives, anderes Modell ignoriert den linearen Trend und geht nur von einer Autokorrelation aus. Ein Weg, dies zu tun, besteht in der Struktur der Abweichungen . Das könnten wir annehmenε(z)
y(z)=β0+ε(z)
und um unsere Erwartung der Korrelation zu berücksichtigen, nehmen wir eine Art "Kovarianzstruktur" für . Damit dies räumlich aussagekräftig ist, nehmen wir an, dass die Kovarianz zwischen ε ( z ) und ε ( z ′ ) gleich E [ ε ( z ) ε ( z ′ ) ] ist, da ε ein Mittelwert von Null hat und mit z abnimmt und z ' werden immer weiter entfernt. Da die Details keine Rolle spielen, nennen wir diese Kovarianz einfach Cεε(z)ε(z′)E[ε(z)ε(z′)]εzz′ . Dies ist eine räumliche Autokorrelation. Tatsächlich ist die (übliche Pearson) Korrelation zwischen y ( z ) und y ( z ' ) istC(z,z′)y(z)y(z′)
ρ(y(z),y(z′))=C(z,z′)C(z,z)C(z′,z′)−−−−−−−−−−−−√.
y
E[(y(z)−y(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+C1(z,z)+C1(z′,z′)
z≠z′εC1C
εyzz′β0β1
y
E[ ( y( z ) - y( z′) )2]= E[ ( β0+ ε ( z ) - ( β0+ ε ( z′) ) )2]= E[ ( ε ( z ) - ε ( z′) )2]= E[ ε ( z )2- 2 ε ( z ) ε ( z′) + ε ( z′)2]= C2(z,z)−2C2(z,z′)+C2(z′,z′).
C2(z,z′)zz′y
Vergleich der beiden Ausdrücke für E[(y(z)−y(z′))2](β1(z1−z′1)+β2(z2−z2)′)2−2C2(z,z′)Ci(z,z)
ε). In der Praxis beinhalten Modelle beide Methoden. Welche Sie wählen, hängt davon ab, was Sie mit dem Modell erreichen möchten und wie sich die räumliche Autokorrelation entwickelt - ob sie durch zugrunde liegende Trends impliziert wird oder Variationen widerspiegelt, die Sie als zufällig betrachten möchten. Keines ist immer richtig, und bei einem bestimmten Problem ist es häufig möglich, beide Arten von Modellen zu verwenden, um die Daten zu analysieren, das Phänomen zu verstehen und ihre Werte an anderen Stellen vorherzusagen (Interpolation).