räumliche Autokorrelation für Zeitreihendaten

Ich habe einen 20-jährigen Datensatz mit einer jährlichen Anzahl von Arten für eine Reihe von Polygonen (~ 200 unregelmäßig geformte, kontinuierliche Polygone). Ich habe eine Regressionsanalyse verwendet, um Trends (Änderung der Anzahl pro Jahr) für jedes Polygon sowie Aggregationen von Polygondaten basierend auf Verwaltungsgrenzen abzuleiten.

Ich bin sicher, dass die Daten eine räumliche Autokorrelation aufweisen, die sich sicher auf die Regressionsanalyse für die aggregierten Daten auswirkt. Meine Frage ist: Wie führe ich einen SAC-Test für Zeitreihendaten durch? Muss ich mir für jedes Jahr den SAC der Residuen aus meiner Regression ansehen (globales Morans I)? Oder kann ich einen Test mit allen Jahren durchführen?

Wenn ich einmal getestet habe, dass es SAC gibt, gibt es eine einfache Möglichkeit, dies zu beheben? Mein Statistikhintergrund ist minimal und alles, was ich über räumlich-zeitliche Modellierung gelesen habe, klingt sehr komplex. Ich weiß, dass R eine entfernungsgewichtete Autokovariatenfunktion hat - ist das überhaupt einfach zu bedienen?

Ich bin wirklich ziemlich verwirrt darüber, wie SAC für dieses Problem bewertet / hinzugefügt werden soll, und würde mich über Vorschläge, Links oder Referenzen sehr freuen. Danke im Voraus!

— Rozza
quelle

Möchten Sie zugrunde liegende räumliche Prozesse modellieren oder möchten Sie Ihre Varianz-Kovarianz-Matrixschätzung anpassen, um die räumliche Autokorrelation zu berücksichtigen?

— generic_user

Oder wollen Sie beides tun ...

— Gregmacfarlane

Danke für deine Antworten! Ich denke, dass meine Daten eine räumliche Autodependenz aufweisen - es ist biologisch und sehr wahrscheinlich, dass die Anzahl der Arten in benachbarten Einheiten die umgebenden Einheiten beeinflusst. Meine Einheiten sind ziemlich groß, daher beabsichtige ich, nur die Option "Verbinden an Kanten und Ecken" zu verwenden, um die Distanzverzögerung zum Testen des SAC festzulegen. Die R-Funktionen für die SAC-Modelle sehen machbar aus (immer noch über meinem Kopf!). Danke noch einmal.

— Rozza

Willkommen auf der Seite Rozza, dies sollte als Kommentar zu einer der Antworten hinterlassen werden. Stellen Sie jedoch sicher, dass Sie die vorhandenen Antworten positiv bewerten, wenn sie hilfreiche Antworten liefern, und markieren Sie eine davon als Antwort auf Ihre Frage, wenn Sie der Meinung sind, dass sie zufriedenstellend beantwortet wurde.

— Andy W

Antworten:

Laut diesem Artikel ist OLS bei räumlicher Autokorrelation konsistent, aber Standardfehler sind falsch und müssen angepasst werden. Solomon Hsiang bietet Stata- und Matlab-Code zur Verfügung. Leider kenne ich dafür keinen R-Code.

Es gibt sicherlich andere Ansätze für diese Art von Problem in der räumlichen Statistik, die räumliche Prozesse explizit modellieren. Dieser bläst nur die Standardfehler auf.

Theoretische Ökonomen scheinen sich leider über die Verschleierung zu freuen. Das verlinkte Papier ist wirklich schwer zu lesen. Grundsätzlich heißt es, dass Sie die gewünschte Regression ausführen und später die Standardfehler beheben, dh den Code von Hsiang verwenden. Der Raum kommt erst hinein, wenn Sie versuchen, die Varianz Ihres Schätzers zu schätzen. Wenn der Unterschied nahe beieinander liegt, sind Sie sich intuitiv weniger sicher, dass Ihre Schätzung nicht nur ein Relikt eines unbeobachteten räumlichen Schocks ist.

Beachten Sie, dass Sie eine Kernelbandbreite angeben müssen, über die der räumliche Prozess möglicherweise ausgeführt wird.

Diese Antwort ist im Grunde eine Wiederholung einer ähnlichen Antwort, die ich hier gemacht habe

— generic_user
quelle

Wenn das Problem autokorrelierte Fehler sind, $y = X\beta + u, u=\rho Wu + \epsilon$ Dann ist OLS konsistent, aber ineffizient, wie ACD sagt. Es ist wie eine serielle Korrelation in der Zeitreihenökonometrie.

Aber wenn es räumliche Autodependenz gibt (verwirrenderweise auch Autokorrelation genannt), $y = \rho W y+ X\beta + \epsilon$ , dann ist OLS inkonsistent. Es ist dasselbe wie eine fehlende variable Vorspannung. Wenn Sie beide Probleme haben, müssen Sie das Spatial Durbin-Modell verwenden. $y = \rho W y + X\beta + WX \lambda + \epsilon$ .

Das spdep- Paket für R enthält zahlreiche Funktionen, die räumliche Gewichtungsmatrizen berechnen, räumliche Regressionen schätzen und andere Dinge tun. Ich habe viel Erfahrung mit den lagsarlmFunktionen, aber in der Paketdokumentation sehen Sie, dass es eine sacsarlmFunktion gibt, die mehr von dem zu sein scheint, wonach Sie suchen.

Was den zeitlichen Aspekt Ihres Problems betrifft, werden die Annahmen, die Sie in Abhängigkeit treffen, einen großen Beitrag zur Bestimmung Ihrer Modellspezifikation leisten. Interagieren Ihre Bereiche direkt miteinander? Beispiele hierfür sind Handels- oder Wohnungsmärkte; Die Exporte aus einem Land hängen stark von den Importen in einem anderen Land ab, und der Verkaufspreis kürzlich gekaufter Häuser ist ein sehr wichtiger Beitrag zum Verkaufspreis benachbarter Häuser. In diesem Fall ist es sinnvoll, Ihre Gewichtsmatrix anzugeben $W$ um dieser Abhängigkeit Rechnung zu tragen. Lassen Sie ein Haus rechtzeitig kaufen $t$ "Nachbarn" mit Häusern in der Zeit zu sein $t-1$ , aber nicht mit Häusern in der Zeit $t +1$ .

Wenn Ihre Begriffe korreliert sind, aber nicht logisch voneinander abhängig sind, wie z. B. landwirtschaftliche Erträge, wäre es wahrscheinlich sinnvoller, eine einzige zeitunempfindliche Matrix zu haben $W$ , aber um Jahr Dummies in die aufzunehmen $X$ Spezifikation.

— Gregmacfarlane
quelle

Guter Post. Ich denke, die Unterscheidung, die das OP bei der Wahl zwischen den beiden Ansätzen berücksichtigen sollte, besteht darin, ob das "Ergebnis" in einem Polygon das Ergebnis seiner Nachbarn beeinflusst. Wenn ja, gehen Sie mit gmacfarlanes Ansatz. Wenn nicht, ist der von mir vorgeschlagene einfacher.

— generic_user