Stationarität - Annahmen und Prüfung


8

Ich untersuche Nagetierfänge auf sechs permanenten Nagetierfanggittern mit einer Größe von 150 x 150 Metern, die aus 121 Fangstationen bestehen, die gleichmäßig 15 Meter voneinander entfernt sind. Auf dem Untersuchungsgebiet gibt es sechs solcher Fanggitter mit einer Größe von <1000 Hektar. Ich möchte die Erfassungsdaten interpolieren, um eine Kriged-Oberfläche mit Nagetieraktivität zu erstellen. Eine Annahme der Interpolation ist, dass die Daten stationär sind.

Wie Fortin & Dale (2005) feststellten

Stationarität ist erforderlich, um Rückschlüsse auf ein Modell zu ziehen, das den Prozess der räumlichen Struktur von Daten an Orten charakterisiert, die nicht abgetastet werden.

Soweit ich weiß, kann ein Prozess als stationär beschrieben werden, wenn seine statistischen Eigenschaften (Mittelwert und Varianz) nicht räumlich variieren.

Aber ist es keine räumliche Variation, warum wir überhaupt räumliche Analysen durchführen?

Stationarität wird sehr oft in der Literatur zur räumlichen / geostatistischen Analyse eingeführt, aber ich muss noch eine solide Richtung und Informationen darüber finden

  1. In welchem ​​Maßstab oder für welche Arten von Studien können Sie davon ausgehen, dass Ihre Daten stationär sind.
  2. wie man Daten untersucht und verifiziert, sind stationär und schließlich
  3. Einmal quantifiziert, wie viel Unterschied von einem Bereich zum nächsten Bereich qualifiziert Ihre Daten als instationär?

Bisher erscheint das Konzept und die Prüfung der Stationarität nach Durchsicht der Literatur höchst subjektiv, willkürlich und / oder verschleiert.

Wenn jemand praktische Ratschläge zu diesem Problem geben kann, würde ich es sehr schätzen!


Diese Diskussion könnte Sie in einem eng verwandten Thread interessieren .
whuber

Antworten:


2

Es gibt immer zwei Möglichkeiten, Statistiken mit den Dingen zu berechnen, über die Sie sprechen:

  1. Berechnen Sie Statistiken innerhalb eines Rasters.
  2. Berechnen Sie Statistiken zwischen verschiedenen Gittern.

Es gibt keinen Grund mehr, dass die statistischen Eigenschaften innerhalb eines Gitters mit den statistischen Eigenschaften zwischen Gittern übereinstimmen müssen. Sie könnten möglicherweise völlig anders sein, dh einer könnte sich in einem Minenfeld ohne Ratten befinden und der andere könnte sich in der Innenstadt von Baltimore befinden. Es ist klar, dass die Verteilung der Ratten sehr unterschiedlich wäre, je nachdem, auf welche Weise ich die Daten aufteile, dh über Gitter oder innerhalb von Gittern.

Stationarität ist die Annahme, dass die von Ihnen berechneten Statistiken gleich sind, unabhängig davon, auf welche Weise Sie die Daten aufgeschnitten haben. In der Praxis können Sie "untersuchen und überprüfen, ob Daten stationär sind", indem Sie Mittel, Abweichungen, Histogramme usw. innerhalb von Standorten und dann über Standorte hinweg analysieren und innerhalb von Konfidenzintervallen prüfen, ob sie identisch sind. Es gibt keine festen Regeln; Sie geben das Beste aus den Daten und den Techniken, die Ihnen zur Verfügung stehen, versuchen, sie mathematisch zu begründen und praktische Ergebnisse zu präsentieren. Ich würde sagen, dass Sie Ihre Methoden rechtfertigen können, wenn Sie auf diese Weise Stationarität in einem Standard-Konfidenzintervall zeigen können, beispielsweise 95% oder 99%.


3
Obwohl dies im Allgemeinen sinnvoll ist, scheint es mir ein wenig im Widerspruch zur üblichen Praxis der räumlichen Statistik zu stehen. Stationarität ist dort eine Entscheidung des Modellierers, keine inhärente Eigenschaft eines Prozesses oder der Daten. Es bezieht sich nicht unbedingt auf die Daten, sondern auf Residuen eines externen Trends oder "Drift". In Ihrem Rattenbeispiel könnten die Unterschiede in der erwarteten Anzahl von Ratten mit Standort mit einer Drift modelliert werden, und der stochastische Teil des Modells könnte als stationär betrachtet werden.
whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.