Kann jemand die Autokorrelationsfunktion in Zeitreihendaten erklären? Wenn Sie acf auf die Daten anwenden, wie lautet die Anwendung?
Kann jemand die Autokorrelationsfunktion in Zeitreihendaten erklären? Wenn Sie acf auf die Daten anwenden, wie lautet die Anwendung?
Antworten:
Im Gegensatz zu regulären Stichprobendaten werden Zeitreihendaten geordnet. Daher gibt es zusätzliche Informationen über Ihre Probe , dass Sie könnte ausnutzen, wenn es sinnvoll zeitliche Muster sind. Die Autokorrelationsfunktion ist eines der Werkzeuge, die zum Auffinden von Mustern in den Daten verwendet werden. Insbesondere zeigt die Autokorrelationsfunktion die Korrelation zwischen Punkten an, die durch verschiedene Zeitverzögerungen voneinander getrennt sind. Als Beispiel sind hier einige mögliche acf-Funktionswerte für eine Reihe mit diskreten Zeiträumen:
Die Notation ist ACF (n = Anzahl der Zeiträume zwischen Punkten) = Korrelation zwischen Punkten, die durch n Zeiträume getrennt sind. Ich gebe Beispiele für die ersten Werte von n.
ACF (0) = 1 (alle Daten sind perfekt mit sich selbst korreliert), ACF (1) = 0,9 (die Korrelation zwischen einem Punkt und dem nächsten Punkt ist 0,9), ACF (2) = 4 (die Korrelation zwischen einem Punkt) und ein Punkt zwei Zeitschritte voraus ist 0.4) ... etc.
Das ACF zeigt Ihnen also, wie korrelierte Punkte miteinander sind, basierend auf der Anzahl der Zeitschritte, durch die sie voneinander getrennt sind. Das ist der Kern der Autokorrelation. Es geht darum, wie korreliert vergangene Datenpunkte mit zukünftigen Datenpunkten für verschiedene Werte der Zeittrennung sind. Normalerweise würde man erwarten, dass die Autokorrelationsfunktion in Richtung 0 abfällt, wenn die Punkte stärker voneinander getrennt werden (dh in der obigen Notation wird n groß), da es im Allgemeinen schwieriger ist, aus einem gegebenen Datensatz eine Prognose für die Zukunft zu erstellen. Dies ist keine Regel, aber typisch.
Nun zum zweiten Teil ... warum interessiert es uns? Die ACF und ihre Schwester fungieren teilweiseDie Autokorrelationsfunktion (mehr dazu gleich) wird im Box-Jenkins / ARIMA-Modellierungsansatz verwendet, um zu bestimmen, wie vergangene und zukünftige Datenpunkte in einer Zeitreihe zusammenhängen. Die partielle Autokorrelationsfunktion (PACF) kann als die Korrelation zwischen zwei Punkten betrachtet werden, die durch eine bestimmte Anzahl von Perioden n, ABER mit dem Effekt der entfernten dazwischenliegenden Korrelationen getrennt sind. Dies ist wichtig, da in der Realität jeder Datenpunkt nur direkt mit dem NEXT-Datenpunkt korreliert ist und kein anderer. Es wird jedoch so aussehen, als ob der aktuelle Punkt mit Punkten in der Zukunft korreliert ist, aber nur aufgrund eines Effekts vom Typ "Kettenreaktion", dh T1 ist direkt korreliert mit T2, das direkt mit T3 korreliert ist, so dass es so aussieht T1 ist direkt mit T3 korreliert. Das PACF entfernt die zwischenzeitliche Korrelation mit T2, damit Sie Muster besser erkennen können. Ein schönes Intro dazu istHier.
Das Online-Handbuch zu NIST Engineering Statistics enthält ebenfalls ein Kapitel dazu und eine beispielhafte Zeitreihenanalyse unter Verwendung von Autokorrelation und partieller Autokorrelation. Ich werde es hier nicht reproduzieren, aber gehen Sie es durch und Sie sollten ein viel besseres Verständnis der Autokorrelation haben.
Lass mich dir eine andere Perspektive geben.
Zeichnen Sie die verzögerten Werte einer Zeitreihe mit den aktuellen Werten der Zeitreihe.
Wenn der angezeigte Graph linear ist, besteht eine lineare Abhängigkeit zwischen den aktuellen Werten der Zeitreihe und den verzögerten Werten der Zeitreihe.
Autokorrelationswerte sind der naheliegendste Weg, um die Linearität dieser Abhängigkeit zu messen.