Kreuzkorrelation zwischen zwei saisonalen Reihen

8

Um zu bestimmen , Kreuzkorrelation zwischen Salesund Variable cost, die beide mit monatlicher Saisonalität, brauche ich , um de-seasonalize beid Serien?

time-series seasonality cross-correlation

— tooshrit
quelle

6

Die wesentliche Frage ist, welches Problem versuchen Sie zu lösen?

Wenn Sie beabsichtigen, ein gutes Modell für die Daten zu erstellen (und das Modell später zum Testen von Hypothesen, Prognosen oder was auch immer zu verwenden), müssen Sie alle vorhandenen Muster berücksichtigen. Wenn es Saisonalität gibt, sollten Sie saisonale Muster in Ihr Modell aufnehmen. Wenn Sie dies nicht tun, ist das Modell möglicherweise nicht ausreichend. Dies kann zu unzuverlässigen Hypothesentestergebnissen, schlechten Prognosen usw. führen.

Jetzt sagen Sie, Sie möchten die Kreuzkorrelation zwischen zwei Reihen bestimmen (was ich als Schätzung interpretieren werde). Ich verstehe, dass die Kreuzkorrelation nur die reguläre Korrelation ist, die für verschiedene Verzögerungen gegenüber den Ableitungen der beiden Reihen geschätzt wird. Für die Intuition reicht es aus, die regelmäßige Korrelation zu berücksichtigen, was ich von nun an tun werde. Die Idee kann nahtlos von der regulären Korrelation zur Kreuzkorrelation übertragen werden.

Wenn beide Zeitreihen bivariat , würde die Stichprobenkorrelation einer Populationskorrelation entsprechen. Daher könnten Sie eine aussagekräftige Punktschätzung, ein Konfidenzintervall und was nicht haben. Wenn jedoch mindestens eine der Zeitreihen nicht , wird es schwierig, ein Populationsgegenstück der Stichprobenkorrelation zu definieren, und anschließend sind die Schätzungen schwer zu interpretieren. Dann wird es einfacher, ein Modell für Ihre Daten anzugeben und Fragen zum Modell zu stellen. $i.i.d.$ $i.i.d.$

wir nun an, dass beide Reihen bis auf saisonale Muster in ihren Mitteln bivariat sind . Dann können Sie diese entfernen und die Korrelation der saisonbereinigten Reihen schätzen (die zu diesem Zeitpunkt ungefähr bivariat sein ). Beachten Sie jedoch, dass die Korrelation, die Sie nach der saisonalen Anpassung erhalten, nicht aussagekräftig für Ihre ursprüngliche Frage ist: "Wie ist die Korrelation zwischen den beiden Serien?" Zum Beispiel könnten Ihre beiden Serien genau das gleiche saisonale Muster und nur geringfügige zufällige Abweichungen aufweisen. Somit sind die beiden Serien fast gleich, und Sie würden intuitiv denken, dass ihre Korrelation positiv und wirklich hoch sein sollte (nahe an der Einheit). Aber die Stichprobenkorrelation, die Sie nach der saisonalen Anpassung erhalten $i.i.d.$ $i.i.d.$ kann irgendwo zwischen [-1,1] liegen, da die (geschätzten, aber auch die wahren zugrunde liegenden) zufälligen Rauschkomponenten der beiden Reihen korreliert sein können oder nicht. Auf diese Weise erhalten Sie eine Antwort auf eine Frage, an der Sie nicht wirklich interessiert sind. Es gibt keine Garantie dafür, dass die Antwort irgendwo in der Nähe dessen liegt, wonach Sie tatsächlich suchen.

Daher empfehle ich Ihnen, sich auf ein vollständig spezifiziertes Modell zu verlassen (es sei denn, beide Zeitreihen sind bivariate ) und Fragen zum Modell zu stellen. Wenn Sie jedoch keine Zeit für die Erstellung eines Modells haben und eine schnelle Antwort benötigen (was passieren kann), ist die relevanteste Punktschätzung der Korrelation zwischen den beiden Reihen meines Erachtens nur die reguläre Stichprobenkorrelation (obwohl) Es hat das Problem, kein bedeutungsvolles Gegenstück in der Bevölkerung zu haben, und sein Konfidenzintervall wäre schwer zu definieren, wie oben erläutert. $i.i.d.$

— Richard Hardy
quelle

1

Wenn Sie zwei (nicht verwandte) Zeitreihen mit Saisonalität zurückbilden, erhalten Sie möglicherweise eine sogenannte falsche Korrelation . Ein Beispiel dafür finden Sie hier

"Es ist wichtig zu prüfen, ob signifikante Trends in der Reihe existieren. Wenn wir einen gemeinsamen Trend ignorieren, schätzen wir möglicherweise eine falsche Regression, bei der sowohl die als auch die Variablen aufgrund des Einflusses auf beide ausgelassen zu sein scheinen Faktor, der Lauf der Zeit "- Quelle $y$ $X$

Der gemeinsame Trend könnte ein Drift- oder ein Saisonalitätsmuster sein. Um falsche Korrelationen zu vermeiden, ist es ein Eckpfeiler, Ihre Daten aufzuhellen und die Auswirkungen von Trend und Saisonalität auszugleichen. Sie können dann auf die Residuen zurückgreifen.

Eine formellere Einführung in das Problem finden Sie hier

— IcannotFixThis
quelle

1

Viele gute Punkte, aber ich habe einige Bedenken, insbesondere, ob der vorgeschlagene Ansatz das eigentliche Problem angehen und die richtige Frage beantworten würde. Vielleicht finden Sie meine Perspektive in einer anderen Antwort auf diese Frage.

— Richard Hardy

1

Der Link zur "formelleren Lösung" scheint zu einer allgemeinen Uni-Seite zu führen. Könnten Sie es aktualisieren, um auf den Artikel zu verweisen, falls dieser noch verfügbar ist?

— Peter Ellis
quelle