Einige Aspekte des Problems:
Wenn uns jemand einen Vektor mit Zahlen und eine anpassbare Matrix mit Zahlen X gibt , müssen wir nicht wissen, in welcher Beziehung sie stehen, um eine Schätzalgebra auszuführen und y als abhängige Variable zu behandeln. Die Algebra ergibt sich unabhängig davon, ob diese Zahlen Querschnitts- oder Zeitreihen- oder Paneldaten darstellen oder ob die Matrix X verzögerte Werte von y usw. enthält . yX.yX.y
Die grundlegende Definition des Bestimmungskoeffizienten lautetR.2
R.2= 1 - S.S.r e sS.S.t o t
Dabei ist die Summe der quadratischen Residuen aus einem Schätzverfahren und die Summe der quadratischen Abweichungen der abhängigen Variablen von ihrem Stichprobenmittelwert.S.S.r e sS.S.t o t
In Kombination wird für eine bestimmte Datenstichprobe, eine bestimmte Formulierung der Beziehung zwischen den Variablen und ein bestimmtes Schätzverfahren immer eindeutig berechnet, sofern nur das Schätzverfahren so ist, dass es Punktschätzungen liefert der beteiligten unbekannten Größen (und damit Punktschätzungen der abhängigen Variablen und damit Punktschätzungen der Residuen). Wenn sich einer dieser drei Aspekte ändert, ändert sich im Allgemeinen der arithmetische Wert von - dies gilt jedoch für jede Art von Daten, nicht nur für Zeitreihen.R.2R.2
Das Problem mit und Zeitreihen ist also nicht, ob es "eindeutig" ist oder nicht (da die meisten Schätzverfahren für Zeitreihendaten Punktschätzungen liefern). Die Frage ist, ob das "übliche" Zeitreihenspezifikations-Framework für technisch geeignet ist und ob einige nützliche Informationen liefert. R.2R.2R.2
Die Interpretation von als "Anteil der erklärten Varianz der abhängigen Variablen" hängt entscheidend von den Residuen ab, die sich zu Null addieren. Im Kontext der linearen Regression (für jede Art von Daten) und der Schätzung der gewöhnlichen kleinsten Quadrate ist dies nur dann garantiert, wenn die Spezifikation einen konstanten Term in der Regressormatrix enthält (eine "Drift" in der Zeitreihen-Terminologie). In autoregressiven Zeitreihenmodellen ist eine Drift in vielen Fällen nicht enthalten. R.2
Allgemeiner ausgedrückt, wenn wir mit Zeitreihendaten konfrontiert sind, beginnen wir "automatisch" darüber nachzudenken, wie sich die Zeitreihen in der Zukunft entwickeln werden. Daher bewerten wir ein Zeitreihenmodell eher danach, wie gut es zukünftige Werte vorhersagt , als danach, wie gut es zu früheren Werten passt . Aber das spiegelt hauptsächlich das letztere wider, nicht das erstere. Die bekannte Tatsache, dass in der Anzahl der Regressoren nicht abnimmt, bedeutet, dass wir eine perfekte Anpassung erhalten können , indem wir weiterhin Regressoren hinzufügen ( alle Regressoren, dh jede Reihe von Zahlen, die möglicherweise konzeptionell völlig unabhängig von der abhängigen Variablen sind). . Die Erfahrung zeigt, dass eine so erhaltene perfekte Passform auch miserabel istR.2R.2 Vorhersagen außerhalb der Stichprobe.
Intuitiv geschieht dieser möglicherweise kontraintuitive Kompromiss, weil wir durch die Erfassung der gesamten Variabilität der abhängigen Variablen in einer geschätzten Gleichung die unsystematische Variabilität in Bezug auf die Vorhersage in eine systematische umwandeln (hier sollte "unsystematisch" relativ zu unserem Wissen verstanden werden - Aus rein deterministischer philosophischer Sicht gibt es keine "unsystematische Variabilität". In dem Maße, in dem unser begrenztes Wissen uns zwingt, eine gewisse Variabilität als "unsystematisch" zu behandeln, ist der Versuch, sie dennoch systematisch zu machen Komponente, bringt Vorhersagekatastrophe).
Tatsächlich ist dies vielleicht der überzeugendste Weg, um jemandem zu zeigen, warum nicht das Hauptdiagnose- / Bewertungsinstrument sein sollte, wenn es um Zeitreihen geht: Erhöhen Sie die Anzahl der Regressoren bis zu einem Punkt, an dem . Nehmen Sie dann die geschätzte Gleichung und versuchen Sie, die zukünftigen Werte der abhängigen Variablen vorherzusagen.R.2R.2≈ 1