Warum ist das Ausmaß der Varianz, das von meinem 1. PC erklärt wird, so nahe an der durchschnittlichen paarweisen Korrelation?


9

Welche Beziehung besteht zwischen der ersten Hauptkomponente (n) und der durchschnittlichen Korrelation in der Korrelationsmatrix?

Zum Beispiel beobachte ich in einer empirischen Anwendung, dass die durchschnittliche Korrelation fast gleich dem Verhältnis der Varianz der ersten Hauptkomponente (erster Eigenwert) zur Gesamtvarianz (Summe aller Eigenwerte) ist.

Gibt es eine mathematische Beziehung?

Unten ist die Tabelle der empirischen Ergebnisse. Wenn die Korrelation die durchschnittliche Korrelation zwischen den Renditen der DAX-Aktienindexkomponente ist, die über das 15-Tage-Rolling-Fenster berechnet wurden, und der erklärten Varianz der Anteil der Varianz ist, der durch die erste Hauptkomponente erklärt wird, die ebenfalls über das 15-Tage-Rolling-Fenster berechnet wird.

Könnte dies durch ein gemeinsames Risikofaktormodell wie CAPM erklärt werden?

Geben Sie hier die Bildbeschreibung ein


1
Was passiert wohl, wenn viele der Korrelationen negativ oder nahe Null sind? Generieren Sie beispielsweise einige bivariate Normaldaten mit einer Korrelation von Null. Warum würden Sie erwarten, dass es einen Zusammenhang zwischen Ihrem Varianzverhältnis und dieser Nullkorrelation gibt?
whuber

Antworten:


6

Ich glaube, dass die Beziehung zwischen der mittleren Korrelation und dem Eigenwert des 1. PC existiert, aber nicht eindeutig ist. Ich bin kein Mathematiker, um daraus schließen zu können, aber ich kann zumindest den Ausgangspunkt anzeigen, von dem aus die eigene Intuition oder der eigene Gedanke wachsen könnte.

Wenn Sie standardisierte Variablen als Vektoren im euklidischen Raum zeichnen, in dem sie sitzen (und dies ist der reduzierte Raum, in dem Achsen Beobachtungen sind), ist die Korrelation der Kosinus zwischen zwei Vektoren .

Geben Sie hier die Bildbeschreibung ein

Und da alle Vektoren eine Einheitslänge haben (aufgrund der Standardisierung), sind die Cosinus die Projektionen der Vektoren aufeinander (wie im linken Bild mit drei Variablen gezeigt). Der erste PC ist so eine Zeile in diesem Raum, der die Summe der quadrierten Projektionen auf sie, maximiert ein ‚s, genannt Belastungen; und diese Summe ist der 1. Eigenwert.

Wenn Sie also die Beziehung zwischen dem Mittelwert der drei Projektionen links und der Summe (oder dem Mittelwert) der drei quadratischen Projektionen rechts herstellen, beantworten Sie Ihre Frage nach der Beziehung zwischen der mittleren Korrelation und dem Eigenwert.


6

c

n×n

(1cccc1cccc1cccc1).
(1,1,1,1)/nλ1=1+(n1)cλi=n
R2=1n+n1ncc.

n

Ich gehe davon aus, dass dieses Ergebnis für große Matrizen ungefähr gilt, auch wenn die Korrelationen nicht genau identisch sind.


nn=(1c)/(R2c)c=0.5R2c=0.02n=2530

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.