Ich möchte das Akaike Information Criterion (AIC) verwenden, um die entsprechende Anzahl von Faktoren auszuwählen, die in einem PCA extrahiert werden sollen. Das einzige Problem ist, dass ich nicht sicher bin, wie ich die Anzahl der Parameter bestimmen soll.
Man betrachte eine Matrix , wobei die Anzahl der Variablen und die Anzahl der Beobachtungen darstellt, so dass . Da die Kovarianzmatrix symmetrisch ist, könnte eine maximale Wahrscheinlichkeitsschätzung von die Anzahl der Parameter in der AIC auf . ≤ N ( N + 1 )
Alternativ können Sie in einer PCA die ersten Eigenvektoren und Eigenwerte von extrahieren , sie und und dann berechnen. wobei die durchschnittliche Restvarianz ist. Nach meiner Zählung, wenn Sie f Faktoren haben, würden Sie f Parameter in \ Lambda_ {f} , Nf Parameter in \ beta_ {f} und 1 Parameter in \ sigma_ {r} ^ {2} .Σ β f Λ f Σ = β f Λ f β ' f + I σ 2 r σ 2 R f f Λ f N f β f 1 σ 2 R
Ist dieser Ansatz richtig? Es scheint, als würde dies zu mehr Parametern als dem Maximum-Likelihood-Ansatz führen, wenn die Anzahl der Faktoren auf ansteigt .