Bei dem fraglichen "Sandwich" handelt es sich um zwei Brotstücke, die durch die erwarteten Informationen definiert sind und ein Fleisch enthalten, das durch die beobachteten Informationen definiert ist. Siehe meine Kommentare hier und hier . Für eine lineare Regression lautet die Schätzgleichung:
U(β)=XT(Y−XTβ)
Die erwartete Information (Brot) ist:
A=∂U(β)∂β=−(XTX)
Die beobachteten Informationen (Fleisch) sind:
B=E(U(β)U(β)T)=XT(Y−XTβ)(Y−XTβ)TX
Es ist zu beachten, dass der innere Term eine Diagonale konstanter Residuen ist, wenn die Annahme einer homoskedastischen, unabhängigen Daten erfüllt ist. Dann ist der Sandwich-Kovarianzschätzer, der durch ist, die übliche lineare Regressionskovarianzmatrix wobei die Varianz der Residuen ist. Das ist jedoch ziemlich streng. Sie erhalten eine erheblich breitere Klasse von Schätzern, indem Sie die Annahmen um die Restmatrix lockern: .A−1BA−1σ2(XTX)−1σ2n×n
R=(Y−XTβ)(Y−XTβ)
Der "HC0" vcovHC
-Schätzer ist auch dann konsistent, wenn die Daten nicht unabhängig sind. Ich werde also nicht sagen, dass wir "annehmen", dass die Residuen unabhängig sind, aber ich werde sagen, dass wir "eine funktionierende unabhängige Kovarianzstruktur" verwenden. Dann wird die Matrix durch eine Diagonale der Residuen ersetztR
Rii=(Yi−βXI.)2,0 elsewhere
Dieser Schätzer funktioniert sehr gut, außer bei kleinen Stichproben (<40 wird oft behauptet). Die HC1-3 sind verschiedene Korrekturen für endliche Proben. HC3 ist im Allgemeinen die leistungsstärkste.
Wenn es jedoch autoregressive Effekte gibt, sind die nicht diagonalen Einträge von ungleich Null, so dass eine skalierte Kovarianzmatrix basierend auf üblicherweise verwendeten autoregressiven Strukturen erzeugt wird. Dies ist die Begründung für den "vcovHAC". Hier werden sehr flexible und allgemeine Methoden zur Abschätzung des autoregressiven Effekts erstellt: Die Details können den Rahmen Ihrer Frage sprengen. Die "fleischHAC" -Funktion ist das allgemeine Arbeitstier: Die Standardmethode ist Andrews '. Newey-West ist ein Sonderfall des allgemeinen autoregressiven Fehlerschätzers. Diese Methoden lösen eines von zwei Problemen: 1. Mit welcher Geschwindigkeit nimmt die Korrelation zwischen "benachbarten" Beobachtungen ab und 2. wie groß ist der angemessene Abstand zwischen zwei Beobachtungen? Diese Wenn Sie ausgeglichene Paneldaten haben, ist dieser Kovarianzschätzer übertrieben.Tgee
gee
Paket, das stattdessen die Kovarianzstruktur AR-1
oder ähnliches angibt .
Die Verwendung hängt von der Art der Datenanalyse und der wissenschaftlichen Frage ab. Ich würde nicht empfehlen, alle Typen zu montieren und den Typ auszuwählen, der am besten aussieht, da es sich um ein Problem mit mehreren Tests handelt. Wie ich bereits angedeutet habe, ist der vcovHC-Schätzer auch bei Vorhandensein eines autoregressiven Effekts konsistent, sodass Sie unter verschiedenen Umständen ein "Korrelationsmodell für die Arbeitsunabhängigkeit" verwenden und begründen können.