vcovHC, vcovHAC, NeweyWest - welche Funktion soll verwendet werden?

Ich versuche, mein lm () -basiertes Modell zu aktualisieren, um korrekte Standardfehler und -tests zu erhalten. Ich bin wirklich verwirrt, welche VC-Matrix ich verwenden soll. Die sandwichPaketangebote vcovHC, vcovHACund NeweyWest. Während erstere nur die Heteroskedastizität erklären, erklären die beiden letzteren sowohl die serielle Korrelation als auch die Heteroskedastizität. Die Dokumentation sagt jedoch nicht viel über den Unterschied zwischen den beiden letzteren aus (zumindest verstehe ich das nicht). Als ich mir die Funktion selbst ansah, stellte ich fest, dass NeweyWest tatsächlich vcovHAC aufruft.

Empirisch sind die Ergebnisse von coeftest(mymodel, vcov. = vcovHAC)und coeftest(mymodel, vcov. = NeweyWest)verrückt verrückt. Während dies vcovHACetwas nahe an den naiven lm-Ergebnissen liegt, werden bei Verwendung von NeweyWest alle Koeffizienten unbedeutend (Tests sogar nahe an 1).

regression time-series neweywest

— hans0l0
quelle

Normalerweise enthalten die R-Hilfeseiten einen Link zu den Artikeln. Die genauen Details befinden sich normalerweise dort. Zeileis Artikel zum Beispiel ist frei verfügbar und enthält eine Fülle von Informationen.

— mpiktas

In Zeileis Artikel wird ausdrücklich angegeben, wie vcovHACsich von unterscheidet NeweyWest. Zusammenfassend unterscheiden sich verschiedene HAC-Methoden nur bei der Wahl der Gewichte. NeweyWesthat seine angegebenen Gewichte, vcovHACist eine allgemeine Funktion, mit der Sie Ihre eigenen Gewichte angeben können , und verwendet standardmäßig Andrews-Gewichte.

— mpiktas

@mpiktas: Danke für die Zusammenfassung. Da ich keine Gewichte angegeben habe, sollten die jeweiligen Standardgewichte verwendet werden. Jetzt, wo ich es weiß, sollte ich meine Frage vielleicht noch einmal wiederholen: Warum machen unterschiedliche Standardgewichte von vcovHAC und NeweyWest einen so großen Unterschied und wie werden Gewichte bestimmt? Ich meine, wissen Sie, welche Gewichte STATA oder andere Pakete verwenden?

— hans0l0

Alle diese Berechnungen hängen von der Tatsache ab, dass stationäre Variablen sind, wobei die Regressoren und die Störungen sind. Stationarität ist eine etwas restriktive Eigenschaft. Überprüfen Sie daher, ob sie gültig ist.

x_{t} u_{t}

$x_tu_t$

x_{t}

$x_t$

u_{t}

$u_t$

— mpiktas

Bei dem fraglichen "Sandwich" handelt es sich um zwei Brotstücke, die durch die erwarteten Informationen definiert sind und ein Fleisch enthalten, das durch die beobachteten Informationen definiert ist. Siehe meine Kommentare hier und hier . Für eine lineare Regression lautet die Schätzgleichung:

U (β) = X^{T} (Y - X^{T} β)

$U(\beta) = \mathbf{X}^T\left(Y - \mathbf{X}^T\beta\right)$

Die erwartete Information (Brot) ist:

A = \frac{\partial U (β)}{\partial β} = - (X^{T} X)

$A = \frac{\partial U(\beta)}{\partial \beta} = -(\mathbf{X}^T\mathbf{X})$

Die beobachteten Informationen (Fleisch) sind:

B = E (U (β) U (β)^{T}) = X^{T} (Y - X^{T} β) (Y - X^{T} β)^{T} X

$B = E(U(\beta)U(\beta)^T) = \mathbf{X}^T(Y-\mathbf{X}^T\beta)(Y-\mathbf{X}^T\beta)^T\mathbf{X}$

Es ist zu beachten, dass der innere Term eine Diagonale konstanter Residuen ist, wenn die Annahme einer homoskedastischen, unabhängigen Daten erfüllt ist. Dann ist der Sandwich-Kovarianzschätzer, der durch ist, die übliche lineare Regressionskovarianzmatrix wobei die Varianz der Residuen ist. Das ist jedoch ziemlich streng. Sie erhalten eine erheblich breitere Klasse von Schätzern, indem Sie die Annahmen um die Restmatrix lockern: . $A^{-1}BA^{-1}$ $\sigma^2 \left(\mathbf{X}^T\mathbf{X}\right)^{-1}$ $\sigma^2$ $n \times n$

R = (Y - X^{T} β) (Y - X^{T} β)

$R = (Y-\mathbf{X}^T\beta)(Y-\mathbf{X}^T\beta)$

Der "HC0" vcovHC-Schätzer ist auch dann konsistent, wenn die Daten nicht unabhängig sind. Ich werde also nicht sagen, dass wir "annehmen", dass die Residuen unabhängig sind, aber ich werde sagen, dass wir "eine funktionierende unabhängige Kovarianzstruktur" verwenden. Dann wird die Matrix durch eine Diagonale der Residuen ersetzt $R$

R_{i i} = (Y_{i} - β X_{I .})^{2}, 0 elsewhere

$R_{ii} = (Y_i - \beta \mathbf{X}_{I.})^2, \quad 0\text{ elsewhere}$

Dieser Schätzer funktioniert sehr gut, außer bei kleinen Stichproben (<40 wird oft behauptet). Die HC1-3 sind verschiedene Korrekturen für endliche Proben. HC3 ist im Allgemeinen die leistungsstärkste.

Wenn es jedoch autoregressive Effekte gibt, sind die nicht diagonalen Einträge von ungleich Null, so dass eine skalierte Kovarianzmatrix basierend auf üblicherweise verwendeten autoregressiven Strukturen erzeugt wird. Dies ist die Begründung für den "vcovHAC". Hier werden sehr flexible und allgemeine Methoden zur Abschätzung des autoregressiven Effekts erstellt: Die Details können den Rahmen Ihrer Frage sprengen. Die "fleischHAC" -Funktion ist das allgemeine Arbeitstier: Die Standardmethode ist Andrews '. Newey-West ist ein Sonderfall des allgemeinen autoregressiven Fehlerschätzers. Diese Methoden lösen eines von zwei Problemen: 1. Mit welcher Geschwindigkeit nimmt die Korrelation zwischen "benachbarten" Beobachtungen ab und 2. wie groß ist der angemessene Abstand zwischen zwei Beobachtungen? Diese Wenn Sie ausgeglichene Paneldaten haben, ist dieser Kovarianzschätzer übertrieben. $T$ geegeePaket, das stattdessen die Kovarianzstruktur AR-1oder ähnliches angibt .

Die Verwendung hängt von der Art der Datenanalyse und der wissenschaftlichen Frage ab. Ich würde nicht empfehlen, alle Typen zu montieren und den Typ auszuwählen, der am besten aussieht, da es sich um ein Problem mit mehreren Tests handelt. Wie ich bereits angedeutet habe, ist der vcovHC-Schätzer auch bei Vorhandensein eines autoregressiven Effekts konsistent, sodass Sie unter verschiedenen Umständen ein "Korrelationsmodell für die Arbeitsunabhängigkeit" verwenden und begründen können.

— AdamO
quelle