Wann sollten feste Effekte im Vergleich zu Cluster-SEs verwendet werden?


17

Angenommen , Sie haben einen einzigen Querschnitt von Daten , bei denen Personen befinden sich innerhalb von Gruppen (zB Studenten in Schulen) , und Sie mögen ein Modell der Form abzuschätzen , Y_i = a + B*X_iwo Xein Vektor der individuellen Ebene Eigenschaften und aeine Konstante.

Nehmen Sie in diesem Fall an, dass die unbeobachtete Heterogenität zwischen den Gruppen Ihre Punktschätzungen Bund deren SEs beeinflusst, da sie mit Ihrer unabhängigen interessierenden Variablen korreliert.

Eine Möglichkeit besteht darin, Ihre SEs nach Gruppen (Schulen) zu gruppieren. Eine andere Möglichkeit besteht darin, Gruppen-FEs einzuschließen. Eine andere ist, beide zu verwenden. Was ist bei der Auswahl zwischen diesen Optionen zu beachten? Es ist besonders unklar, warum man SEs nach Gruppe gruppieren UND Gruppe FE verwenden könnte. In meinem speziellen Fall habe ich 35 Gruppen und 5.000 Personen, die in jeder Gruppe verschachtelt sind . Ich habe die Diskussion in diesem PDF verfolgt , aber es ist nicht ganz klar, warum und wann man sowohl Clustered SEs als auch Fixed Effects verwenden könnte.

(Bitte besprechen Sie die Vor- und Nachteile von SEs in Clustern im Vergleich zu FEs, anstatt vorzuschlagen, dass ich nur ein Mehrebenenmodell einsetze.)

Antworten:


21

Bei beiden Ansätzen, bei denen gruppenfixierte Effekte und / oder clusterangepasste Standardfehler verwendet werden, werden unterschiedliche Probleme im Zusammenhang mit Clusterdaten (oder Paneldaten) berücksichtigt, und ich würde sie eindeutig als unterschiedliche Ansätze betrachten. Oft möchten Sie beide verwenden:

Zuallererst berücksichtigen clusterangepasste Standardfehler die Korrelation innerhalb des Clusters oder die Heteroskedastizität, die der Fixeffektschätzer nicht berücksichtigt, es sei denn, Sie sind bereit, weitere Annahmen zu treffen. Eine ausführliche Erläuterung finden Sie in den Vorlesungsfolien von Imbens und Wooldridge und lange Panels und verschiedene Probleme im Zusammenhang mit diesem Problem . Zu diesem Thema gibt es auch einen Roman von Cameron und Miller: Ein Leitfaden für Praktiker zur Cluster-Robust-Inferenz, der für Sie interessant sein könnte. Wenn Sie die Varianz-Kovarianz-Matrix nicht modellieren möchten und vermuten, dass eine Korrelation innerhalb des Clusters vorliegt, empfehle ich die Verwendung eines robusten Cluster-Standardfehlers, da die Verzerrung in Ihrer SE schwerwiegend sein kann (viel problematischer als bei Heteroskedastizität, sieheAngrist & Pischke Kapitel III.8 für eine Diskussion zu diesem Thema. Aber du brauchst genug Cluster (Angrist und Pischke sagen 40-50 als Daumenrolle). Cluster-bereinigter Standardfehler berücksichtigt Standardfehler, lässt aber die Punktschätzungen unverändert (Standardfehler steigen normalerweise)!

Die Festeffektschätzung berücksichtigt die nicht beobachtete zeitinvariante Heterogenität (wie Sie erwähnt haben). Dies kann gut oder schlecht sein: Andererseits benötigen Sie weniger Annahmen, um konsistente Schätzungen zu erhalten. Auf der anderen Seite werfen Sie viel Varianz weg, was nützlich sein könnte. Einige Leute wie Andrew Gelman bevorzugen hierarchische Modellierung gegenüber festen Effekten, aber hier gehen die Meinungen auseinander. Die Festeffektschätzung ändert sowohl die Punkt- als auch die Intervallschätzung (auch hier ist der Standardfehler normalerweise höher).

Fazit: Cluster-robuste Standardfehler sind eine einfache Möglichkeit, mögliche Probleme im Zusammenhang mit Clusterdaten zu berücksichtigen, wenn Sie sich nicht mit der Modellierung der Korrelation zwischen und innerhalb von Clustern befassen möchten (und genügend Cluster verfügbar sind). Bei der Schätzung fester Effekte wird nur eine bestimmte Variation verwendet. Daher hängt es von Ihrem Modell ab, ob Sie Schätzungen basierend auf einer geringeren Variation vornehmen möchten oder nicht. Ohne weitere Annahmen wird die Schätzung fester Effekte die Probleme im Zusammenhang mit der Intra-Cluster-Korrelation für die Varianzmatrix jedoch nicht berücksichtigen. Der cluster-robuste Standardfehler berücksichtigt auch keine Probleme im Zusammenhang mit der Verwendung der Schätzung fester Effekte.


2
Gute Antwort. Die entscheidende verbleibende Frage ist, warum man BEIDE haben möchte. Imbens und Wooldridge decken dies teilweise ab.
QuestionAnswer

12

Behobene Effekte dienen dazu, unbeobachtete Heterogenitäten ZWISCHEN verschiedenen Gruppen in Ihren Daten zu beseitigen.

Ich bin mit der Annahme nicht einverstanden, dass die Entscheidung für ein FE-Modell davon abhängt, ob Sie "weniger Variationen" verwenden möchten oder nicht. Wenn Ihre abhängige Variable von nicht beobachtbaren Variablen betroffen ist, die systematisch zwischen Gruppen in Ihrem Panel variieren, wird der Koeffizient für jede Variable, die mit dieser Variation korreliert ist, verzerrt. Sofern Ihre X-Variablen nicht zufällig zugewiesen wurden (und es niemals Beobachtungsdaten geben werden), ist es in der Regel recht einfach, das Argument für die ausgelassene Variablen-Verzerrung zu verwenden. Du darfstEinige der ausgelassenen Variablen können mit einer guten Liste von Kontrollvariablen kontrolliert werden. Wenn jedoch eine eindeutige Identifikation Ihr wichtigstes Ziel ist, kann sogar eine umfangreiche Liste von Kontrollen den kritischen Lesern Raum lassen, an Ihren Ergebnissen zu zweifeln. In diesen Fällen ist es normalerweise eine gute Idee, ein Modell mit festen Effekten zu verwenden.

Clustered-Standardfehler sind für die Berücksichtigung von Situationen gedacht, in denen Beobachtungen INNERHALB jeder Gruppe nicht erfasst werden (unabhängig und identisch verteilt).

Ein klassisches Beispiel ist, wenn Sie im Laufe der Zeit viele Beobachtungen für eine Gruppe von Unternehmen gemacht haben. Sie können feste Effekte auf Unternehmensebene berücksichtigen, es kann jedoch dennoch zu unerklärlichen Abweichungen in Ihrer abhängigen Variablen kommen, die über die Zeit hinweg korrelieren. Im Allgemeinen ist es bei der Arbeit mit Zeitreihendaten normalerweise sicher, eine zeitliche serielle Korrelation in den Fehlerbegriffen innerhalb Ihrer Gruppen anzunehmen. Diese Situationen sind die offensichtlichsten Anwendungsfälle für gruppierte SEs.

Einige anschauliche Beispiele:

Wenn Sie experimentelle Daten haben, bei denen Sie Behandlungen nach dem Zufallsprinzip zuweisen, aber für jede Person / Gruppe im Laufe der Zeit wiederholte Beobachtungen machen, ist es gerechtfertigt, feste Effekte auszulassen, aber Sie möchten Ihre SEs gruppieren.

Alternativ können Sie, wenn Sie viele Beobachtungen pro Gruppe für nicht experimentelle Daten haben, jede Beobachtung innerhalb der Gruppe als Iid-Draw aus ihrer größeren Gruppe betrachten (z. B. haben Sie Beobachtungen von vielen Schulen, aber jede Gruppe ist eine zufällig gezogene Teilmenge von Schülern ihrer Schule) möchten Sie feste Effekte einbeziehen, benötigen jedoch keine gruppierten SEs.


2

Diese Antworten sind in Ordnung, aber die aktuellste und beste Antwort liefern Abadie et al. (2019) "Wann sollten Sie Standardfehler für das Clustering anpassen?" Ein Hauptgrund für Cluster mit festen Effekten ist die Heterogenität der Behandlungseffekte in den Clustern. Es gibt andere Gründe, zum Beispiel, wenn die Cluster (z. B. Unternehmen, Länder) eine Teilmenge der Cluster in der Bevölkerung sind (auf die Sie schließen). Clustering ist ein Designproblem, das die Hauptbotschaft des Papiers ist. Mach es nicht blind.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.