Unterschied zwischen Paneldaten und gemischtem Modell


14

Ich möchte den Unterschied zwischen Paneldatenanalyse und gemischter Modellanalyse kennen. Meines Wissens verwenden Paneldaten und gemischte Modelle feste und zufällige Effekte. Wenn ja, warum haben sie unterschiedliche Namen? Oder sind sie auch?

Ich habe den folgenden Beitrag gelesen, in dem die Definition des festen, zufälligen und gemischten Effekts beschrieben wird, aber meine Frage nicht genau beantwortet: Was ist der Unterschied zwischen Modellen mit festen Effekten, zufälligen Effekten und gemischten Effekten?

Ich wäre auch dankbar, wenn mich jemand auf eine kurze (ca. 200 Seiten) Referenz zur gemischten Modellanalyse verweisen könnte. Um es hinzuzufügen, würde ich ungeachtet der Softwarebehandlung gemischte Modellierungsreferenzen bevorzugen. Hauptsächlich theoretische Erklärung der gemischten Modellierung.



Antworten:


22

Sowohl Paneldaten als auch Mixed-Effect-Modelldaten befassen sich mit doppelt indizierten Zufallsvariablen yij . Der erste Index ist für Gruppen, der zweite für Einzelpersonen innerhalb der Gruppe. Für die Paneldaten ist der zweite Index normalerweise die Zeit, und es wird angenommen, dass wir Individuen im Laufe der Zeit beobachten. Wenn die Zeit der zweite Index für ein Modell mit gemischten Effekten ist, werden die Modelle als longitudinale Modelle bezeichnet. Das Mixed-Effekt-Modell lässt sich am besten anhand von 2-Stufen-Regressionen verstehen. (Zur Vereinfachung der Darstellung wird nur eine erklärende Variable angenommen.)

Die Regression der ersten Ebene ist die folgende

yij=αi+xijβi+εij.

Dies wird einfach als individuelle Regression für jede Gruppe erklärt. Die Regression der zweiten Ebene versucht, die Variation der Regressionskoeffizienten zu erklären:

αi=γ0+zi1γ1+ui
βi=δ0+zi2δ1+vi

Wenn Sie die zweite Gleichung durch die erste ersetzen, erhalten Sie

yij=γ0+zi1γ1+xijδ0+xijzi2δ1+ui+xijvi+εij

Die festen Effekte sind die festen, das heißt . Die zufälligen Effekte sind u i und v iγ0,γ1,δ0,δ1uivi .

Jetzt ändert sich die Terminologie für Paneldaten, aber Sie können immer noch Gemeinsamkeiten finden. Das Panel Data Random Effects-Modell ist dasselbe wie das Mixed Effects-Modell mit

β i = δ 0

αi=γ0+ui
βi=δ0

mit dem Modell kommt

yit=γ0+xitδ0+ui+εit,

wo sind zufällige Effekte.ui

Der wichtigste Unterschied zwischen gemischten Effektmodellen und Paneldatenmodellen ist die Behandlung von Regressoren xij . Bei Modellen mit gemischten Effekten handelt es sich um nicht zufällige Variablen, während bei Paneldatenmodellen immer davon ausgegangen wird, dass sie zufällig sind. Dies wird wichtig, wenn angegeben wird, welches Effektmodell für Paneldaten festgelegt ist.

Für das Mischeffektmodell wird angenommen, dass die Zufallseffekte und v i unabhängig von ε i j und auch von x i j und z i sind , was immer dann zutrifft, wenn x i j und z i fest sind. Wenn wir stochastisches x i j zulassenuiviεijxijzixijzixij wird dies wichtig. Das Zufallseffektmodell für Paneldaten geht also davon aus, dass nicht mit u i korreliert ist . Aber das Festeffektmodell hat die gleiche Formxitui

yit=γ0+xitδ0+ui+εit,

erlaubt die Korrelation von und u i . Die Betonung liegt dann ausschließlich auf der konsequenten Schätzung von δ 0 . Dies geschieht durch Subtraktion der einzelnen Mittelwerte:xituiδ0

yity¯i.=(xitx¯i.)δ0+εitε¯i.,

und Verwenden von einfachem OLS für das resultierende Regressionsproblem. Algebraisch fällt dies mit dem Problem der Variablenregression der kleinsten Quadrate zusammen, wobei angenommen wird, dass feste Parameter sind. Daher der Name Fixed Effects Model.ui

In der Paneldaten-Ökonometrie steckt viel Geschichte hinter der Terminologie für feste Effekte und zufällige Effekte, die ich weggelassen habe. Meiner persönlichen Meinung nach lassen sich diese Modelle am besten in Wooldridges " Ökonometrischer Analyse von Querschnitts- und Paneldaten " erklären . Soweit ich weiß, gibt es im Mixed-Effects-Modell keine solche Geschichte, aber ich komme aus der Ökonometrie, sodass ich mich irren könnte.


Als Sie (2) und (3) durch (1) ersetzt haben, ist meiner Meinung nach etwas kaputt gegangen. Ich glaube es sollte sein sei denn, mir fehlt etwas. ...+xijvi+ui+εij
Dimitriy V. Masterov

Diese Erklärung ist wunderbar! Vielen Dank, dass Sie sich die Mühe gemacht haben, mir so eine wunderbare Darstellung zu geben. Ich möchte nur eine Frage stellen. Was meinst du mit 2 Level Regression?
Beta

2
@Ari, die Regression der zweiten Ebene ist eine Regression für Regressionskoeffizienten der Regression der ersten Ebene. Die Regression der ersten Ebene versucht, die Variation innerhalb der Gruppe zu erklären, während die Regression der zweiten Ebene versucht, die Variation zwischen den Gruppen zu erklären. Diese Unterteilung ist künstlich, aber ich mag sie, weil sie sich für mich zumindest natürlich anfühlt. Diese Art der Unterteilung wird auch in hierarchischen Bayes-Modellen verwendet.
mpiktas

Dies ist eine sehr gute Antwort, +1 vor langer Zeit. Das einzige, was ich hier vermisse, ist eine Diskussion darüber, wie der -Koeffizient des "Zufallseffektmodells" in der Ökonometrie geschätzt wird. Du erklärst es für das "Fixed-Effect-Modell", aber kommentierst das Zufallsmodell nicht. Ich würde mich sehr freuen, wenn Sie etwas hinzufügen könnten. δ0
Amöbe sagt Reinstate Monica

3

Sie suchen nach einem Text, der die Theorie der gemischten Modellierung ohne Bezugnahme auf ein Softwarepaket beschreibt.

Ich würde Multilevel Analysis, eine Einführung in die grundlegende und erweiterte Mehrebenenmodellierung von Tom Snijders und Roel Bosker, ca. 250 Seiten empfehlen. Am Ende befindet sich ein Kapitel über Software (das inzwischen etwas veraltet ist), der Rest ist jedoch eine sehr naheliegende Theorie.

Ich muss jedoch sagen, dass ich der obigen Empfehlung für mehrstufige und längsgerichtete Modelle mit Stata von Sophia Rabe-Hesketh und Anders Skrondal zustimme. Das Buch ist sehr theoretisch und die Software-Komponente ist wirklich nur eine schöne Ergänzung zu einem umfangreichen Text. Normalerweise verwende ich Stata nicht und habe den Text auf meinem Schreibtisch und finde ihn sehr gut geschrieben. Es ist jedoch viel länger als 200pp.

Die folgenden Texte wurden alle von aktuellen Experten auf diesem Gebiet verfasst und sind hilfreich für alle, die weitere Informationen zu diesen Techniken wünschen (obwohl sie nicht speziell auf Ihre Anfrage zugeschnitten sind): Benutzer, sorry]

Hoox, Joop (2010). Multilevel-Analyse, Techniken und Anwendungen.

Gelman, A. und Hill, J. (2006) Data Analysis Using Regression und Multilevel / Hierarchical Models.

Singer, J. (2003) Angewandte Längsschnittdatenanalyse: Modellierung von Veränderungen und Ereignisereignissen

Raudenbush, SW, und Bryk, A., S. (2002). Hierarchische lineare Modelle: Anwendungen und Datenanalysemethoden

Luke, Douglas, (2004). Mehrebenenmodellierung

Ich würde auch den oben erwähnten Wooldridge-Text sowie den R-Text an zweiter Stelle setzen, und das B ristol University Center for Multilevel Modeling verfügt über eine Reihe von Tutorials und Informationen


Vielen Dank, Playitagain! Dies ist eine sehr nützliche Information. Auch dein Name ist interessant :)
Beta

2

Ich habe mich auch über den Unterschied zwischen beiden gewundert und als ich kürzlich eine Referenz zu diesem Thema gefunden habe, verstehe ich, dass "Panel-Daten" ein traditioneller Name für Datensätze ist, die einen "Querschnitt oder eine Gruppe von Personen darstellen, die in regelmäßigen Abständen über a befragt werden gegebene Zeitspanne ". Das "Panel" ist also eine Gruppenstruktur innerhalb des Datensatzes, und bei einer solchen Gruppe erfolgt die Analyse dieser Art von Daten am natürlichsten über einen gemischten Modellierungsansatz.

Eine gute Referenz (unabhängig davon, ob Sie R "sprechen" oder nicht) zur Modellierung mit gemischten Effekten ist der Entwurf eines (?) Kommenden Buches von Douglas Bates ( lme4: Modellierung mit gemischten Effekten mit R) ).


1
Danke ils für den Hinweis! Das Problem bleibt jedoch bestehen.
Beta


1

Wenn Sie Stata-, Multilevel- und Longitudinalmodelle verwenden, ist die Verwendung von Stata von Sophia Rabe-Hesketh und Anders Skrondal eine gute Wahl. Je nachdem, was genau Sie interessiert, könnten 200 Seiten in etwa richtig sein.


Vielen Dank Dimitriy für den Hinweis. Leider benutze ich STATA nicht. Ich benutze hauptsächlich SAS und manchmal R. Aber trotzdem danke.
Beta

2
Ich habe gute Dinge über wiley.com/WileyCDA/WileyTitle/productCd-0470073713.html gehört , aber ich habe es nicht selbst gelesen.
Dimitriy V. Masterov

Vielen Dank Dimitriy! Das sieht wirklich vielversprechend aus. Der Vorteil, Fragen zu stellen, anstatt zu brillen, ist, dass Sie wirklich gute Ergebnisse erzielen :)
Beta

1

Meiner Erfahrung nach liegt der Grund für die Verwendung der Panel-Ökonometrie darin, dass die Panel-Schätzer für „feste Effekte“ verwendet werden können, um verschiedene Formen der ausgelassenen variablen Verzerrung zu steuern.

Es ist jedoch möglich, diese Art der Schätzung in einem Mehrebenenmodell unter Verwendung eines Ansatzes vom Typ Mundlak durchzuführen , dh die Gruppenmittel als zusätzliche Regressoren einzubeziehen. Durch diesen Ansatz wird die Korrelation zwischen dem Fehlerterm und den ausgelassenen Faktoren auf potenzieller Gruppenebene aufgehoben, wodurch der Koeffizient „innerhalb“ aufgedeckt wird. Aus einem mir unbekannten Grund geschieht dies jedoch normalerweise nicht in der angewandten Forschung. Diese Folien und dieses Dokument bieten eine Ausarbeitung.


(+1) Soziologen interpretieren die Gruppenmittel häufig als kontextbezogene Effekte (obwohl dies bei verschachtelten Querschnittsdaten häufiger der Fall ist als bei Zeitreihenpaneldaten). Ich muss nachlesen, dass Manski (1993) ( PDF hier ) einen Artikel hat, der zeigt, wie solche kontextbezogenen Effekte häufig nicht identifiziert werden. Aus "Gründen, aus denen dies nicht gemacht wird", vermute ich, dass es so viel Unterschied zwischen der sozialwissenschaftlichen Praxis wie irgendetwas gibt. Es könnte eine gute Frage sein, diese zu stellen.
Andy W
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.