Tobit Modell Erklärung


13

Wir haben 100 Teilnehmer in zwei Gruppen, n=50in jeder Gruppe. Wir verwendeten eine Bewertung der Fähigkeit zur Grundfunktion zu 4 Zeitpunkten. Die Bewertung umfasst 6 Fragen, von denen jede mit 0 bis 5 bewertet wurde. Wir haben keine individuellen Bewertungen für jede Frage, sondern nur Gesamtbewertungen im Bereich von 0 bis 30. Höhere Bewertungen bedeuten eine bessere Funktionsweise. Das Problem ist, dass die Bewertung sehr grundlegend ist und einen signifikanten Deckeneffekt hat. Die Ergebnisse sind sehr negativ verzerrt. Die Mehrheit der Teilnehmer erzielte knapp 30 Punkte, insbesondere bei den 3 Nachbeobachtungszeitpunkten. Es ist wahrscheinlich, dass nicht alle Teilnehmer, die an den Obergrenzen punkten, wirklich die gleichen Fähigkeiten haben: Einige der Teilnehmer erzielten gerade 30 Punkte, andere erzielten mühelos 30 Punkte und würden viel höher punkten, wenn dies möglich wäre, und so sind die Daten von oben zensiert.

Ich möchte die beiden Gruppen und im Laufe der Zeit vergleichen, aber dies ist angesichts der Art der Ergebnisse offensichtlich sehr schwierig. Transformationen jeglicher Art machen keinen Unterschied. Mir wurde mitgeteilt, dass das Tobit-Modell für diese Bewertung am besten geeignet ist, und ich kann die Analyse in R anhand von Beispielen aus Arne Henningens Arbeit " Schätzen zensierter Regressionsmodelle in R mithilfe des censReg-Pakets" durchführen .

Ich verfüge jedoch nur über Grundkenntnisse in Statistik und habe festgestellt, dass Informationen zum Tobit-Modell ziemlich kompliziert sind. Ich muss in der Lage sein, dieses Modell im Klartext zu erklären, und ich kann keine Erklärung im Klartext und auf den Punkt bringen, was das Tobit-Modell tatsächlich tut und wie. Kann jemand das Tobit-Modell erklären oder mich in die Richtung einer lesbaren Referenz weisen, ohne komplizierte statistische und mathematische Erklärungen?

Äußerst dankbar für jede Hilfe

Antworten:


8

Das Wiki beschreibt das Tobit-Modell wie folgt:

yich={yichwennyich>0 0wennyich0

yich=βxich+uich

uichN(0,σ2)

Ich werde das obige Modell an Ihren Kontext anpassen und eine einfache englische Interpretation der Gleichungen anbieten, die hilfreich sein kann.

yich={ yichwennyich3030wennyich>30

yich=βxich+uich

uichN(0,σ2)

yich

  1. Unsere Fähigkeitsmessungen werden auf der höheren Seite bei 30 abgeschnitten (dh wir erfassen den Deckeneffekt). Mit anderen Worten, wenn die Fähigkeit einer Person größer als 30 ist, kann unser Messinstrument den tatsächlichen Wert nicht aufzeichnen, sondern zeichnet stattdessen 30 für diese Person auf. Beachten Sie, dass das Modell angibtyich=30wennyich>30

  2. Wenn andererseits die Fähigkeit einer Person unter 30 liegt, kann unser Messgerät die tatsächliche Messung aufzeichnen. Beachten Sie, dass das Modell angibtyich=yichwennyich30

  3. yichxich

Ich hoffe das ist hilfreich. Wenn ein Aspekt nicht klar ist, können Sie ihn gerne in den Kommentaren nachfragen.


Varty, ich habe Ihre Antwort sehr geschätzt. Es war sehr hilfreich und sehr schnell! Ich bin mir noch nicht sicher, ob ich es gerne erklären würde, aber ich werde weiterlesen. Wenn Sie lesbare Texte zu Tobit kennen, können Sie diese gerne weiterleiten.
Adam

4

Es gibt einen Artikel von Berk in der Ausgabe 1983 der American Sociological Review (3. Ausgabe) - so habe ich etwas über Zensur gelernt. Die Erklärung bezieht sich speziell auf die Auswahlverzerrung, ist jedoch für Ihr Problem absolut relevant. Selektionsverzerrung, wie Berk diskutiert, ist nur eine Zensur über den Probenauswahlprozess, in Ihrem Fall ist die Zensur das Ergebnis eines unempfindlichen Instruments. Es gibt einige nette Diagramme, die Ihnen genau zeigen, wie Sie erwarten können, dass Ihre Regressionsgerade verzerrt ist, wenn Y auf unterschiedliche Weise zensiert wird. Im Allgemeinen ist der Artikel eher logisch und intuitiv als mathematisch (ja, ich behandle sie als getrennt und bevorzuge erstere). Tobit wird als eine Lösung für das Problem diskutiert.

Generell klingt es so, als ob tobit das richtige Werkzeug für den jeweiligen Job ist. Grundsätzlich funktioniert dies, indem die Wahrscheinlichkeit einer Zensur abgeschätzt und diese dann in die Gleichung zur Vorhersage der Punktzahl einbezogen wird. Von Heckman wird ein anderer Ansatz vorgeschlagen, bei dem probit und das inverse Mills-Verhältnis im Grunde genommen gleich sind, bei dem Sie jedoch unterschiedliche Variablen zur Vorhersage der Zensurwahrscheinlichkeit und des Testergebnisses verwenden können. Dies wäre natürlich für Ihre Situation nicht zutreffend haben.

Eine weitere Empfehlung: Sie können ein hierarchisches Tobit-Modell in Betracht ziehen, bei dem Beobachtungen in Einzelpersonen verschachtelt sind. Dies würde die Tendenz, dass Fehler innerhalb von Individuen auftreten, korrekt erklären. Wenn Sie kein hierarchisches Modell verwenden, müssen Sie zumindest Ihre Standardfehler für die Zusammenfassung der Beobachtungen innerhalb von Personen anpassen. Ich weiß, dass dies alles in Stata möglich ist, und bin zuversichtlich, dass R mit all seiner Vielseitigkeit es auch kann.


Ich nehme an, dies ist die vollständige Zitierung des Artikels, auf den sich @Will bezieht: Berk, RA (1983). Eine Einführung in die Stichprobenauswahlverzerrung in soziologischen Daten. American Sociological Review, 48, 386 & ndash; 398. doi: 10.2307 / 2095230 Es gibt mehrere frei verfügbare Versionen dieses Papiers, die Sie in Google Scholar finden, z.
Crsh
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.