Erklären der Quantilregression für Nichtstatistiker


14

Ich habe kürzlich eine Arbeit in einem Psychologie-Journal eingereicht, in der ich die Quantile-Regression verwendet habe. Obwohl ich dachte, ich hätte bereits genug Gedanken in eine klare Darstellung der Quantilregression gesteckt, fragten die Rezensenten nach besseren Erklärungen für die Quantilregressionstechnik, die nur mit der Standard-OLS-Regression vertraut ist.

Wie kann man also Nicht-Statistikern in einem empirischen Artikel die Quantilregression am besten erklären?


1
Ich denke, Sie müssen erklären, warum Sie die Quantilregression der Regression der kleinsten Quadrate vorgezogen haben. Wurden die Residuen nicht normal unter Verwendung der Regression der kleinsten Quadrate verteilt?
Glen

1
Wir haben uns aus theoretischen Gründen für die Quantilregression entschieden. Insbesondere interessierten wir uns für die gesamte Verteilung der abhängigen Variablen.
Johannes,

2
@Johannes, vielleicht findest du das hilfreich und die Literatur, die es zitiert. Auch nicht normale Residuen in Glen sind kein Grund, die Verwendung von OLS auszuschließen. siehe hier zum Beispiel.
Gast

1
Ich würde sagen, dass wenn die Residuen signifikant von den normalen kleinsten Quadraten abweichen, dies aufgrund der Empfindlichkeit gegenüber Ausreißern möglicherweise keine gute Schätzmethode ist. Daher ist eine robuste Alternative der OLS erforderlich.
Michael R. Chernick

1
Dies ist ein exzellentes Intro, das 2014 veröffentlicht wurde: "Quantile Regression im Studium der Entwicklungswissenschaften" Child Dev 85: 861-881.
N Brouwer

Antworten:


12

Ich würde in Betracht ziehen, die Motivation und nicht die technischen Details zu betonen (geben Sie einfach einen Hinweis). Im Speziellen:

  • Verteilung frei: Sie möchten nicht die parametrische Form der Fehlerverteilung annehmen.
  • Robustheit: Sie vermuten, dass Ihre abhängige Variable kontaminiert ist.

Die Wiederherstellung der gesamten (bedingten) Verteilung allein rechtfertigt keine Quantilregression, da unter der Annahme der Normalität der Mittelwert und die Varianz ausreichen, um die gesamte Verteilung wiederherzustellen. Gleiches gilt für jede andere parametrische Fehlerverteilung.


Ich verstehe nicht, dass "der Mittelwert und die Varianz ausreichen, um die gesamte Verteilung wiederherzustellen". Angenommen, meine abhängige Variable ist der BMI und ich möchte Rückschlüsse auf Einzelpersonen am Ende ihrer Verteilung ziehen. Wie kann ich die gewöhnlichen Regressionsmethoden genau anwenden?
Davide

5

Versuchen Sie, die Intuitivität durch das Verständnis des Rezensenten / Publikums für einfachere Statistiken zu steigern.

Warum würden Sie den Median anstelle des Mittelwerts als Maß für die zentrale Tendenz verwenden? Wenn Sie diesen Punkt vermitteln können, sollte der Rest folgen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.