Quantile Regression, die unterschiedliche Beziehungen bei unterschiedlichen Quantilen aufzeigt: Wie?


8

Quantile Regression (QR) soll manchmal unterschiedliche Beziehungen zwischen Variablen bei unterschiedlichen Quantilen der Verteilung aufzeigen. ZB Le Cook et al. "Über den Mittelwert hinaus denken: Ein praktischer Leitfaden für die Verwendung quantiler Regressionsmethoden für die Forschung im Gesundheitswesen" impliziert, dass die QR ermöglicht, dass die Beziehungen zwischen den interessierenden Ergebnissen und den erklärenden Variablen über verschiedene Werte der Variablen hinweg nicht konstant sind.

Soweit ich weiß, ist in einem linearen Standardregressionsmodell wobei iid und unabhängig von , der QR-Schätzer für die Steigungε X β

y=β0+βX+ε
εXβist konsistent für die Populationssteigung (die einzigartig ist und sich ohnehin nicht zwischen Quantilen unterscheidet). Das heißt, das zu schätzende Objekt ist unabhängig vom Quantil immer dasselbe. Zugegebenermaßen ist dies für den Achsenabschnitt nicht der Fall, da der QR-Achsenabschnittschätzer darauf abzielt, ein bestimmtes Quantil der Fehlerverteilung zu schätzen. Zusammengenommen sehe ich nicht, wie die unterschiedlichen Beziehungen zwischen Variablen bei verschiedenen Quantilen über den QR aufgedeckt werden sollen. Ich denke, dies ist eher eine Eigenschaft des standardmäßigen linearen Regressionsmodells als ein Fehler in meinem Verständnis, aber ich bin mir nicht sicher.

Ich nehme an, die Situation ist anders, wenn einige der Annahmen des linearen Standardmodells verletzt werden, z. B. unter bestimmten Formen der bedingten Heteroskedastizität. Dann konvergieren die QR-Steigungsschätzer möglicherweise zu etwas anderem als der wahren Steigung des linearen Modells und zeigen irgendwie unterschiedliche Beziehungen bei unterschiedlichen Quantilen.

Was mache ich falsch? Wie sollte ich die Behauptung, dass die Quantilregression unterschiedliche Beziehungen zwischen Variablen bei verschiedenen Quantilen aufdeckt, richtig verstehen / interpretieren?


1
Es gibt viele Möglichkeiten, über QR nachzudenken. Zum einen handelt es sich um eine Art Kernel-Regression, bei der die Kernel die Quantile sind. Auf diese Weise ist es ein nichtparametrischer und robuster Ansatz, bei dem keine linearen Lösungen angenommen werden können. Hyndman et al. Haben eine verstärkte adaptive Quantilregression als globalen Rahmen für die QR-basierte Modellierung vorgeschlagen. Ungated Kopie hier ... robjhyndman.com/papers/sig-alternate.pdf
Mike Hunter

1
@ Johnson, danke. Ich glaube, ich bin zu sehr von der Originalarbeit Koenker und Bassett (1978) beeinflusst, in der die Motivation ausschließlich darin besteht, einen robusten Steigungsschätzer im linearen Standardmodell zu finden, anstatt unterschiedliche Beziehungen bei unterschiedlichen Quantilen hervorzurufen.
Richard Hardy

Es steht außer Frage, dass Papiere wie Koenker und Bassett Einfluss darauf haben, wie zukünftige Analysten eine Frage formulieren. Ein weiteres gutes Papier über QR ist Le Cook und Mannings 2013, * Thinking Beyond the Mean: ein praktischer Leitfaden für die Verwendung von Quantilregressionsmethoden "... ungated copy here ... dash.harvard.edu/bitstream/handle/1/12406692/ … FWIW ... aber ihr Fokus liegt auf der Gesundheitsversorgung ...
Mike Hunter

Antworten:


8

xxx. In QR sehen Sie dies sofort anhand sehr unterschiedlicher Steigungsschätzungen. Da sich OLS nur um den Mittelwert (dh das durchschnittliche Quantil) kümmert, können Sie nicht jedes Quantil einzeln modellieren. Dort verlassen Sie sich voll und ganz auf die Annahme einer festen Form der bedingten Verteilung, wenn Sie Aussagen zu ihren Quantilen treffen.

BEARBEITEN: Kommentar einbetten und illustrieren

Wenn Sie bereit sind, diese starken Annahmen zu treffen, macht es wenig Sinn, QR auszuführen, da Sie bedingte Quantile immer über bedingte Mittelwerte und feste Varianz berechnen können. Die "wahren" Steigungen aller Quantile sind gleich der wahren Steigung des Mittelwerts. In einer bestimmten Stichprobe gibt es natürlich zufällige Abweichungen. Oder Sie stellen sogar fest, dass Ihre strengen Annahmen falsch waren ...

y=x+xε,εN(0,1) iid,
yxGeben Sie hier die Bildbeschreibung ein
  • Die Regressionslinien des Mittelwerts und des Medians sind aufgrund der symmetrischen bedingten Verteilung im Wesentlichen identisch. Ihre Steigung beträgt 1.
  • Die Regressionslinie des 80% -Quantils ist viel steiler (Steigung 1,9), während die Regressionslinie des 20% -Quantils nahezu konstant ist (Steigung 0,3). Dies passt gut zu der extrem ungleichen Varianz.
  • x

Der Code zum Generieren des Bildes:

library(quantreg)

set.seed(3249)
n <- 1000
x <- seq(0, 1, length.out = n)
y <- rnorm(n, mean = x, sd = x)

plot(y~x)

(fit_lm <- lm(y~x)) # intercept: 0.02445, slope: 1.04858 
abline(fit_lm, lwd = 3)

# quantile cuts
taus <- c(0.2, 0.5, 0.8)

(fit_rq <- rq(y~x, tau = taus))
#               tau= 0.2      tau= 0.5    tau= 0.8
# (Intercept) 0.00108228 -0.0005110046 0.001089583
# x           0.29960652  1.0954521888 1.918622442

lapply(seq_along(taus), function(i) abline(coef(fit_rq)[, i], lwd = 2, lty = 2, col = "red"))

2
x

2
Genau. Wenn Sie bereit sind, diese starken Annahmen zu treffen, macht es nicht viel Sinn, QR auszuführen, da Sie bedingte Quantile immer über bedingte Mittelwerte und feste Varianz berechnen können. Die "wahren" Steigungen aller Quantile sind gleich der wahren Steigung des Mittelwerts. In der Stichprobe gibt es zufällige Abweichungen. Oder Sie könnten sogar feststellen, dass Ihre strengen Annahmen falsch waren ... ;-)
Michael M

Das macht Sinn. Im Beispiel denke ich, dass die QR-Steigungsschätzungen für verschiedene Quantile wahrscheinlich etwas im Einklang mit den Quantilen verteilt sein werden. Dies liegt daran, dass die minimierte Verlustfunktion den Schätzer asymmetrisch auf eine Seite zieht (die Richtung und die Größe des Widerstands hängen vom Quantil ab), obwohl dieser Effekt asymptotisch immer kleiner wird.
Richard Hardy

1
Es ist eine gute Antwort und ich danke Ihnen dafür, aber ich frage mich, ob Sie anhand eines einfachen Beispiels veranschaulichen könnten, wie der QR unterschiedliche Beziehungen bei verschiedenen Quantilen aufzeigt, wenn einige der Standardannahmen (z. B. Homoskedastizität) nicht zutreffen.
Richard Hardy

xxy=x+xεεi.i.N(0,1)
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.