Die Grundidee der quantilen Regression beruht auf der Tatsache, dass der Analyst an der Verteilung von Daten interessiert ist und nicht nur an der Mittelung von Daten. Fangen wir mit dem Mittelwert an.
y= XβE( Y| X= x ) = x βargMindestβ( y- x β)′( y- Xβ)
Auf der anderen Seite sucht die mediane Regression nach einer Linie, bei der die Hälfte der Daten auf Seiten liegt. In diesem Fall lautet die Zielfunktionwoist die erste Norm.| . |argMindestβ| y- Xβ|| . |
Ausweitung des Medianwerts auf Quantilergebnisse in der Quantilregression. Die Idee dahinter ist , eine Linie zu finden , dass -percent von Daten über das ist.α
Hier haben Sie einen kleinen Fehler gemacht. Q-Regression ist nicht so, als würde man ein Quantil von Daten finden und dann eine Linie zu dieser Teilmenge (oder sogar zu den herausfordernderen Grenzen) passen.
Die Q-Regression sucht nach einer Linie, die Daten in eine Q-Gruppe a Quantil und die Reste aufteilt . Die Zielfunktion für die Q-Regression lautet
α
β^α= argMindestβ{ α | y- Xβ|ich( y> Xβ) + ( 1 - α ) |y-Xβ|ich(y< Xβ) } .
Wie Sie sehen, ist diese clevere Zielfunktion nichts anderes, als Quantil in ein Optimierungsproblem zu übersetzen.
Wie Sie sehen, wird die Q-Regression außerdem für eine bestimmte Menge definiert ( ) und kann dann erweitert werden, um alle Mengen zu finden. Mit anderen Worten kann die Q-Regression die (bedingte) Verteilung der Antwort reproduzieren.βα