Nehmen Sie der Einfachheit halber an, Sie haben eine stetige abhängige Variable Y und eine stetige Prädiktorvariable X.
Logistische Regression
Wenn ich Ihren Beitrag richtig verstehe, wird Ihre logistische Regression Y basierend auf dem Quantil der (bedingungslosen) Verteilung von Y in 0 und 1 kategorisieren. Insbesondere wird das q-te Quantil der Verteilung der beobachteten Y-Werte berechnet und Ycat wird definiert werden als 0, wenn Y streng kleiner als dieses Quantil ist, und 1, wenn Y größer oder gleich diesem Quantil ist.
Wenn das Obige Ihre Absicht erfasst, modelliert die logistische Regression die Wahrscheinlichkeit, dass Y das (beobachtete) q-te Quantil der (bedingungslosen) Y-Verteilung als Funktion von X überschreitet oder gleich ist.
Quantile Regression
Wenn Sie andererseits eine Quantilregression von Y auf X durchführen, konzentrieren Sie sich auf die Modellierung, wie sich das q-te Quantil der bedingten Verteilung von Y bei X als Funktion von X ändert.
Logistische Regression versus quantitative Regression
Es scheint mir, dass diese beiden Verfahren völlig unterschiedliche Ziele haben, da sich das erste Verfahren (dh die logistische Regression) auf das q-te Quantil der bedingungslosen Verteilung von Y konzentriert, während sich das zweite Verfahren (dh die Quantilregression) auf das konzentriert das q-te Quantil der bedingten Verteilung von Y.
The unconditional distribution of Y is the
distribution of Y values (hence it ignores any
information about the X values).
The conditional distribution of Y given X is the
distribution of those Y values for which the values
of X are the same.
Bildhaftes Beispiel
Nehmen wir zur Veranschaulichung Y = Cholesterin und X = Körpergewicht an.
Dann modelliert die logistische Regression die Wahrscheinlichkeit eines "hohen" Cholesterinwerts (dh größer oder gleich dem q-ten Quantil der beobachteten Cholesterinwerte) als Funktion des Körpergewichts, wobei die Definition von "hoch" keine hat Beziehung zum Körpergewicht. Mit anderen Worten, der Marker für einen „hohen“ Cholesterinwert ist unabhängig vom Körpergewicht. Was sich bei diesem Modell mit dem Körpergewicht ändert, ist die Wahrscheinlichkeit, dass ein Cholesterinwert diesen Marker überschreitet.
Andererseits untersucht die Quantilregression, wie sich die "Marker" -Cholesterinwerte, für die q% der Probanden mit demselben Körpergewicht in der zugrunde liegenden Population einen höheren Cholesterinwert aufweisen, in Abhängigkeit vom Körpergewicht ändern. Sie können sich diese Cholesterinwerte als Marker vorstellen, um festzustellen, welche Cholesterinwerte "hoch" sind. In diesem Fall hängt jeder Marker vom entsprechenden Körpergewicht ab. Außerdem wird angenommen, dass sich die Marker auf vorhersagbare Weise ändern, wenn sich der Wert von X ändert (z. B. neigen die Marker dazu, mit zunehmendem X zuzunehmen).