Wahrscheinlichkeiten aus logistischer Regression


8

Ich habe ein logistisches Regressionsmodell in R erstellt, und obwohl das Ergebnis bis zu einem gewissen Grad zufriedenstellend zu sein scheint, gibt es eine Frage, die ich nicht beantworten kann. Ich bin mir nicht sicher, ob mein Ansatz überhaupt richtig ist.

Ich weiß, dass der allgemeine Zweck des logistischen Modells darin besteht, die Erfolgswahrscheinlichkeit für eine binäre Zufallsvariable vorherzusagen. Ist es aus demselben logistischen Modell möglich, die Wahrscheinlichkeit für einen bestimmten Anteil zu ermitteln? Nehmen wir zum Beispiel an, wir sind daran interessiert, die Wahrscheinlichkeit der Aufnahme in eine Schule zu ermitteln, und wir verwenden eine logistische Regression, um diese Wahrscheinlichkeit zu schätzen, die offensichtlich von einigen unabhängigen Variablen abhängt. Meine Frage ist mit dem gleichen Modell, ist es möglich, den Anteil der Schüler zu schätzen, die an dieser bestimmten Schule zugelassen werden?

Ich habe versucht, die Binomialwahrscheinlichkeit zu verwenden, um das zu beantworten, aber aus irgendeinem Grund gibt es mir nicht die richtige Antwort. Wie ich es gemacht habe. Wenn wir die Erfolgswahrscheinlichkeit kennen, wissen wir auch, dass die abhängige Variable einer Binomialverteilung mit den Parametern N und P folgt, wobei N die Anzahl der Versuche und P die Erfolgswahrscheinlichkeit ist, die aus dem logistischen Modell geschätzt werden kann. Wenn ich also die Wahrscheinlichkeit haben möchte, dass der Anteil kleiner oder gleich p ist, dann dachte ich, dass dies der Wahrscheinlichkeit entspricht, dass in N Versuchen weniger oder gleich N * p Erfolg ist, wobei die Erfolgswahrscheinlichkeit P ist.

PS Ich weiß, dass die Erfolgswahrscheinlichkeit eine Gesamtrate / ein Anteil ist, aber ich bin daran interessiert, die Wahrscheinlichkeit für eine bestimmte Gruppe herauszufinden. Das Gruppenmerkmal könnte in das Modell aufgenommen werden, aber das wäre in meinem Fall einschränkend. Eigentlich bin ich mehr daran interessiert, die Wahrscheinlichkeit für einen Anteil aus dem logistischen Modell zu ermitteln, als am Erfolg einer bestimmten Gruppe.

Vielen Dank


7
Wenn ich diese Frage verstanden habe, wird gefragt, wie ein Logistikmodell verwendet werden kann, um die Verteilung der Anzahl der zugelassenen Studenten aus einem bestimmten Bewerberpool zu schätzen. Ein solches Ergebnis kann erzielt werden. Wenn Sie jedoch daran interessiert sind, es anzuwenden, kann es hilfreich sein, einige der Annahmen zu berücksichtigen, die möglicherweise verletzt werden. Bei der Berechnung dieses Ergebnisses muss insbesondere davon ausgegangen werden, dass die Zulassung einer Person die Chancen für die Zulassung anderer Personen nicht beeinträchtigt. Wenn die Schule eine Quote für bestimmte Arten von Bewerbern hat, ist dies beispielsweise nicht der Fall.
whuber

@whuber, Teilweise möchte ich die Anzahl der aus einem bestimmten Bewerberpool zugelassenen Studenten schätzen. Auch von größerem Interesse, obwohl ich es möglicherweise nicht richtig formuliert habe, ist es möglich, eine Wahrscheinlichkeit für die durchschnittliche Erfolgsratenschätzung aus dem logistischen Modell zuzuweisen. Wenn der geschätzte Erfolg für einen Fall beispielsweise 85% beträgt, gibt es eine Möglichkeit, die Wahrscheinlichkeit herauszufinden, dass dies stattdessen weniger als 60% betragen könnte? Macht es jetzt Sinn? Ich dachte, ich könnte vielleicht den Standardfehler in der Vorhersage verwenden, um das zu beantworten. Wäre das richtig?
ThinkStatsme

Antworten:


1

Wenn ich Ihre Frage richtig verstehe, haben Sie die Wahrscheinlichkeit für jede Person vorhergesagt, möchten aber die durchschnittliche Wahrscheinlichkeit eines Segments dieser Personen kennen? Zum Beispiel haben Sie 1000 Personen mit einer durchschnittlichen Rate von 65%, aber nur 300 haben blaue Augen. Wie hoch ist die durchschnittliche Rate von Personen mit blauen Augen? Dann können Sie einfach Ihre geschätzten Wahrscheinlichkeiten für diejenigen mit blauen Augen mitteln.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.