Wenn Sie nur diesen einzelnen Prädiktor in das Modell einfügen, entspricht das Quotenverhältnis zwischen dem Prädiktor und der Antwort genau dem potenzierten Regressionskoeffizienten . Ich denke nicht, dass eine Ableitung dieses Ergebnisses auf der Website vorhanden ist, daher werde ich diese Gelegenheit nutzen, um es bereitzustellen.
Betrachten Sie ein binäres Ergebnis und einen einzelnen binären Prädiktor :YX
X=1X=0Y=1p11p01Y=0p10p00
Dann wird ein Weg , die Vorteile Verhältnis zwischen berechnen und istXiYi
OR=p11p00p01p10
Durch Definition der bedingten Wahrscheinlichkeit ist . Im Verhältnis heben sich die Grenzwahrscheinlichkeiten, an denen das , auf, und Sie können das Quotenverhältnis in Bezug auf die bedingten Wahrscheinlichkeiten von umschreiben :pij=P(Y=i|X=j)⋅P(X=j)XY|X
OR=P(Y=1|X=1)P(Y=0|X=1)⋅P(Y=0|X=0)P(Y=1|X=0)
In der logistischen Regression modellieren Sie diese Wahrscheinlichkeiten direkt:
log(P(Yi=1|Xi)P(Yi=0|Xi))=β0+β1Xi
Wir können diese bedingten Wahrscheinlichkeiten also direkt aus dem Modell berechnen. Das erste Verhältnis im obigen Ausdruck für ist:OR
P(Yi=1|Xi=1)P(Yi=0|Xi=1)=(11+e−(β0+β1))(e−(β0+β1)1+e−(β0+β1))=1e−(β0+β1)=e(β0+β1)
und der zweite ist:
P(Yi=0|Xi=0)P(Yi=1|Xi=0)=(e−β01+e−β0)(11+e−β0)=e−β0
Wenn wir dies wieder in die Formel einfügen, haben wir , was das Ergebnis ist.OR=e(β0+β1)⋅e−β0=eβ1
Hinweis: Wenn Sie andere Prädiktoren haben, nennen Sie diese im Modell Der potenzierte Regressionskoeffizient (unter Verwendung einer ähnlichen Ableitung) ist tatsächlichZ1,...,Zp
P(Y=1|X=1,Z1,...,Zp)P(Y=0|X=1,Z1,...,Zp)⋅P(Y=0|X=0,Z1,...,Zp)P(Y=1|X=0,Z1,...,Zp)
Es ist also das Odds Ratio , das von den Werten der anderen Prädiktoren im Modell abhängig ist und im Allgemeinen nicht gleich ist
P(Y=1|X=1)P(Y=0|X=1)⋅P(Y=0|X=0)P(Y=1|X=0)
Es ist also keine Überraschung, dass Sie eine Diskrepanz zwischen dem potenzierten Koeffizienten und dem beobachteten Quotenverhältnis beobachten.
Anmerkung 2: Ich habe eine Beziehung zwischen dem wahren und dem wahren Quotenverhältnis abgeleitet, aber beachte, dass dieselbe Beziehung für die Stichprobenmengen gilt, da die angepasste logistische Regression mit einem einzelnen binären Prädiktor die Einträge eines Zwei-mal-Zwei genau reproduziert Tabelle. Das heißt, die angepassten Mittel stimmen genau mit den Probenmitteln überein, wie bei jedem GLM. Daher gilt die gesamte oben verwendete Logik, wobei die wahren Werte durch Stichprobenmengen ersetzt werden. β