Ich habe daran gearbeitet, meine Frage zu beantworten, indem ich die Quoten und Quotenverhältnisse manuell berechnet habe:
Acceptance blue red Grand Total
0 158 102 260
1 112 177 289
Total 270 279 549
Das Odds Ratio für den Einstieg in die Schule von Rot gegen Blau ist also:
O d d s A c c e p t I f R e dO d d s A c c c e p t I f B l u e=177/102112/158= 1,73530,7089= 2,448
Und das ist die Backgroundred
Rückkehr von:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))
Odds_and_OR 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
(Intercept)
112 / 158 = 0,7089
Wenn ich stattdessen Folgendes ausführe:
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))
Odds 2.5 % 97.5 %
Backgroundblue 0.7088608 0.5553459 0.9017961
Backgroundred 1.7352941 1.3632702 2.2206569
Bei den Renditen handelt es sich genau um die Wahrscheinlichkeit , "blau" zu werden: Backgroundblue
(0,7089) und die Wahrscheinlichkeit , akzeptiert zu werden: "rot": Backgroundred
(1,7353). Kein Odds Ratio da. Daher wird nicht erwartet, dass die beiden Rückgabewerte wechselseitig sind.
Abschließend: Wie werden die Ergebnisse gelesen, wenn der kategoriale Regressor drei Faktoren enthält?
Gleiche manuelle versus [R] Berechnung:
Ich habe einen anderen fiktiven Datensatz mit derselben Prämisse erstellt, aber diesmal gab es drei ethnische Hintergründe: "Rot", "Blau" und "Orange", und es wurde dieselbe Sequenz ausgeführt:
Erstens, die Kontingenztabelle:
Acceptance blue orange red Total
0 86 65 130 281
1 64 42 162 268
Total 150 107 292 549
Und berechnete die Wahrscheinlichkeit , für jede ethnische Gruppe einzusteigen:
- Gewinnchancen akzeptieren, wenn Rot = 1,246154;
- Gewinnchancen akzeptieren, wenn blau = 0,744186;
- Gewinnchancen akzeptieren, wenn Orange = 0,646154
Sowie die verschiedenen Odds Ratios :
- ODER rot v blau = 1,674519;
- ODER Rot V Orange = 1,928571;
- ODER blau v rot = 0,597186;
- ODER blau v orange = 1,151717;
- ODER orange / rot = 0,518519; und
- ODER orange / blau = 0,868269
Und fuhr mit der nun routinemäßigen logistischen Regression fort, gefolgt von der Potenzierung der Koeffizienten:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))
ODDS 2.5 % 97.5 %
(Intercept) 0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred 1.6745192 1.1271430 2.497853
Die Gewinnchancen für "Blues" wie (Intercept)
, und die Gewinnchancen-Verhältnisse von Orange versus Blue in Backgroundorange
und OR von Rot v Blue in Backgroundred
.
Andererseits ergab die Regression ohne Unterbrechung vorhersehbar nur die drei unabhängigen Quoten :
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))
ODDS 2.5 % 97.5 %
Backgroundblue 0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred 1.2461538 0.9900426 1.5715814
R
die Koeffizienten explizit nennt (über die Funktioncoef
), nennen Sie das "Odds Ratio" in Ihrer Ausgabe. Das legt nahe, dass Sie die Unterscheidung zwischen den beiden