In einer Tabelle wie dieser können Sie die durch einen G-Test erstellte G-Statistik partitionieren, anstatt die ORs zu berechnen oder eine logistische Regression auszuführen. Obwohl Sie entscheiden müssen, wie Sie es partitionieren wollen. Hier ist die G-Statistik, die Pearsons X ^ 2 ähnlich ist und auch einer X ^ 2-Verteilung folgt, wie folgt:
G = 2 * Summe (OBS * ln (OBS / EXP)).
Sie berechnen dies zunächst für die Gesamttabelle, in diesem Fall: G = 76,42 auf 2 df, was hoch signifikant ist (p <0,0001). Das heißt, die Rücklaufquote hängt von der Gruppe ab (A, B oder C).
Da Sie dann 2 df haben, können Sie zwei kleinere 1 df (2x2) G-Tests durchführen. Nach dem Ausführen der ersten Ebene müssen Sie jedoch die Zeilen der beiden im ersten Test verwendeten Ebenen reduzieren und diese Werte dann verwenden, um sie mit der dritten Ebene zu testen. Nehmen wir an, Sie testen zuerst B gegen C.
Obs Rec Ret Total
B 17530 717 18247
C 42408 1618 44026
Exp Rec Ret Total
B 17562.8 684.2 18247
C 42375.2 1650.8 44026
Dies ergibt einen G-stat von 2,29 auf 1 df, was nicht signifikant ist (p = 0,1300). Erstellen Sie dann eine neue Tabelle und kombinieren Sie die Zeilen B und C. Testen Sie nun A gegen B + C.
Obs Rec Ret Total
A 16895 934 17829
B+C 59938 2335 62273
Exp Rec Ret Total
A 17101.4 727.6 17829
B+C 59731.6 2541.4 62273
Dies ergibt einen G-stat von 74,13 auf 1 df, was ebenfalls hoch signifikant ist (p <0,0001).
Sie können Ihre Arbeit überprüfen, indem Sie die beiden kleineren Teststatistiken hinzufügen, die der größeren Teststatistik entsprechen sollten. Es tut: 2,29 + 74,13 = 76,42
Die Geschichte hier ist, dass sich Ihre B- und C-Gruppen nicht wesentlich unterscheiden, aber dass Gruppe A eine höhere Rücklaufquote aufweist als B und C zusammen.
Ich hoffe, das hilft!
Sie hätten den G-stat auch anders partitionieren können, indem Sie zuerst A mit B, dann C mit A + B oder A mit C und dann B mit A + C verglichen hätten. Darüber hinaus können Sie dies auf 4 oder mehr Gruppen erweitern. Nach jedem Test müssen Sie jedoch die beiden soeben getesteten Zeilen reduzieren, wobei die maximale Anzahl von Tests dem df in Ihrer ursprünglichen Tabelle entspricht. Es gibt andere Möglichkeiten, mit komplizierteren Tabellen zu partitionieren. Agrestis Buch "Categorical Data Analysis" sollte die Details enthalten. Insbesondere sein Kapitel über Inferenz für Zwei-Wege-Kontingenztabellen.