Ich habe klassifizierte Daten in einer 2 x 2 x 6-Tabelle. Nennen wir die Dimensionen response
, A
und B
. Ich passe eine logistische Regression an die Daten mit dem Modell an response ~ A * B
. Eine Analyse der Abweichung dieses Modells besagt, dass beide Begriffe und ihre Interaktion von Bedeutung sind.
Betrachtet man jedoch die Anteile der Daten, so sieht es so aus, als wären nur etwa zwei Ebenen B
für diese signifikanten Effekte verantwortlich. Ich würde gerne testen, welche Level die Schuldigen sind. Im Moment besteht mein Ansatz darin, 6 Chi-Quadrat-Tests an 2 x 2 Tabellen von durchzuführen response ~ A
und dann die p-Werte aus diesen Tests für mehrere Vergleiche anzupassen (unter Verwendung der Holm-Anpassung).
Meine Frage ist, ob es einen besseren Ansatz für dieses Problem gibt. Gibt es einen prinzipielleren Modellierungsansatz oder einen Vergleichsansatz für mehrere Chi-Quadrat-Tests?