Mehrere Vergleiche mit vielen Gruppen


8

Ich möchte feststellen, ob die Verwendung eines Mehrfachvergleichstests für meine Daten geeignet ist. Ich habe den Kruskal-Wallis-Test verwendet, um festzustellen, ob es Unterschiede in der mittleren Hemmung zwischen verschiedenen Gruppen gibt. Die Analyse ergab, dass es signifikante Unterschiede gab, und jetzt möchte ich ein Mehrfachvergleichsverfahren (möglicherweise Dunns, da ich ungleiche Stichprobengrößen habe) verwenden, um festzustellen, welche Gruppen sich von den anderen unterscheiden.17

Ich habe mich gefragt, ob ich viele Gruppen habe ( ). Würde dies dazu führen, dass ein Test mit mehreren Vergleichen nur eine sehr geringe Leistung hat oder für diesen Datensatz nicht geeignet ist?k=17


+1 bis @Alexis Antwort, aber Sie sollten sich wirklich fragen, ob Sie tatsächlich alle paarweisen Kombinationen von 17 Gruppen testen müssen . Was machst du mit 136 Vergleichen? Alle in einem Papier auflisten?
Amöbe

@amoeba spricht einen ausgezeichneten Punkt über Kommunikation an. Ich denke, 17 Gruppen befinden sich irgendwo in der Nähe der Grenze kommunizierbarer Ergebnisse. Schauen Sie sich meine zitierte Software an: Sie verfügt über zwei Ausgabeformate, die die Erstellung genau solcher Ergebnisse organisieren.
Alexis

Antworten:


9

Gute Frage! Lassen Sie uns zunächst mögliche Verwirrung beseitigen. Dunns Test (Dunn, 1964) ist genau das: Eine Teststatistik, die ein nichtparametrisches Analogon zum paarweisen t- Test ist, den man post hoc zu einer ANOVA durchführen würde. Es ähnelt dem Mann-Whitney-Wilcoxon-Rangsummentest, mit der Ausnahme, dass (1) ein Maß für die gepoolte Varianz verwendet wird, das durch die Nullhypothese des Kruskal-Wallis-Tests impliziert wird, und (2) dasselbe Ranking verwendet wird der ursprünglichen Daten, wie sie im Kruskal-Wallis-Test verwendet werden.

αα/2kk(k1)/2pα/2/136

Andere Methoden zur Steuerung der FWER existieren jedoch mit mehr statistischer Leistung. Zum Beispiel haben die schrittweisen Holm- und Holm-Sidak-Methoden (Holm, 1979) keine Blutungskraft wie die Bonferroni-Methode. Auch dort konnte man darauf abzielen , die steuern falschen Fündigkeitsquote (FDR) statt, und diese Methoden-Benjamini-Hochberg (1995) und Benjamini-Yekutieli (2001) -generally mehr statistische Aussagekraft geben , indem angenommen wird, dass einige Nullhypothesen sind falsch (dh indem die Idee, dass nicht alle Ablehnungen falsche Ablehnungen sind, in sequentiell modifizierte Ablehnungskriterien umgewandelt wird). Diese und andere Anpassungen für mehrere Vergleiche werden speziell für Dunns Test in Stata im Dunntest- Paket (innerhalb des Stata-Typs) implementiertnet describe dunntest, from(https://alexisdinno.com/stata)) und in R im Paket dunn.test .

Darüber hinaus gibt es eine Alternative zu Dunns Test (der auf einer ungefähren z- Teststatistik basiert ): den Conover-Iman (ausschließlich) post hoc zu einem abgelehnten Kruskal-Wallis-Test (der auf einer t- Verteilung basiert und der ist) stärker als Dunns Test; Conover & Iman, 1979; Convover, 1999). Sie können die Methoden auch verwenden, um die FWER oder den FDR mit den Conover-Iman-Tests zu steuern, die für Stata im conovertest- Paket (innerhalb des Stata-Typs net describe conovertest, from(https://alexisdinno.com/stata)) und für R im conover.test- Paket implementiert sind.

Verweise

Benjamini, Y. und Hochberg, Y. (1995). Kontrolle der Rate falscher Entdeckungen: Ein praktischer und leistungsfähiger Ansatz für mehrere Tests . Zeitschrift der Royal Statistical Society . Serie B (methodisch), 57 (1): 289–300.

Benjamini, Y. und Yekutieli, D. (2001). Die Kontrolle der Falscherkennungsrate bei mehreren Tests in Abhängigkeit . Annals of Statistics , 29 (4): 1165–1188.

Conover, WJ (1999). Praktische nichtparametrische Statistik . Wiley, Hoboken, NJ, 3. Auflage.

Conover, WJ und Iman, RL (1979). Bei Verfahren mit mehreren Vergleichen . Technischer Bericht LA-7677-MS, Wissenschaftliches Labor Los Alamos.

Dunn, ABl. (1961). Mehrere Vergleiche zwischen Mitteln . Journal of the American Statistical Association , 56 (293): 52–64.

Dunn, ABl. (1964). Mehrere Vergleiche mit Rangsummen . Technometrics , 6 (3): 241–252.

Holm, S. (1979). Ein einfaches, nacheinander ablehnendes Mehrfachtestverfahren . Scandinavian Journal of Statistics , 6 (65-70): 1979.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.