Die Bonferroni-Einstellung bietet immer eine starke Kontrolle über die familienbezogene Fehlerrate. Dies bedeutet, dass unabhängig von der Art und Anzahl der Tests oder den Beziehungen zwischen ihnen, wenn ihre Annahmen erfüllt sind, sichergestellt wird, dass die Wahrscheinlichkeit, dass auch nur ein falsches signifikantes Ergebnis unter allen Tests vorliegt, höchstens , Ihr ursprünglicher Fehler Niveau. Es ist also immer verfügbar .α
Ob es angemessen ist , es zu verwenden (im Gegensatz zu einer anderen Methode oder überhaupt keine Anpassung), hängt von Ihren Zielen, den Standards Ihrer Disziplin und der Verfügbarkeit besserer Methoden für Ihre spezifische Situation ab. Zumindest sollten Sie wahrscheinlich die Holm-Bonferroni-Methode in Betracht ziehen, die ebenso allgemein, aber weniger konservativ ist.
Da Sie mehrere Tests in Bezug auf Ihrem Beispiel ausführen, Sie sind eine Erhöhung der Familie weise Fehlerrate (die Wahrscheinlichkeit , fälschlicherweise mindestens eine Nullhypothese zurückgewiesen). Wenn Sie nur einen Test für jede Hälfte durchführen, sind viele Anpassungen möglich, einschließlich der Hommel-Methode oder Methoden zur Steuerung der Rate falscher Entdeckungen (die sich von der familienbezogenen Fehlerrate unterscheidet). Wenn Sie einen Test für den gesamten Datensatz durchführen, gefolgt von mehreren Untertests, sind die Tests nicht mehr unabhängig, sodass einige Methoden nicht mehr geeignet sind. Wie ich bereits sagte, ist Bonferroni auf jeden Fall immer verfügbar und garantiert werblich (aber auch sehr konservativ ...).
Sie können das ganze Problem auch einfach ignorieren. Formal ist die familienbezogene Fehlerquote höher, aber mit nur zwei Tests ist es immer noch nicht so schlimm. Sie können auch mit einem Test für den gesamten Datensatz beginnen, der als Hauptergebnis behandelt wird, gefolgt von Untertests für verschiedene Gruppen, die nicht korrigiert wurden, weil sie als sekundäre Ergebnisse oder Hilfshypothesen verstanden werden.
Wenn Sie auf diese Weise viele demografische Variablen berücksichtigen (im Gegensatz zu der bloßen Planung, von Anfang an auf geschlechtsspezifische Unterschiede zu testen, oder zu einem systematischeren Modellierungsansatz), wird das Problem mit einem signifikanten Risiko von „Datenbaggerungen“ (ein Unterschied) schwerwiegender kommt zufällig als bedeutsam heraus, sodass Sie ein nicht schlüssiges Experiment mit einer schönen Geschichte über die demografische Variable retten können, während in der Tat nichts wirklich passiert ist) und Sie sollten auf jeden Fall eine Form der Anpassung für mehrere Tests in Betracht ziehen. Die Logik bleibt bei X verschiedenen Hypothesen gleich (zweimaliges Testen von X-Hypothesen - eine auf jeder Hälfte des Datensatzes - führt zu einer höheren familienbezogenen Fehlerrate als nur einmaliges Testen von X-Hypothesen, und Sie sollten sich wahrscheinlich darauf einstellen).