Wie sind Autoren statistischer Hypothesentests auf ihre Statistiken gekommen?
Abhängig von den Umständen gibt es zahlreiche Möglichkeiten, Teststatistiken zu identifizieren. Es ist wichtig zu versuchen, die Alternativen zu identifizieren, die Sie als wichtig erachten, und unter plausiblen Annahmen eine gewisse Macht gegen diese zu erlangen.
Wenn Sie beispielsweise eine Hypothese in Bezug auf Populationsmittelwerte haben (machen wir es einfach und betrachten einen Test mit einer Stichprobe), scheint eine Statistik, die auf dem Stichprobenmittelwert basiert, eine offensichtliche Wahl für eine Statistik zu sein, da sie tendenziell tendiert sich unter der Null und der Alternative anders zu verhalten. Wenn Sie jedoch (zum Beispiel) nach Verschiebungsalternativen für eine Laplace- / Doppelexponentialfamilie ( ) , ist etwas, das auf dem Stichprobenmedian basiert, die bessere Wahl für ein Test einer Verschiebung des Mittelwerts als etwas, das auf dem Stichprobenmittelwert basiert.DExp(μ,τ)
Wenn Sie ein bestimmtes parametrisches Modell haben (basierend auf einer bestimmten Verteilungsfamilie), ist es üblich, zumindest einen Likelihood-Ratio-Test in Betracht zu ziehen , da diese eine Reihe attraktiver Eigenschaften für große Stichproben aufweisen.
In vielen Situationen, in denen Sie versuchen, einen Test von Grund auf neu zu entwerfen, basiert eine Teststatistik auf einer zentralen Größe . Die Teststatistik in einem T-Test mit einer Stichprobe (wie auch in vielen anderen Tests, die Sie möglicherweise zuvor gesehen haben) ist eine entscheidende Größe.
Ist es angesichts eines bestimmten Problems immer offensichtlich, wie die ideale Statistik aussehen sollte (wenn dies aus objektiven Gründen überhaupt definierbar ist)?
Ganz und gar nicht. Betrachten Sie zum Beispiel einen Test der allgemeinen Normalität gegen eine ominibus-Alternative. Es gibt viele Möglichkeiten, die Abweichung von der Normalität zu messen (Dutzende solcher Tests wurden vorgeschlagen), und bei typischen Stichprobengrößen ist keine davon gegen jede Alternative am wirksamsten.
Bei dem Versuch, einen Test für eine solche Situation zu entwerfen, ist ein gewisses Maß an Kreativität erforderlich, um eine Wahl zu treffen, die eine gute Kraft gegen die Arten von Alternativen hat, an denen Sie am meisten interessiert sind.
Es scheint, dass diese beiden in Schritt 2 oben aufgeführten Anforderungen zu weit gefasst sind und viele verschiedene Statistiken erstellt werden könnten, um dieselben Hypothesen zu testen.
Tatsächlich. Wenn Sie eine parametrische Annahme treffen (nehmen Sie an, dass die Daten aus einer Verteilungsfamilie stammen und Ihre Hypothese sich dann auf einen oder mehrere Parameter bezieht), gibt es möglicherweise einen bestmöglichen Test für alle diese Situationen (insbesondere einen einheitlich leistungsstärksten) test), aber selbst dann, wenn Ihre parametrische Annahme eher einer groben Vermutung entspricht, kann der Wunsch nach einer gewissen Robustheit dieser Annahme die Dinge erheblich verändern.
Zum Beispiel (auch hier ist ein Test mit einer Stichprobe zur Standortverschiebung einfach), wenn ich eine Stichprobe aus einer normalen Population nehme, ist ein T-Test am besten. Aber nehmen wir an, ich denke, dass es möglicherweise nicht ganz normal ist und obendrein eine geringe Menge an Kontamination durch einen anderen Prozess mit einem mäßig schweren Schwanz vorliegt, dann etwas Robusteres (vielleicht sogar eine rangbasierte Alternative wie die signierte Rangtest) kann in einer Vielzahl solcher Situationen tendenziell eine bessere Leistung erbringen.