Wahl zwischen Test und Test

Hintergrund: Ich präsentiere Kollegen bei der Arbeit am Testen von Hypothesen und verstehe das meiste in Ordnung, aber es gibt einen Aspekt, den ich zu verstehen und anderen zu erklären versuche.

Dies ist, was ich glaube zu wissen (bitte korrigieren, wenn falsch!)

Statistiken, die normal wären, wenn die Varianz bekannt wäre, folgen einer Verteilung, wenn die Varianz unbekannt ist $t$
CLT (Central Limit Theorem): Die Stichprobenverteilung des Stichprobenmittelwerts ist für ausreichend großes ungefähr normal (könnte , könnte für stark verzerrte Verteilungen bis zu ) $n$ $30$ $300$
Die Verteilung kann für Freiheitsgrade als normal angesehen werden $t$ $> 30$

Sie verwenden den Test, wenn: $z$

Population normal und Varianz bekannt (für jede Stichprobengröße)
Population normal, Varianz unbekannt und (aufgrund von CLT) $n>30$
Populationsbinom, , $np>10$ $nq>10$

Sie verwenden den Test, wenn: $t$

Population normal, Varianz unbekannt und $n<30$
Keine Kenntnisse über Population oder Varianz und , aber die Probendaten sehen normal aus / bestehen Tests usw., sodass die Population als normal angenommen werden kann $n<30$

So bin ich mit verlassen:

Für Stichproben und (?) Sind keine Kenntnisse über Population und Varianz bekannt / unbekannt. $>30$ $<\approx 300$

Meine Fragen sind also:

Bei welcher Stichprobengröße können Sie davon ausgehen (bei denen keine Kenntnisse über Populationsverteilung oder Varianz vorliegen), dass die Stichprobenverteilung des Mittelwerts normal ist (dh CLT hat eingesetzt), wenn die Stichprobenverteilung nicht normal aussieht? Ich weiß, dass einige Distributionen benötigen , aber einige Ressourcen scheinen zu sagen, dass der Test immer dann verwendet wird, wenn ... $n>300$ $z$ $n>30$
Für die Fälle, bei denen ich mir nicht sicher bin, gehe ich davon aus, dass ich die Daten auf Normalität prüfe. Wenn die Beispieldaten normal aussehen, verwende ich dann den Test (da von einer normalen Grundgesamtheit ausgegangen wird und da ). $z$ $n>30$
Was ist, wenn die Beispieldaten für Fälle, über die ich nicht sicher bin, nicht normal aussehen? Gibt es Umstände, unter denen Sie noch einen oder -Test verwenden würden, oder möchten Sie immer nichtparametrische Tests transformieren / verwenden? Ich weiß, dass sich die Stichprobenverteilung des Mittelwerts aufgrund von CLT bei einem Wert von dem Normalwert annähert, aber die Stichprobendaten sagen mir nicht, was dieser Wert von ist. Die Probendaten könnten nicht normal sein, während der Probenmittelwert einer Normalen / folgt . Gibt es Fälle, in denen Sie einen nicht-parametrischen Test transformieren / verwenden würden, obwohl die Stichprobenverteilung des Mittelwerts normal / , Sie dies jedoch nicht feststellen konnten? $t$ $z$ $n$ $n$ $t$ $t$

— Hatti
quelle

" könnte bis zu 300 für stark verzerrte Distributionen sein " ... in einigen Fällen könnte es eine Menge mehr sein; oder es könnte niemals passieren. Wählen Sie ein beliebiges , und ich zeige Ihnen einen Fall, in dem es nicht ausreicht.

n

$n$

— Glen_b

Danke Glen_b - also immer überprüfen, ob die Beispieldaten normal aussehen, um parametrisch zu verwenden?

— Hatti

@Hatti Nö! T-Test ist gültig, wenn die Daten nicht normal erscheinen.

— AdamO

Antworten:

@AdamO ist richtig, Sie verwenden einfach immer den $t$ Test, wenn Sie die Populationsstandardabweichung nicht a priori kennen. Sie müssen sich keine Gedanken darüber machen, wann Sie zum $z$ Test wechseln müssen , da die $t$ Verteilung für Sie wechselt. Insbesondere konvergiert die $t$ Verteilung zur Normalverteilung, so dass es die richtige Verteilung ist, die bei jedem . $N$

Es gibt auch hier eine Verwirrung über die Bedeutung der traditionellen Linie bei $N=30$ . Es gibt zwei Arten von Konvergenz, über die die Leute sprechen:

Das erste ist, dass die Stichprobenverteilung der Teststatistik (dh $t$ ), die aus normalverteilten (innerhalb der Gruppe) Rohdaten berechnet wurde, zu einer Normalverteilung als $N\rightarrow\infty$ konvergiert, obwohl die SD aus den Daten geschätzt wird. (Die $t$ Distribution erledigt dies für Sie, wie oben erwähnt.)
Die zweite ist, dass die Stichprobenverteilung des Mittelwerts nicht normalverteilter (innerhalb der Gruppe) Rohdaten zu einer Normalverteilung (langsamer als oben) konvergiert, und zwar als $N\rightarrow\infty$ . Die Menschen verlassen sich auf den zentralen Grenzwertsatz , um dies für sie zu erledigen. Es gibt jedoch keine Garantie dafür, dass es innerhalb einer angemessenen Stichprobengröße konvergiert - es gibt sicherlich keinen Grund zu der Annahme, dass $30$ (oder $300$ ) die magische Zahl ist. Je nach Größe und Art der Nichtnormalität kann dies sehr lange dauern (vgl. @ Macros Antwort hier: Regression, wenn die OLS-Residuen nicht normalverteilt sind). Wenn Sie Ihre (in der Gruppe) Rohdaten sind nicht ganz normal glaubt, kann es besser sein , eine andere Art von Test zu verwenden, wie der Mann-Whitney - $U$ - Test . Beachten Sie, dass bei nicht normalen Daten der Mann-Whitney- $U$ Test wahrscheinlich leistungsfähiger ist als der $t$ Test. Dies kann auch der Fall sein, wenn der CLT aktiviert wurde wird Sie wahrscheinlich in die Irre führen, siehe: Ist das Testen der Normalität "im Wesentlichen nutzlos"? )

$U$ $t$ $z$

Es kann Ihnen helfen, die jüngste Antwort von @ GregSnow hier zu lesen: Interpretation des p-Werts beim Vergleich der Proportionen zwischen zwei kleinen Gruppen in R auch in Bezug auf diese Probleme.

— gung - Wiedereinsetzung von Monica
quelle

Danke, das war wirklich hilfreich, ich wusste, dass ich es überkompliziert habe, da sich der t-Test für größere n dem Normalen nähert. Selbst wenn n 1000 ist, sollte der t-Test verwendet werden, wenn die SD a priori nicht bekannt ist.

— Hatti

t

$t$

Ja definitiv. Es tut mir leid, dass ich so pingelig war und nur schwer darüber nachdachte, wie ich es anderen auf ziemlich schwarz-weiße Weise erklären könnte. Vielen Dank für Ihre Hilfe!

— Hatti

Beachten Sie auch, dass die Berechnung der t-Testergebnisse heutzutage in jeder Hinsicht ohne nennenswerten zusätzlichen Rechenaufwand möglich ist. Wir suchen nicht mehr in einigen Papiertabellen nach Teststatistiken, die nicht alle Fälle abdecken können. Wir fragen nur den Computer. Warum also die Mühe machen und sich Sorgen machen, ob Sie vielleicht auch mit einem Z-Test die gleichen Ergebnisse erzielen könnten?

— Björn

$t$

$t$ $t$ $z$

$t$ $z$

$z$ $t$

— AdamO
quelle

Verwenden Sie einen T-Test immer für einen nichtparametrischen Test der Mittelwertunterschiede. Sie meinen, parametrisch, nicht wahr?

— Xavier Bourret Sicotte