Ich suche nach verschiedenen Möglichkeiten, meinen Schülern (in einem Kurs zur Elementarstatistik) zu erklären, was ein zweiseitiger Test ist und wie sein P-Wert berechnet wird.
Wie erklären Sie Ihren Schülern den Zwei-gegen-Eins-Test?
Ich suche nach verschiedenen Möglichkeiten, meinen Schülern (in einem Kurs zur Elementarstatistik) zu erklären, was ein zweiseitiger Test ist und wie sein P-Wert berechnet wird.
Wie erklären Sie Ihren Schülern den Zwei-gegen-Eins-Test?
Antworten:
Dies ist eine großartige Frage und ich freue mich auf die Erklärungen des p-Werts und des zweiseitigen vs einseitigen Tests. Ich unterrichte andere Orthopäden in Statistik und habe versucht, diese so einfach wie möglich zu halten, da die meisten von ihnen seit 10 bis 30 Jahren keine fortgeschrittenen mathematischen Übungen mehr durchgeführt haben.
Ich beginne mit der Erklärung, dass, wenn wir glauben, dass wir eine faire Münze haben, wir wissen, dass sie durchschnittlich 50% der Flips erreichen sollte ( ). Wenn Sie sich nun fragen, wie hoch die Wahrscheinlichkeit ist, mit dieser fairen Münze nur 2 von 10 Flips zu erzielen, können Sie diese Wahrscheinlichkeit wie im Balkendiagramm berechnen. Aus der Grafik können Sie ersehen, dass die Wahrscheinlichkeit, mit einer fairen Münze 8 von 10 Flips zu erzielen, bei etwa ≈ 4,4 % liegt .
Da wir die Fairness der Münze in Frage stellen würden, wenn wir 9 oder 10 Schwänze hätten, müssen wir diese Möglichkeiten einbeziehen, den Schwanz des Tests. Durch die Addition der Werte erhalten wir , dass die Wahrscheinlichkeit jetzt ein wenig mehr , als des Erhaltens 2 Schwänze oder weniger.
Wenn wir jetzt nur 2 Köpfe bekommen würden, dh 8 Köpfe (der andere Schwanz), wären wir wahrscheinlich genauso bereit, die Fairness der Münze in Frage zu stellen. Dies bedeutet , dass Sie mit einer Wahrscheinlichkeit von am Ende für einen zweiseitigen Test .
Da wir in der Medizin normalerweise daran interessiert sind, Misserfolge zu untersuchen, müssen wir die entgegengesetzte Seite der Wahrscheinlichkeit einbeziehen, auch wenn wir beabsichtigen, Gutes zu tun und eine vorteilhafte Behandlung einzuführen.
Dieses einfache Beispiel zeigt auch, wie abhängig wir von der Nullhypothese sind, um den p-Wert zu berechnen. Ich möchte auch auf die Ähnlichkeit zwischen der Binomialkurve und der Glockenkurve hinweisen. Wenn Sie in 200 Flips wechseln, können Sie auf natürliche Weise erklären, warum die Wahrscheinlichkeit, genau 100 Flips zu erhalten, nicht mehr relevant ist. Das definierende Intervall von Interesse ist ein natürlicher Übergang zu Funktionen der Wahrscheinlichkeitsdichte / Massenfunktion und ihren kumulativen Gegenstücken.
In meiner Klasse empfehle ich ihnen die Statistikvideos der Khan-Akademie und verwende auch einige seiner Erklärungen für bestimmte Konzepte. Sie werfen auch Münzen um, in denen wir die Zufälligkeit des Münzwurfs untersuchen - das, was ich zu zeigen versuche, ist, dass die Zufälligkeit eher zufällig ist als das, was wir normalerweise von dieser Radiolab-Episode inspiriert glauben .
Normalerweise habe ich eine Grafik / Folie, den R-Code, mit dem ich die Grafik erstellt habe:
library(graphics)
binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0,
col=c("green", "gold", "red")){
barplot(
dbinom(0:x_max, x_max, my_prob)*100,
col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
#names=0:x_max,
ylab="Probability %",
xlab="Number of tails", names.arg=0:x_max)
if (my_title != FALSE ){
title(main=my_title)
}
}
binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))
Angenommen, Sie möchten die Hypothese testen, dass die durchschnittliche Körpergröße von Männern "5 Fuß 7 Zoll" beträgt. Sie wählen eine zufällige Stichprobe von Männern aus, messen ihre Körpergröße und berechnen den Stichprobenmittelwert. Ihre Hypothese lautet dann:
In der obigen Situation führen Sie einen zweiseitigen Test durch, da Sie Ihre Null ablehnen würden, wenn der Stichprobenmittelwert entweder zu niedrig oder zu hoch ist.
In diesem Fall repräsentiert der p-Wert die Wahrscheinlichkeit, einen Stichprobenmittelwert zu realisieren, der mindestens so extrem ist wie derjenige, den wir tatsächlich erhalten haben, unter der Annahme, dass die Null tatsächlich wahr ist. Wenn also der Mittelwert der Stichprobe "5 Fuß 8 Zoll" ist, stellt der p-Wert die Wahrscheinlichkeit dar, dass wir Höhen von mehr als "5 Fuß 8 Zoll" oder Höhen von weniger als "5 Fuß 6 Zoll" beobachten, vorausgesetzt, die Null ist ist wahr.
Wenn andererseits Ihre Alternative so gerahmt wurde:
In der obigen Situation würden Sie einen einseitigen Test auf der rechten Seite durchführen. Der Grund ist, dass Sie es vorziehen, die Null nur dann zugunsten der Alternative abzulehnen, wenn der Stichprobenmittelwert extrem hoch ist.
Die Interpretation des p-Wertes bleibt gleich mit der leichten Nuance, die wir jetzt über die Wahrscheinlichkeit sprechen, einen Stichprobenmittelwert zu realisieren, der größer ist als der, den wir tatsächlich erhalten haben. Wenn also der Mittelwert der Stichprobe "5 Fuß 8 Zoll" ist, stellt der p-Wert die Wahrscheinlichkeit dar, dass wir Höhen beobachten, die größer als "5 Fuß 8 Zoll" sind, vorausgesetzt, die Null ist wahr.