Zusammenfassung
Die Anzahl der Daten über hat eine Binomialverteilung mit unbekannter Wahrscheinlichkeit . Verwenden Sie dies, um einen Binomialtest von gegen die Alternative durchzuführen .3.5pp=1/2p≠1/2
Der Rest dieses Beitrags erklärt das zugrunde liegende Modell und zeigt, wie die Berechnungen durchgeführt werden. Es bietet R
Arbeitscode, um sie auszuführen. Eine ausführliche Darstellung der zugrunde liegenden Hypothesentesttheorie findet sich in meiner Antwort auf "Was bedeuten p-Werte und t-Werte in statistischen Tests?" .
Das statistische Modell
Unter der Annahme, dass die Werte relativ unterschiedlich sind (mit wenigen Bindungen bei ), hat nach Ihrer Nullhypothese jeder zufällig ausgewählte Wert eine Chance von 1/2 , überschreiten (da als Mittelwert der Bevölkerung charakterisiert ist). . Unter der Annahme, dass alle Werte zufällig und unabhängig voneinander abgetastet wurden, hat die Anzahl von mehr als eine Binomialverteilung . Nennen wir diese Nummer "count", .3.51/2=50%3.53.52503.5(250,1/2)k
Wenn sich der Populationsmedian von , unterscheidet sich die Wahrscheinlichkeit eines zufällig ausgewählten Werts von mehr als von . Dies ist die alternative Hypothese.3.53.51/2
Einen geeigneten Test finden
Der beste Weg, um die Nullsituation von ihren Alternativen zu unterscheiden, besteht darin, die Werte von , die am wahrscheinlichsten unter der Null und weniger wahrscheinlich unter den Alternativen liegen. Dies sind die Werte nahe von , gleich . Ein kritischer Bereich für Ihren Test besteht daher aus Werten, die relativ weit von : nahe oder nahek1/225012512502501253.5
ααk
3.5α/2kα/2kk
Technisch gesehen gibt es zwei gebräuchliche Methoden, um die Berechnung durchzuführen: Berechnen Sie die Binomialwahrscheinlichkeiten oder approximieren Sie sie mit einer Normalverteilung.
Berechnung mit Binomialwahrscheinlichkeiten
Verwenden Sie die Prozentpunktfunktion (Quantil). Dies R
wird beispielsweise aufgerufen qbinom
und wie folgt aufgerufen
alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)
α=0.05
109 141
k0109k141250R
k
pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))
0.0497αα
Berechnung mit normaler Näherung
(250,1/2)250×1/2=125250×1/2×(1−1/2)=250/4250/4−−−−−√≈7.9α/2=0.05/2−1.95996R
qnorm(alpha/2)
0.05/2+1.95996k1.95996125125±7.9×1.96≈109.5,140.5
250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)
k109141p1/201α
Dieser Test ist nicht so leistungsfähig wie andere Tests, die bestimmte Annahmen über die Bevölkerung treffen , da er nichts über die Bevölkerung voraussetzt (außer dass die Wahrscheinlichkeit nicht direkt auf den Median ausgerichtet ist). Wenn der Test dennoch die Null ablehnt, besteht kein Grund zur Sorge über mangelnde Leistung. Andernfalls müssen Sie einige heikelen Kompromisse zwischen dem , was Sie bereit sind , zu übernehmen und was Sie sind in der Lage zu schließen , über die Bevölkerung.