Der Barnard-Test wird verwendet, wenn der Störparameter unter der Nullhypothese unbekannt ist.
Im Damentest könnte man jedoch argumentieren, dass der Störparameter unter der Nullhypothese auf 0,5 gesetzt werden kann (die nicht informierte Dame hat eine 50% ige Wahrscheinlichkeit, eine Tasse richtig zu erraten).
Dann wird die Anzahl der korrekten Vermutungen unter der Nullhypothese zu einer Binomialverteilung: Vermutung von 8 Bechern mit einer Wahrscheinlichkeit von 50% für jeden Becher.
In anderen Fällen haben Sie möglicherweise nicht diese unbedeutende Wahrscheinlichkeit von 50% für die Nullhypothese. Und ohne feste Margen wissen Sie möglicherweise nicht, wie hoch diese Wahrscheinlichkeit sein sollte. In diesem Fall brauchen Sie Barnards Test.
Selbst wenn Sie Barnards Test mit dem Lady Tasting Tea Test durchführen würden, würde er ohnehin 50% betragen (wenn das Ergebnis alle richtigen Vermutungen sind), da der Störparameter mit dem höchsten p-Wert 0,5 beträgt und zum trivialen Binomialtest führen würde ( es ist eigentlich die Kombination von zwei Binomialtests (einer für die vier ersten Tassen Milch und einer für die vier ersten Tassen Tee).
> library(Barnard)
> barnard.test(4,0,0,4)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 0
Outcome II 0 4
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)
> dbinom(8,8,0.5)
[1] 0.00390625
> dbinom(4,4,0.5)^2
[1] 0.00390625
Im Folgenden sehen Sie, wie ein komplizierteres Ergebnis aussehen würde (wenn nicht alle Vermutungen korrekt sind, z. B. 2 gegen 4), wird das Zählen von Extremen und Nicht-Extremen etwas schwieriger
(Beachten Sie auch, dass der Barnard-Test im Fall eines 4-2-Ergebnisses einen Störparameter p = 0,686 verwendet, von dem Sie behaupten können, dass er nicht korrekt ist. Der p-Wert für die 50% ige Wahrscheinlichkeit, mit „Tee zuerst“ zu antworten, wäre 0,08203125. Dies wird noch kleiner , wenn Sie eine andere Region betrachten, statt die bereits basierend auf Walds Statistik, obwohl die Definition der Region ist nicht so einfach )
out <- rep(0,1000)
for (k in 1:1000) {
p <- k/1000
ps <- matrix(rep(0,25),5) # probability for outcome i,j
ts <- matrix(rep(0,25),5) # distance of outcome i,j (using wald statistic)
for (i in 0:4) {
for (j in 0:4) {
ps[i+1,j+1] <- dbinom(i,4,p)*dbinom(j,4,p)
pt <- (i+j)/8
p1 <- i/4
p2 <- j/4
ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
}
}
cases <- ts < ts[2+1,4+1]
cases[1,1] = TRUE
cases[5,5] = TRUE
ps
out[k] <- 1-sum(ps[cases])
}
> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 2
Outcome II 0 2
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)