Ich versuche, die Leistungsberechnung für den Fall des t-Tests mit zwei unabhängigen Stichproben zu verstehen (ohne gleiche Varianzen anzunehmen, also habe ich Satterthwaite verwendet).
Hier ist ein Diagramm, das ich gefunden habe, um den Prozess zu verstehen:
Also nahm ich an, dass angesichts der folgenden Angaben zu den beiden Populationen und der Stichprobengröße:
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
Ich könnte den kritischen Wert unter der Null berechnen, der sich auf die Wahrscheinlichkeit eines oberen Endes von 0,05 bezieht:
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df) #equals 1.730018
und dann die alternative Hypothese berechnen (die ich für diesen Fall gelernt habe, ist eine "nicht zentrale t-Verteilung"). Ich habe das Beta im obigen Diagramm anhand der nicht zentralen Verteilung und des oben angegebenen kritischen Werts berechnet. Hier ist das vollständige Skript in R:
#under alternative
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
#Under null
Sp<-sqrt(((n1-1)*sd1^2+(n2-1)*sd2^2)/(n1+n2-2))
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df)
#under alternative
diff<-mu1-mu2
t<-(diff)/sqrt((sd1^2/n1)+ (sd2^2/n2))
ncp<-(diff/sqrt((sd1^2/n1)+(sd2^2/n2)))
#power
1-pt(t, df, ncp)
Dies ergibt einen Leistungswert von 0,4935132.
Ist das der richtige Ansatz? Ich stelle fest, dass ich eine andere Antwort bekomme, wenn ich eine andere Software zur Leistungsberechnung verwende (wie z. B. SAS, die ich meiner Meinung nach entsprechend meinem Problem unten eingerichtet habe) (von SAS ist es 0,33).
SAS-CODE:
proc power;
twosamplemeans test=diff_satt
meandiff = 1
groupstddevs = 3 | 2
groupweights = (1 1)
ntotal = 40
power = .
sides=1;
run;
Letztendlich möchte ich ein Verständnis bekommen, das es mir ermöglicht, Simulationen für kompliziertere Verfahren zu betrachten.
EDIT: Ich habe meinen Fehler gefunden. gewesen sein sollte
1-Punkt (CV, df, ncp) NICHT 1-Punkt (t, df, ncp)