Das Finden von Macht gegen exponentielle Skalenverschiebungsalternativen ist ziemlich einfach.
Ich weiß jedoch nicht, dass Sie Werte verwenden sollten, die aus Ihren Daten berechnet wurden , um herauszufinden, wie hoch die Leistung gewesen sein könnte. Diese Art der Post-hoc-Leistungsberechnung führt tendenziell zu kontraintuitiven (und möglicherweise irreführenden) Schlussfolgerungen.
Macht ist wie das Signifikanzniveau ein Phänomen, mit dem Sie sich vorher befassen. Sie würden ein A-priori-Verständnis (einschließlich Theorie, Argumentation oder früherer Studien) verwenden, um eine vernünftige Reihe von Alternativen und eine wünschenswerte Effektgröße zu bestimmen
Sie können auch eine Vielzahl anderer Alternativen in Betracht ziehen (z. B. können Sie das Exponential in eine Gammafamilie einbetten, um die Auswirkungen von mehr oder weniger verzerrten Fällen zu berücksichtigen).
Die üblichen Fragen, die man durch eine Leistungsanalyse beantworten könnte, sind:
1) Wie hoch ist die Leistung für eine bestimmte Stichprobengröße bei einer bestimmten Effektgröße oder einer Reihe von Effektgrößen *?
2) Wie groß ist bei gegebener Stichprobengröße und Leistung ein Effekt erkennbar?
3) Welche Stichprobengröße wäre bei einer gewünschten Leistung für eine bestimmte Effektgröße erforderlich?
* (wobei hier "Effektgröße" allgemein gemeint ist und beispielsweise ein bestimmtes Verhältnis von Mitteln oder Mittelwertdifferenzen sein kann, das nicht unbedingt standardisiert ist).
Natürlich haben Sie bereits eine Stichprobengröße, also sind Sie nicht in Fall (3). Sie könnten vernünftigerweise Fall (2) oder Fall (1) in Betracht ziehen.
Ich würde Fall (1) vorschlagen (der auch eine Möglichkeit bietet, mit Fall (2) umzugehen).
Um einen Ansatz für Fall (1) zu veranschaulichen und zu sehen, wie er sich auf Fall (2) bezieht, betrachten wir ein spezifisches Beispiel mit:
Skalenverschiebungsalternativen
exponentielle Populationen
Stichprobengrößen in den beiden Stichproben 64 und 54
Da die Stichprobengrößen unterschiedlich sind, müssen wir den Fall berücksichtigen, in dem die relative Streuung in einer der Stichproben sowohl kleiner als auch größer als 1 ist (wenn sie dieselbe Größe hätten, könnten Symmetrieüberlegungen es ermöglichen, nur eine Seite zu berücksichtigen). Da sie jedoch nahezu gleich groß sind, ist der Effekt sehr gering. Legen Sie in jedem Fall den Parameter für eines der Beispiele fest und variieren Sie das andere.
Was man also tut ist:
Vorweg:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
So führen Sie die Berechnungen durch:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
In R habe ich Folgendes getan:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
was die folgende Potenz "Kurve" ergibt
Die x-Achse liegt auf einer logarithmischen Skala, die y-Achse ist die Ablehnungsrate.
Hier ist es schwer zu sagen, aber die schwarzen Punkte sind links etwas höher als rechts (das heißt, es gibt etwas mehr Leistung, wenn das größere Sample den kleineren Maßstab hat).
Unter Verwendung des inversen normalen cdf als Transformation der Ablehnungsrate können wir die Beziehung zwischen der transformierten Ablehnungsrate und log kappa (kappa ist s
im Diagramm, aber die x-Achse ist logarithmisch skaliert) nahezu linear machen (außer nahe 0) ), und die Anzahl der Simulationen war hoch genug, dass das Rauschen sehr gering ist - wir können es für die gegenwärtigen Zwecke fast ignorieren.
Wir können also nur die lineare Interpolation verwenden. Im Folgenden sind ungefähre Effektgrößen für 50% und 80% Leistung bei Ihren Stichprobengrößen dargestellt:
Die Effektgrößen auf der anderen Seite (größere Gruppe hat einen kleineren Maßstab) sind nur geringfügig davon abweichen (können eine geringfügig kleinere Effektgröße aufnehmen), aber es macht wenig Unterschied, so dass ich nicht auf den Punkt eingehen werde.
Der Test wird also einen wesentlichen Unterschied (von einem Skalenverhältnis von 1) feststellen, aber keinen kleinen.
Nun zu einigen Kommentaren: Ich denke nicht, dass Hypothesentests für die zugrunde liegende Frage von Interesse besonders relevant sind ( sind sie ziemlich ähnlich? ), Und folglich sagen uns diese Leistungsberechnungen nichts, was für diese Frage direkt relevant ist.
Ich denke, Sie sprechen diese nützlichere Frage an, indem Sie vorab angeben, was Ihrer Meinung nach "im Wesentlichen dasselbe" tatsächlich operativ bedeutet. Dies sollte - rational zu einer statistischen Aktivität verfolgt - zu einer aussagekräftigen Analyse der Daten führen.