Ok, hier ist mein erster Versuch. Genaue Prüfung und Kommentare erwünscht!
Die Zwei-Stichproben-Hypothesen
Wenn wir einseitige Kolmogorov-Smirnov-Hypothesentests mit zwei Stichproben durchführen können , mit Null- und Alternativhypothesen in dieser Richtung:
H 0 : F Y ( t ) ≥ F X ( t ) und0: FY(t)≥FX(t)
H A : F Y ( t ) < F X ( t ) , für mindestens eine t , wobei gilt:A: FY(t)<FX(t)t
D - = | min t ( F Y ( t ) - F X ( t ) ) | 0 : F Y ( t ) ≥ F X ( t )D−=|mint(FY(t)−FX(t))|0: FY(t)≥FX(t)
die Teststatistik entspricht H ; undD + = | max t ( F Y ( t ) - F X ( t ) ) | 0 : F Y ( t ) ≤ F X ( t )D+=|maxt(FY(t)−FX(t))|0: FY(t)≤FX(t)
F Y ( t )FY(t) & sind die empirischen CDFs der Stichproben und ,F X ( t )FX(t)Y YXX
dann sollte es sinnvoll sein, eine allgemeine Intervallhypothese für einen Äquivalenztest nach diesen Grundsätzen zu erstellen (unter der Annahme, dass das Äquivalenzintervall momentan symmetrisch ist):
H und- 0 : | FY(t)-FX(t)| ≥Δ−0: |FY(t)−FX(t)|≥Δ
H , für mindestens eine .- A : | FY(t)-FX(t)| <Δ−A: |FY(t)−FX(t)|<Δtt
Dies würde zu den spezifischen zwei einseitigen "negativistischen" Nullhypothesen führen, um die Äquivalenz zu prüfen (diese beiden Hypothesen haben dieselbe Form, da sowohl als auch absolut nicht negativ sind):D +D+ D -D−
H oder- 01 : D+≥Δ−01: D+≥Δ
H .- 02 : D-≥Δ−02: D−≥Δ
Ablehnen beide H und H würde man führen , dass zu dem Schluss . Natürlich muss das Äquivalenzintervall nicht symmetrisch sein, und und könnten für die jeweiligen einseitigen Nullhypothesen durch (unten) und (oben) ersetzt werden.- 01−01 −02−02−Δ<FY(t)−FX(t)<Δ−Δ<FY(t)−FX(t)<Δ−Δ−ΔΔΔΔ2Δ2Δ1Δ1
Die Teststatistik (Aktualisiert: Delta liegt außerhalb des Absolutwertzeichens)
Die Teststatistik und (wobei und implizit bleiben) entsprechen H bzw. H und sind:D+1D+1D−2D−2nYnYnXnX−01−01−02−02
D+1=Δ−D+=Δ−|maxt[(FY(t)−FX(t))]|D+1=Δ−D+=Δ−|maxt[(FY(t)−FX(t))]|, und
D−2=Δ−D−=Δ−|mint[(FY(t)−FX(t))]|D−2=Δ−D−=Δ−|mint[(FY(t)−FX(t))]|
Der Äquivalenz- / Relevanzschwellenwert
Das Intervall - oder , wenn ein asymmetrisches Äquivalenzintervall verwendet wird - wird in Einheiten von und ausgedrückt oder die Größe der differenzierten Wahrscheinlichkeiten. Als und Ansatz Unendlichkeit, der CDF von oder für nähert sich für und für t \ ge 0 :[−Δ,Δ][−Δ,Δ][Δ2,Δ1][Δ2,Δ1]D+D+D−D−nYnYnXnXD+D+D−D−nY,nXnY,nX00t<0t<0t≥0t≥0
limnY,nX→∞p+=P(√nYnXnY+nXD+≤t)=1−e−2t2
limnY,nX→∞p+=P(nYnXnY+nX−−−−−−−−√D+≤t)=1−e−2t2
So scheint es mir , dass das PDF für die Probengröße skaliert (oder Stichprobengröße skaliert ) muss für und für :D+D+D−D−00t<0t<0t≥0t≥0
f(t)=1−e−2t2ddt=4te−2t2
f(t)=1−e−2t2ddt=4te−2t2
Glen_b weist darauf hin, dass dies eine Rayleigh-Distribution mit . Die große Stichprobenquantilfunktion für und skalierter Stichprobengröße lautet also:σ=12σ=12D+D+D−D−
CDF−1=Q(p)=√−ln(1−p)2
CDF−1=Q(p)=−ln(1−p)2−−−−−−−−−−√
und eine liberale Wahl von könnte der kritische Wert , und eine strengere Wahl der kritische Wert .ΔΔQα+σ/2=Qα+14Qα+σ/2=Qα+14Qα+σ/4=Qα+18Qα+σ/4=Qα+18