Können Sie den Kolmogorov-Smirnov-Test verwenden, um die Äquivalenz zweier Verteilungen direkt zu testen?


8

Es wurde über andere Fragen gesprochen, wie man den TOST-Ansatz (Two One-Sided Tests) für den Kolmogorov-Smirnov (KS) -Test verwenden könnte, aber ich habe mich gefragt, ob es möglich ist, die Teststatistik direkt zu verwenden, um diese beiden zu zeigen Verteilungen waren ähnlich?

Soweit ich weiß, stellt die KS-Teststatistik den größten Unterschied zwischen zwei CDFs dar, wobei die Version mit einer Stichprobe ursprünglich als Anpassungstest verwendet wurde. Dies wird in [1] gezeigt, wenn die empirische Verteilung außerhalb des Konfidenzintervalls liegt (dh ein Punkt ist zu weit von der hypothetischen Verteilung entfernt, gegen die sie testen).

Wenn die Version mit zwei Stichproben häufig verwendet wird, um zu zeigen, dass sich zwei Verteilungen ähnlich wie bei der Version mit einer Stichprobe erheblich voneinander unterscheiden, können wir die Berechnung der Konfidenzintervalle von der Verwendung von um stattdessen , um zu zeigen, dass die maximale Differenz zwischen den beiden Verteilungen signifikant ähnlich ist?( 1 - α ) = 0,95(1α)=0.05(1α)=0.95

[1] Massey, F. "Der Kolmogorov-Smirnov-Test auf Anpassungsgüte", Journal of American Statistical Association , vol. 46, nein. 253, S. 68-78, März 1951

Antworten:


3

Bei der Durchführung des Kolmogorov-Smirnov-Tests nehmen wir Die beiden Verteilungen sind äquivalent. Wir berechnen dann eine Teststatistik und, wenn der entsprechende Wert klein genug ist, lehnen wir und schließen daraus Die beiden Verteilungen sind unterschiedlich.p H 0 H A :H0:pH0HA:

Bei Hypothesentests verwenden wir einen Wert, um die Menge an Beweisen zu quantifizieren, die wir zur Ablehnung der Nullhypothese benötigen. Ein Wert von 1 zeigt an, dass wir keine Beweise gesammelt haben, um die Nullhypothese abzulehnen. Ein Wert nahe 0 zeigt an, dass es überwältigende Beweise gibt, um die Nullhypothese abzulehnen.p pppp

Nehmen wir an, wir haben Daten und berechnen einen Wert aus dem KS-Test mit Dies weist darauf hin, dass es nur sehr wenige Beweise gibt, um die Nullhypothese abzulehnen. Wir können jedoch keinen Standard von so dass impliziert, dass wir zu dem Schluss kommen, dass die Nullhypothese korrekt ist. Außerdem glaube ich nicht, dass es einen alternativen Test gibt, mit dem wir den Schluss ziehen können, dass die beiden Verteilungen gleich sind.p = 0,99. α = 0,95 p > αpp=0.99.α=0.95p>α

Ich glaube, Sie können ganz ehrlich sein, wenn Sie schreiben oder diskutieren. Erwähnen Sie, dass Sie einen KS-Test durchgeführt haben, einen Wert angeben und wenn der p- Wert ausreichend hoch ist, artikulieren Sie, dass es nur sehr wenige Anhaltspunkte dafür gibt, dass die beiden Verteilungen unterschiedlich sind. Obwohl Sie nicht schlussfolgern können, dass die Verteilungen identisch sind, sollten Sie feststellen können, dass es keine Hinweise darauf gibt, dass die beiden Verteilungen unterschiedlich sind. Je größer Ihre Stichprobengröße n ist , desto mehr Vertrauen haben Sie in diese Antwort.ppn

Es ist nicht ganz die Antwort, nach der Sie wahrscheinlich gesucht haben, aber es ist auch keine totale Wäsche. Hoffe das hilft!


(1/2) Ich verstehe, dass wir nicht einfach einen ap-Wert von> 0,98 verwenden können. Usw. - ich habe mich gefragt, ob der KS-Test tatsächlich den maximalen Abstand zwischen den beiden Verteilungen misst, dann fühlt es sich an als wäre es in einer einzigartigen Position, Äquivalenztests direkt durchzuführen. Wenn zum Beispiel die Teststatistik D = 0 ist, müssen dann sicher die beiden Verteilungen identisch sein? Und wenn dies der Fall ist, was ist dann mit D <0,0001? Es fühlt sich so an, als ob es einen kritischen Punkt geben sollte (wie wenn p 0,05 überschreitet), an dem wir nicht mehr sicher sein können, dass sie dieselbe Verteilung haben, und
jamesyjamesjames

(2/2) ... kann also das auf den Kopf stellen und 0 <D <0,05 (zum Beispiel) verwenden, um zu sagen, dass die beiden Verteilungen signifikant ähnlich sind.
Jamesyjamesjames

1
D=0pn

1
... Verteilungen sind identisch, aber Sie können diese Tatsache nicht endgültig feststellen.
Matt Brems

2
Ah natürlich - weil es ein ECDF ist. Ja das macht Sinn.
Jamesyjamesjames
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.