Ist es sinnvoll, einen einseitigen Kolmogorov-Smirnov-Test durchzuführen?

Ist es sinnvoll und möglich, einen einseitigen KS-Test durchzuführen? Was wäre die Nullhypothese eines solchen Tests? Oder ist der KS-Test von Natur aus ein zweiseitiger Test?

Ich würde von einer Antwort profitieren, die mir hilft, die Verteilung von D zu verstehen (ich arbeite mich in Masseys Arbeit von 1951 durch und finde die Beschreibung herausfordernd, zum Beispiel sind und das Ober- und das Infimum der Unterschiede des nicht-absoluten Wertes von Differenzen in empirischen CDFs?). $D^{+}$ $D^{-}$

Anschlussfrage: Wie erhält man Werte für und ? So viele der Veröffentlichungen, denen ich begegne, enthalten Tabellenwerte anstelle der CDF von , und . $p$ $D^{+}$ $D^{-}$ $D_{n}$ $D^{+}$ $D^{-}$

Update: Ich habe gerade die zugehörige Frage entdeckt. Was ist die Nullhypothese in einem einseitigen Kolmogorov-Smirnov-Test? , den ich bei meinem ersten Scan verpasst habe, bevor ich diesen geschrieben habe.

hypothesis-testing goodness-of-fit kolmogorov-smirnov

— Alexis
quelle

Ist es sinnvoll und möglich, einen einseitigen KS-Test durchzuführen?

Bestimmt.

Ist der KS-Test von Natur aus ein zweiseitiger Test?

Überhaupt nicht.

Was wäre die Nullhypothese eines solchen Tests?

Sie machen nicht klar, ob es sich um den Test mit einer Stichprobe oder mit zwei Stichproben handelt. Meine Antwort hier deckt beides ab - wenn Sie als das cdf der Population betrachten, aus der eine Stichprobe gezogen wurde, ist es eine Zwei-Stichprobe, während Sie den Fall einer Stichprobe erhalten, indem Sie als eine hypothetische Verteilung betrachten ( , wenn Sie es vorziehen). $F_X$ $X$ $F_X$ $F_0$

In einigen Fällen könnten Sie die Null als Gleichheit schreiben (z. B. wenn es nicht als möglich erachtet wird, in die andere Richtung zu gehen), aber wenn Sie eine direktionale Null für eine einseitige Alternative schreiben möchten, könnten Sie so etwas schreiben :

$H_0: F_Y(t)\geq F_X(t)$

$H_1: F_Y(t)< F_X(t)\,$ für mindestens eine $t$

(oder umgekehrt natürlich für den anderen Schwanz)

Wenn wir eine Annahme hinzufügen, wenn wir den Test verwenden, dass sie entweder gleich sind oder dass kleiner sein wird, impliziert die Zurückweisung der Null stochastische Ordnung (erster Ordnung) / stochastische Dominanz erster Ordnung . In ausreichend großen Stichproben können sich die Fs sogar mehrmals kreuzen und lehnen den einseitigen Test dennoch ab, sodass die Annahme unbedingt erforderlich ist, damit die stochastische Dominanz erhalten bleibt. $F_Y$

Lost , wenn mit strengen Ungleichung für zumindest einige dann ‚neigt dazu , größer zu sein‘ als . $F_Y(t)\leq F_X(t)$ $t$ $Y$ $X$

Annahmen wie diese hinzuzufügen ist nicht seltsam; es ist standard. Es unterscheidet sich nicht besonders von der Annahme (etwa in einer ANOVA), dass ein Unterschied in den Mitteln auf eine Verschiebung der gesamten Verteilung zurückzuführen ist (und nicht auf eine Änderung der Schiefe, bei der sich ein Teil der Verteilung nach unten und ein anderer nach oben verschiebt, sondern in einer solchen wie sich der Mittelwert geändert hat).

Betrachten wir zum Beispiel eine Verschiebung des Mittelwerts für einen Normalen:

Bildbeschreibung hier eingeben

Die Tatsache, dass die Verteilung für um einen gewissen Betrag von der für nach rechts verschoben ist, impliziert, dass niedriger als . Der einseitige Kolmogorov-Smirnov-Test wird in dieser Situation eher abgelehnt. $Y$ $X$ $F_Y$ $F_X$

Betrachten Sie in ähnlicher Weise eine Skalenverschiebung in einem Gamma:

Bildbeschreibung hier eingeben

Auch hier führt die Verschiebung in einen größeren Maßstab zu einem niedrigeren F. Auch hier wird der einseitige Kolmogorov-Smirnov-Test in dieser Situation eher abgelehnt.

Es gibt zahlreiche Situationen, in denen ein solcher Test nützlich sein kann.

$D^+$ $D^-$

$D^+$ $F_0$ $D^-$ $F_0$ $D^+$ $D^-$

Bildbeschreibung hier eingeben

$D^+$ $D^-$

$H_0: F_Y(t)\geq F_0(t)$

$H_1: F_Y(t)< F_0(t)\,$ für mindestens eine $t$

$Y$ $F$ $F_0$ $D^-$ $F_Y(t)< F_0(t)$ $D^-$

$D^+$ $D^−$

Das ist keine einfache Sache. Es gibt eine Vielzahl von Ansätzen, die verwendet wurden.

Wenn ich mich richtig erinnere, wurde die Verteilung über die Verwendung von Brownschen Brückenprozessen erhalten ( dieses Dokument scheint diese Erinnerung zu unterstützen ).

Ich glaube , dass diese Arbeit und die Arbeit von Marsaglia et al. Hier einen Teil des Hintergrunds abdecken und Berechnungsalgorithmen mit vielen Referenzen enthalten.

Zwischen diesen erhalten Sie viel über die Geschichte und die verschiedenen Ansätze, die verwendet wurden. Wenn sie nicht decken, was Sie brauchen, müssen Sie dies wahrscheinlich als neue Frage stellen.

$D_n$ $D^+$ $D^−$

Das ist keine besondere Überraschung. Wenn ich mich richtig erinnere, wird sogar die asymptotische Verteilung als Serie erhalten (diese Erinnerung wäre wohl falsch), und in endlichen Stichproben ist sie diskret und nicht in irgendeiner einfachen Form. In beiden Fällen gibt es keine bequeme Möglichkeit, die Informationen zu präsentieren, außer als Grafik oder Tabelle.

— Glen_b - Setzen Sie Monica wieder ein
quelle

"Bei ausreichend großen Stichproben können sich die Fs überkreuzen - sogar mehrmals - und den einseitigen Test dennoch ablehnen."

— Hao Ye

@HaoYe Ja, das ist möglich. Es wäre ein klarer Hinweis darauf, dass eine stochastische Dominanz unhaltbar wäre.

— Glen_b