Warum funktioniert der Kolmogorov-Smirnov-Test?

25

Wenn ich über den 2-Stichproben-KS-Test lese, verstehe ich genau, was er tut, aber ich verstehe nicht, warum er funktioniert .

Mit anderen Worten, ich kann alle Schritte ausführen, um die empirischen Verteilungsfunktionen zu berechnen, die maximale Differenz zwischen den beiden zu ermitteln, die D-Statistik zu berechnen, die kritischen Werte zu berechnen, die D-Statistik in einen p-Wert umzuwandeln usw.

Aber ich habe keine Ahnung, warum mir irgendetwas davon etwas über die beiden Distributionen sagt.

Jemand hätte mir genauso leicht sagen können, dass ich über einen Esel springen und zählen muss, wie schnell er davonläuft. Wenn die Geschwindigkeit weniger als 2 km / h beträgt, lehne ich die Nullhypothese ab. Sicher kann ich tun, was Sie mir gesagt haben, aber was hat das mit der Nullhypothese zu tun?

Warum funktioniert der 2-Stichproben-KS-Test? Was hat die Berechnung des maximalen Unterschieds zwischen den ECDFs damit zu tun, wie unterschiedlich die beiden Verteilungen sind?

Jede Hilfe wird geschätzt. Ich bin kein Statistiker, also nehme an, dass ich ein Idiot bin, wenn möglich.

— Darcy
quelle

4

Willkommen bei CV, Darcy! Gute Frage!

— Alexis

1

Spring über einen Esel ... :)

— Richard Hardy

9

Grundsätzlich ist der Test als direktes Ergebnis des Glivenko-Cantelli-Theorems konsistent, eines der wichtigsten Ergebnisse empirischer Prozesse und möglicherweise der Statistik.

GC sagt uns, dass die Kolmogorov-Smirnov-Teststatistik unter der Nullhypothese auf 0 als $n \rightarrow \infty$ geht . Es mag intuitiv erscheinen, bis Sie sich mit echten Analysen und Grenzwertsätzen auseinandersetzen. Dies ist eine Offenbarung, da der Prozess als eine unzählige Anzahl von zufälligen Prozessen aufgefasst werden kann. Die Gesetze oder Wahrscheinlichkeiten lassen also den Schluss zu, dass es immer einen Punkt gibt, der eine Epsilon-Grenze überschreiten könnte, aber nein, das Supremum wird konvergieren auf lange Sicht.

Wie lange? Mmyyeeaa Ich weiß es nicht. Die Kraft des Tests ist etwas zweifelhaft. Ich würde es nie in der Realität verwenden.

http://www.math.utah.edu/~davar/ps-pdf-files/Kolmogorov-Smirnov.pdf

— AdamO
quelle

2

+1 Hallo AdamO! Haben Sie ein bis zwei Sätze, in denen die Macht "irgendwie zweifelhaft" ist? Ich würde diese Perspektive lieben (ich habe festgestellt, dass der Test leicht als "überfordert" angesehen wird).

— Alexis

1

F_{1}

$F_1$

F_{2}

$F_2$

p > 0.05

$p > 0.05$

p < 0.05

$p < 0.05$

F_{1} = F_{2}

$F_1 = F_2$

1

F_{1}

$F_{1}$

\neq F_{2}

$\ne F_{2}$

2

@Alexis nein, ich habe keine Bedenken mit der Mathematik des Tests. Tatsächlich finde ich es ziemlich elegant und das Ergebnis des Grenzwertsatzes ist sehr beeindruckend.

— AdamO

2

F_{1}

$F_1$

F_{2}

$F_2$

9

Wir haben zwei unabhängige, univariate Stichproben:

\begin{aligned} X_{1}, X_{2}, . . ., X_{N} & \overset{i i d}{\sim} F \\ Y_{1}, Y_{2}, . . ., Y_{M} & \overset{i i d}{\sim} G, \end{aligned}

$\begin{align} X_1,\,X_2,\,...,\,X_N&\overset{iid}{\sim}F\\ Y_1,\,Y_2,\,...,\,Y_M&\overset{iid}{\sim}G, \end{align}$

G

$G$

F

$F$

\begin{aligned} H_{0} & : F (x) = G (x) for all x \in R \\ H_{1} & : F (x) \neq G (x) for some x \in R . \end{aligned}

$\begin{align} H_0&:F(x) = G(x)\quad\text{for all } x\in\mathbb{R}\\ H_1&:F(x) \neq G(x)\quad\text{for some } x\in\mathbb{R}. \end{align}$

{X_{i}}_{i = 1}^{N}

$\{X_i\}_{i=1}^N$

{Y_{j}}_{j = 1}^{M}

$\{Y_j\}_{j=1}^M$

X_{i}

$X_i$

Y_{j}

$Y_j$

F

$F$

G

$G$

x

$x$

F

$F$

G

$G$

F (x) \neq G (x)

$F(x)\neq G(x)$

x \in R

$x\in\mathbb{R}$

— jcz
quelle

8

Eine intuitive Einstellung:

Der Kolmogorov-Smirnov-Test beruht im Wesentlichen auf der Reihenfolge der Beobachtungen nach Verteilung. Die Logik ist, dass, wenn die beiden zugrunde liegenden Verteilungen gleich sind, die Reihenfolge - abhängig von der Stichprobengröße - zwischen den beiden ziemlich gut gemischt werden sollte.

$Y$ $X$ $D$

$D$ $X$ $Y$

— Alexis
quelle