Ich halte es für legitim, den relevanten Teil des fraglichen Absatzes zu zitieren:
3. Der KS-Test kann nicht in zwei oder mehr Dimensionen angewendet werden. Astronomen haben häufig Datensätze mit Punkten, die in einer Ebene oder höheren Dimensionen anstatt entlang einer Linie verteilt sind. Mehrere Artikel in der astronomischen Literatur geben vor, einen zweidimensionalen KS-Test zu präsentieren, und einer ist in dem berühmten Band Numerical Recipes wiedergegeben. Es kann jedoch kein EDF-basierter Test (einschließlich KS-, AD- und verwandter Tests) in zwei oder höheren Dimensionen angewendet werden, da es keine eindeutige Möglichkeit gibt, die Punkte so zu ordnen, dass Abstände zwischen genau definierten EDFs berechnet werden können. Man kann eine Statistik basierend auf einem Bestellverfahren erstellen und dann die höchsten Abstände zwischen zwei Datensätzen (oder einem Datensatz und einer Kurve) berechnen. Die kritischen Werte der resultierenden Statistik sind jedoch nicht verteilungsfrei.
Wie gesagt, scheint dies zu stark.
1) Die bivariate Verteilungsfunktion, die ist, ist eine Abbildung von bis . Das heißt, die Funktion nimmt univariate reelle Werte zwischen 0 und 1 an. Diese Werte - als Wahrscheinlichkeiten - sind sicherlich bereits "geordnet" - und dies (der Wert der Funktion) ist das, was wir für ECDF-basierte Tests vergleichen müssen . In ähnlicher Weise ist das ecdf im bivariaten Fall perfekt definiert.F(x1,x2)=P(X1≤x1,X2≤x2)R2[0,1]F^
Ich glaube nicht, dass man unbedingt versuchen muss, daraus eine Funktion einer univariaten kombinierten Variablen zu machen, wie der Text vorschlägt. Sie berechnen einfach und bei jeder erforderlichen Kombination und berechnen die Differenz.FF^
2) Bei der Frage, ob es verteilungsfrei ist, haben sie jedoch einen Punkt:
a) Eine solche Teststatistik würde sich eindeutig nicht durch Änderungen der Randtransformationen ändern, dh wenn sie als Test für bivariate unabhängige Uniformen konstruiert wird , funktioniert sie gleichermaßen sowie ein Test der Unabhängigkeit mit . In diesem Sinne ist es verteilungsfrei (wir könnten sagen "margenfrei").U=(U1,U2)(X1,X2)Ui=Fi(Xi)
b) Es gibt jedoch einen allgemeineren Grund im weiteren Sinne, dass eine naive Version der KS-Statistik (wie ich sie gerade beschrieben habe) nicht allgemeiner verteilungsfrei ist. wir können nicht einfach willkürlich transformieren .UX∗=g(U)
In einer früheren Version meiner Antwort sagte ich:
Es gibt keine Schwierigkeiten, kein Problem
Das ist falsch. Es gibt in der Tat Probleme, wenn sich nicht nur die Ränder von bivariaten unabhängigen Uniformen ändern, wie gerade erwähnt. Diese Schwierigkeiten wurden jedoch in einer Reihe von Veröffentlichungen, die bivariate / multivariate Versionen der Kolmogorov-Smirnov-Statistiken liefern, die nicht unter diesem Problem leiden, auf verschiedene Weise berücksichtigt.
Ich werde vielleicht zurückkommen und einige dieser Referenzen und eine Diskussion darüber hinzufügen, wie sie funktionieren, sobald es die Zeit erlaubt.