Einfluss datenbasierter Bin-Grenzen auf einen Chi-Quadrat-Anpassungstest?

Abgesehen von dem offensichtlichen Problem der geringen Leistung des Chi-Quadrats unter diesen Umständen, stellen Sie sich vor, Sie führen einen Chi-Quadrat-Test für eine bestimmte Dichte mit nicht festgelegten Parametern durch, indem Sie die Daten bündeln.

Nehmen wir der Vollständigkeit halber eine Exponentialverteilung mit unbekanntem Mittelwert und einer Stichprobengröße von beispielsweise 100 an.

Um eine vernünftige Anzahl von erwarteten Beobachtungen pro Bin zu erhalten, müssten einige Daten berücksichtigt werden (wenn wir beispielsweise 6 Bins unter den Mittelwert und 4 darüber setzen, werden immer noch datenbasierte Bin-Grenzen verwendet). .

Diese Verwendung von Behältern basierend auf dem Anzeigen der Daten würde sich jedoch vermutlich auf die Verteilung der Teststatistik unter der Null auswirken.

Ich habe viel Diskussion über die Tatsache gesehen , dass - wenn die Parameter von Maximum - Likelihood von den geschätzten werden binned Daten - Sie 1 df pro geschätzten Parameter verlieren (ein Problem nach rechts zurück zu Fisher vs Karl Pearson Datierung) - aber ich weiß nicht mehr , Lesen Sie alles über das Finden der Bin-Grenzen anhand der Daten. (Wenn Sie sie aus den nicht eingeteilten Daten abschätzen, liegt bei Bins die Verteilung der Teststatistik irgendwo zwischen a und a .) $k$ $\chi^2_{k}$ $\chi^2_{k-p}$

Hat diese datenbasierte Auswahl von Behältern einen wesentlichen Einfluss auf das Signifikanzniveau oder die Leistung? Gibt es Ansätze, die wichtiger sind als andere? Wenn es einen großen Effekt gibt, ist es etwas, das in großen Samples verschwindet?

Wenn es einen wesentlichen Einfluss hat, scheint dies die Verwendung eines Chi-Quadrat-Tests zu erschweren, wenn Parameter unbekannt sind, die in vielen Fällen fast unbrauchbar sind (obwohl sie in einigen Texten immer noch empfohlen werden), es sei denn, Sie hatten ein gutes a -priori Schätzung des Parameters.

Eine Diskussion der Themen oder Hinweise auf Verweise (vorzugsweise unter Erwähnung ihrer Schlussfolgerungen) wäre nützlich.

Bearbeiten, so ziemlich abgesehen von der Hauptfrage:

Es fällt mir ein, dass es für den speziellen Fall des Exponentials * (und der Uniform) mögliche Lösungen gibt, aber ich bin immer noch an der allgemeineren Frage der Auswirkung bei der Auswahl der Behältergrenzen interessiert.

* Für das Exponential könnte man zum Beispiel die kleinste Beobachtung verwenden (sagen wir, sie ist gleich ), um eine sehr grobe Vorstellung davon zu bekommen, wo die Fächer zu platzieren sind (da die kleinste Beobachtung mit dem Mittelwert exponentiell ist ), und Testen Sie dann die verbleibenden Differenzen ( ) auf Exponentialität. Dies könnte natürlich zu einer sehr schlechten Schätzung von und damit zu einer schlechten Auswahl von Behältern führen, obwohl man das Argument vermutlich rekursiv verwenden könnte, um die niedrigsten zwei oder drei Beobachtungen zu treffen, aus denen man vernünftige Behältern auswählen und dann die Unterschiede von testen kann die übrigen Beobachtungen über der größten dieser Statistiken kleinster Ordnung für Exponentialität) $m$ $\mu/n$ $n-1$ $x_i - m$ $\mu$

chi-squared goodness-of-fit binning

— Glen_b - Setzen Sie Monica wieder ein
quelle

Interessante Frage. Ich kenne die Antwort nicht, aber die Vorstellung, dass einige Freiheitsgrade verloren gehen sollten, ist sinnvoll. Wenn Sie es noch nicht gesehen haben, sollte diese Antwort von @whuber zum Nachdenken anregen: Wie man Freiheitsgrade versteht . Es scheint mir, dass einige Simulationsstudien es Ihnen ermöglichen sollten, sich hier zumindest für bestimmte Fälle einen Namen zu machen.

— gung - Wiedereinsetzung von Monica

Ich bin mir nicht sicher, wie hilfreich dies ist, aber es gibt ein ähnliches Problem im Bereich der robusten Schätzung. Insbesondere eine Methode zur robusten Schätzung (z. B. getrimmter Mittelwert) erfordert häufig eine parametrisierte Eingabe (z. B. Parameter, der definiert, wie viel getrimmt werden muss). Dieser Parameter kann durch eine datengesteuerte Methode ausgewählt werden (z. B. sehen Sie, wie fett die Schwänze sind, bevor Sie den Trimmparameter auswählen). Die Vorauswahl des Trimmparameters wirkt sich jedoch auf die Verteilung des getrimmten Mittelwerts gegenüber beispielsweise einer festen Parameterregel aus. Der übliche Umgang mit dieser Literatur erfolgt über einen Bootstrap.

— Colin T Bowers

@ColinTBowers - möglicherweise etwas hilfreich, danke. Ich habe nicht über die Möglichkeit des Bootstrappens nachgedacht.

— Glen_b

Es könnte interessant sein, das Problem in einen einfachsten Fall zu zerlegen. Stellen Sie sich so etwas wie 5 Beobachtungen aus Ihrer Lieblingsverteilung vor und fügen Sie einen einzelnen Teiler in die Daten ein, um nur zwei Klassen zu bilden.

— Zkurtz

Antworten:

Die grundlegenden Ergebnisse der Chi-Quadrat-Anpassungstests können hierarchisch verstanden werden .

Stufe 0 . Die klassische Pearson-Chi-Quadrat-Teststatistik zum Testen einer multinomialen Stichprobe gegen einen Vektor mit fester Wahrscheinlichkeit ist $p$ Wobei bezeichnet die Anzahl der Ergebnisse in der - ten Zelle aus einer Probeeiner Größe . Dies kann fruchtbar als die quadratische Norm des Vektors wobei

X^{2} (p) = \sum_{i = 1}^{k} \frac{(X_{i}^{(n)} - n p_{i})^{2}}{n p_{i}} \overset{d}{\to} χ_{k - 1}^{2},

$X^2(p) = \sum_{i=1}^k \frac{(X^{(n)}_i - n p_i)^2}{n p_i} \stackrel{d}{\to} \chi_{k-1}^2 \>,$

X_{i}^{(n)}

$X_i^{(n)}$

i

$i$

n

$n$

Y_{n} = (Y_{1}^{(n)}, \dots, Y_{k}^{(n)})

$\mathbf Y_n = (Y_1^{(n)},\ldots,Y_k^{(n)})$

das nach dem multivariaten zentralen Grenzwertsatz in der Verteilung konvergiert als

Y_{i}^{(n)} = (X_{i}^{(n)} - n p_{i}) / \sqrt{n p_{i}}

$Y_i^{(n)} = (X_i^{(n)} - n p_i)/\sqrt{n p_i}$

Daraus sehen wir, dass

{Y.}_{n} \overset{d}{\to} N (0, ich - \sqrt{p} {\sqrt{p}}^{T}) .

$\mathbf Y_n \stackrel{d}{\to} \mathcal N(0, \mathbf I - \sqrt{p}\sqrt{p}^T) \>.$

X^{2} = ‖ Y_{n} ‖^{2} \to χ_{k - 1}^{2}

$X^2 = \|\mathbf Y_n\|^2 \to \chi^2_{k-1}$

ist idempotent von Rang

I - \sqrt{p} {\sqrt{p}}^{T}

$\mathbf I - \sqrt{p}\sqrt{p}^T$

k - 1

$k-1$

$p$ $m$ $p_i$

X_{1}^{2} = \sum_{i = 1}^{k} \frac{(X_{i}^{(n)} - n {\hat{p}}_{i})^{2}}{n {\hat{p}}_{i}} \overset{d}{\to} χ_{k - m - 1}^{2},

$X^2_1 = \sum_{i=1}^k \frac{(X^{(n)}_i - n \hat{p}_i)^2}{n \hat{p}_i} \stackrel{d}{\to} \chi_{k-m - 1}^2 \>,$

$\lambda$ $k$

$m$ $m = 1$

X_{2}^{2} = \sum_{i = 1}^{k} \frac{(X_{i}^{(n)} - n {\hat{p}}_{i})^{2}}{n {\hat{p}}_{i}} \overset{d}{\to} χ_{k - m - 1}^{2},

$X^2_2 = \sum_{i=1}^k \frac{(X^{(n)}_i - n \hat{p}_i)^2}{n \hat{p}_i} \stackrel{d}{\to} \chi_{k-m - 1}^2 \>,$

{\hat{p}}_{i}

$\hat{p}_i$

$Z_1,\ldots,Z_n \sim F_\lambda$ $\lambda$ $\chi_{k-m-1}^2$ $\chi_{k-1}^2$

$\mathbf Y_n$ $\mathcal N(0, \mathbf I - \sqrt{p_\lambda}\sqrt{p_\lambda}^T - \mathbf A(\lambda))$

$\lambda$ $\mathbf A(\lambda)$

$\mathbf Y_n$ $\mathbf B(\hat{\lambda})$

Y_{n}^{T} B^{T} B Y_{n} \overset{d}{\to} χ_{k - 1}^{2},

$\mathbf Y_n^T \mathbf B^T \mathbf B \mathbf Y_n \stackrel{d}{\to} \chi_{k-1}^2 \>,$

k

$k$

Beispiele sind die Rao-Robson-Nikulin-Statistik und die Dzhaparidze-Nikulin-Statistik .

$k$ $1/k$ $\hat{I}_j = \hat \mu + \hat\sigma I_{0,j}$ $I_{0,j} = [F^{-1}((j-1)/k), F^{-1}(j/k))$

Verweise

A W. van der Vaart (1998), Asymptotic Statistics , Cambridge University Press. Kapitel 17 : Chi-Quadrat-Tests .
$\chi^2$
FC Drost (1989), Verallgemeinerte Chi-Quadrat-Anpassungstests für Modelle im Ortsmaßstab , wenn die Anzahl der Klassen gegen unendlich tendiert , Ann. Stat . Vol. 17, nein. 3, 1285–1300.
MS Nikulin, MS (1973), Chi-Quadrat-Test für die kontinuierliche Verteilung mit Verschiebungs- und Skalenparametern , Theory of Probability and its Application , vol. 19, nein. 3, 559–568.
KO Dzaparidze und MS Nikulin (1973), Über eine Modifikation der Standardstatistik von Pearson , Theory of Probability and its Application , vol. 19, nein. 4, 851–853.
KC Rao und DS Robson (1974), Eine Chi-Quadrat-Statistik für die Güte von Fit-Tests innerhalb der Exponentialfamilie , Comm. Statist. Vol 3, No. 12, 1139–1153.
N. Balakrishnan, V. Voinov und MS Nikulin (2013), Chi-Quadrat- Prüfung der Anpassungsgüte mit Anwendungen , Academic Press.

— Kardinal
quelle

Ich habe unten zumindest teilweise Antworten auf meine Frage gefunden. (Ich möchte trotzdem jemandem diesen Bonus geben, daher sind alle weiteren Informationen willkommen.)

$\chi^2_{k-p-1}$ $p$ $\chi^2_1$ Variablen (z $k$ Zellen, $p$ Parameter) wobei die Gewichte zwischen 0 und 1 liegen (wobei der cdf der Verteilung zwischen dem von a $\chi^2_{k-p}$ und ein $\chi^2_{k}$ , wie in meiner Frage für die Verteilung bei Verwendung der ML-Schätzung angedeutet), und die Gewichte auf diesen zuletzt $p$ Begriffe bleiben von dieser Schätzung unberührt.

Verweise

Moore DS (1971), Eine Chi-Quadrat-Statistik mit zufälligen Zellgrenzen , Ann. Mathematik. Stat. Bd. 42, Nr. 1, 147–156.

Roy AR (1956), On $\chi^2$ Statistik mit variablen Intervallen , Technischer Bericht Nr. 1 , Department of Statistics, Stanford University.

Watson, GS (1957), The $\chi^2$ Anpassungstest für Normalverteilungen , Biometrika , 44 , 336–348.

Watson, GS (1958), On $\chi^2$ Anpassungstests für kontinuierliche Verteilungen , J. Royal Statist. Soc. B , 20 , 44–61.

Watson, GS (1959), Einige neuere Ergebnisse in $\chi^2$ Anpassungstests , Biometrics , 15 , 440-468

— Glen_b - Setzen Sie Monica wieder ein
quelle