Einfluss datenbasierter Bin-Grenzen auf einen Chi-Quadrat-Anpassungstest?


18

Abgesehen von dem offensichtlichen Problem der geringen Leistung des Chi-Quadrats unter diesen Umständen, stellen Sie sich vor, Sie führen einen Chi-Quadrat-Test für eine bestimmte Dichte mit nicht festgelegten Parametern durch, indem Sie die Daten bündeln.

Nehmen wir der Vollständigkeit halber eine Exponentialverteilung mit unbekanntem Mittelwert und einer Stichprobengröße von beispielsweise 100 an.

Um eine vernünftige Anzahl von erwarteten Beobachtungen pro Bin zu erhalten, müssten einige Daten berücksichtigt werden (wenn wir beispielsweise 6 Bins unter den Mittelwert und 4 darüber setzen, werden immer noch datenbasierte Bin-Grenzen verwendet). .

Diese Verwendung von Behältern basierend auf dem Anzeigen der Daten würde sich jedoch vermutlich auf die Verteilung der Teststatistik unter der Null auswirken.

Ich habe viel Diskussion über die Tatsache gesehen , dass - wenn die Parameter von Maximum - Likelihood von den geschätzten werden binned Daten - Sie 1 df pro geschätzten Parameter verlieren (ein Problem nach rechts zurück zu Fisher vs Karl Pearson Datierung) - aber ich weiß nicht mehr , Lesen Sie alles über das Finden der Bin-Grenzen anhand der Daten. (Wenn Sie sie aus den nicht eingeteilten Daten abschätzen, liegt bei Bins die Verteilung der Teststatistik irgendwo zwischen a und a .)kχk2χkp2

Hat diese datenbasierte Auswahl von Behältern einen wesentlichen Einfluss auf das Signifikanzniveau oder die Leistung? Gibt es Ansätze, die wichtiger sind als andere? Wenn es einen großen Effekt gibt, ist es etwas, das in großen Samples verschwindet?

Wenn es einen wesentlichen Einfluss hat, scheint dies die Verwendung eines Chi-Quadrat-Tests zu erschweren, wenn Parameter unbekannt sind, die in vielen Fällen fast unbrauchbar sind (obwohl sie in einigen Texten immer noch empfohlen werden), es sei denn, Sie hatten ein gutes a -priori Schätzung des Parameters.

Eine Diskussion der Themen oder Hinweise auf Verweise (vorzugsweise unter Erwähnung ihrer Schlussfolgerungen) wäre nützlich.


Bearbeiten, so ziemlich abgesehen von der Hauptfrage:

Es fällt mir ein, dass es für den speziellen Fall des Exponentials * (und der Uniform) mögliche Lösungen gibt, aber ich bin immer noch an der allgemeineren Frage der Auswirkung bei der Auswahl der Behältergrenzen interessiert.

* Für das Exponential könnte man zum Beispiel die kleinste Beobachtung verwenden (sagen wir, sie ist gleich ), um eine sehr grobe Vorstellung davon zu bekommen, wo die Fächer zu platzieren sind (da die kleinste Beobachtung mit dem Mittelwert exponentiell ist ), und Testen Sie dann die verbleibenden Differenzen ( ) auf Exponentialität. Dies könnte natürlich zu einer sehr schlechten Schätzung von und damit zu einer schlechten Auswahl von Behältern führen, obwohl man das Argument vermutlich rekursiv verwenden könnte, um die niedrigsten zwei oder drei Beobachtungen zu treffen, aus denen man vernünftige Behältern auswählen und dann die Unterschiede von testen kann die übrigen Beobachtungen über der größten dieser Statistiken kleinster Ordnung für Exponentialität)μ / n n - 1 × i - m μmμ/nn1ximμ


1
Interessante Frage. Ich kenne die Antwort nicht, aber die Vorstellung, dass einige Freiheitsgrade verloren gehen sollten, ist sinnvoll. Wenn Sie es noch nicht gesehen haben, sollte diese Antwort von @whuber zum Nachdenken anregen: Wie man Freiheitsgrade versteht . Es scheint mir, dass einige Simulationsstudien es Ihnen ermöglichen sollten, sich hier zumindest für bestimmte Fälle einen Namen zu machen.
gung - Wiedereinsetzung von Monica

1
Ich bin mir nicht sicher, wie hilfreich dies ist, aber es gibt ein ähnliches Problem im Bereich der robusten Schätzung. Insbesondere eine Methode zur robusten Schätzung (z. B. getrimmter Mittelwert) erfordert häufig eine parametrisierte Eingabe (z. B. Parameter, der definiert, wie viel getrimmt werden muss). Dieser Parameter kann durch eine datengesteuerte Methode ausgewählt werden (z. B. sehen Sie, wie fett die Schwänze sind, bevor Sie den Trimmparameter auswählen). Die Vorauswahl des Trimmparameters wirkt sich jedoch auf die Verteilung des getrimmten Mittelwerts gegenüber beispielsweise einer festen Parameterregel aus. Der übliche Umgang mit dieser Literatur erfolgt über einen Bootstrap.
Colin T Bowers

@ColinTBowers - möglicherweise etwas hilfreich, danke. Ich habe nicht über die Möglichkeit des Bootstrappens nachgedacht.
Glen_b

1
Es könnte interessant sein, das Problem in einen einfachsten Fall zu zerlegen. Stellen Sie sich so etwas wie 5 Beobachtungen aus Ihrer Lieblingsverteilung vor und fügen Sie einen einzelnen Teiler in die Daten ein, um nur zwei Klassen zu bilden.
Zkurtz

Antworten:


15

Die grundlegenden Ergebnisse der Chi-Quadrat-Anpassungstests können hierarchisch verstanden werden .

Stufe 0 . Die klassische Pearson-Chi-Quadrat-Teststatistik zum Testen einer multinomialen Stichprobe gegen einen Vektor mit fester Wahrscheinlichkeit ist X 2 ( p ) = k i = 1 ( X ( n ) i - n p i ) 2p Wobei X ( n ) , i bezeichnet die Anzahl der Ergebnisse in der i - ten Zelle aus einer Probeeiner Größe n . Dies kann fruchtbar als die quadratische Norm des Vektors Y n = ( Y ( n ) 1 , , Y ( n ) k ) angesehen werden, wobei Y ( n ) i = ( X ( n ) i - n p i ) /

X2(p)=i=1k(Xi(n)npi)2npidχk12,
Xi(n)inYn=(Y1(n),,Yk(n)) das nach dem multivariaten zentralen Grenzwertsatz in der Verteilung konvergiert als Y n d N(0,I-Yi(n)=(Xi(n)npi)/npi Daraus sehen wir, dass X 2 = Y n 2χ 2 k - 1 ist, da I -
Y.ndN(0,ich-ppT).
X2=Y.n2χk-12ist idempotent von Rangk-1.ich-ppTk1

pmpi

X12=i=1k(Xi(n)np^i)2np^idχkm12,

λk

mm=1

X22=i=1k(Xi(n)np^i)2np^idχkm12,
p^i

Z1,,ZnFλλχkm12χk12

YnN(0,IpλpλTA(λ))

λA(λ)

YnB(λ^)

YnTBTBYndχk12,
k

Beispiele sind die Rao-Robson-Nikulin-Statistik und die Dzhaparidze-Nikulin-Statistik .

k1/kI^j=μ^+σ^I0,jI0,j=[F1((j1)/k),F1(j/k))

Verweise

  1. A W. van der Vaart (1998), Asymptotic Statistics , Cambridge University Press. Kapitel 17 : Chi-Quadrat-Tests .

  2. χ2

  3. FC Drost (1989), Verallgemeinerte Chi-Quadrat-Anpassungstests für Modelle im Ortsmaßstab , wenn die Anzahl der Klassen gegen unendlich tendiert , Ann. Stat . Vol. 17, nein. 3, 1285–1300.

  4. MS Nikulin, MS (1973), Chi-Quadrat-Test für die kontinuierliche Verteilung mit Verschiebungs- und Skalenparametern , Theory of Probability and its Application , vol. 19, nein. 3, 559–568.

  5. KO Dzaparidze und MS Nikulin (1973), Über eine Modifikation der Standardstatistik von Pearson , Theory of Probability and its Application , vol. 19, nein. 4, 851–853.

  6. KC Rao und DS Robson (1974), Eine Chi-Quadrat-Statistik für die Güte von Fit-Tests innerhalb der Exponentialfamilie , Comm. Statist. Vol 3, No. 12, 1139–1153.

  7. N. Balakrishnan, V. Voinov und MS Nikulin (2013), Chi-Quadrat- Prüfung der Anpassungsgüte mit Anwendungen , Academic Press.


5

Ich habe unten zumindest teilweise Antworten auf meine Frage gefunden. (Ich möchte trotzdem jemandem diesen Bonus geben, daher sind alle weiteren Informationen willkommen.)

χk-p-12p χ12 Variablen (z k Zellen, p Parameter) wobei die Gewichte zwischen 0 und 1 liegen (wobei der cdf der Verteilung zwischen dem von a χk-p2 und ein χk2, wie in meiner Frage für die Verteilung bei Verwendung der ML-Schätzung angedeutet), und die Gewichte auf diesen zuletzt p Begriffe bleiben von dieser Schätzung unberührt.

Verweise

Moore DS (1971), Eine Chi-Quadrat-Statistik mit zufälligen Zellgrenzen , Ann. Mathematik. Stat. Bd. 42, Nr. 1, 147–156.

Roy AR (1956), Onχ2Statistik mit variablen Intervallen , Technischer Bericht Nr. 1 , Department of Statistics, Stanford University.

Watson, GS (1957), Theχ2Anpassungstest für Normalverteilungen , Biometrika , 44 , 336–348.

Watson, GS (1958), Onχ2Anpassungstests für kontinuierliche Verteilungen , J. Royal Statist. Soc. B , 20 , 44–61.

Watson, GS (1959), Einige neuere Ergebnisse inχ2Anpassungstests , Biometrics , 15 , 440-468

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.