Ich werde dies intuitiv motivieren und angeben, wie es für den Sonderfall zweier Gruppen zustande kommt, vorausgesetzt, Sie akzeptieren gerne die normale Annäherung an das Binomial.
Hoffentlich reicht das aus, um ein gutes Gefühl dafür zu bekommen, warum es so funktioniert, wie es funktioniert.
Sie sprechen von der Chi-Quadrat-Güte des Fit-Tests. Nehmen wir an, es gibt Gruppen (Sie haben es als n , aber es gibt einen Grund, warum ich es lieber k nenne ).knk
In dem Modell, das für diese Situation angewendet wird, sind die Zählungen , i = 1 , 2 , . . . , k sind multinomial .Oii=1,2,...,k
Sei . Die Zählungen sind von der Summe N abhängig (außer in einigen ziemlich seltenen Situationen); und es gibt einige vorgegebene Mengen von Wahrscheinlichkeiten für jede Kategorie, p i , i = 1 , 2 , … , k , die sich zu 1 summieren .N=∑ki=1OiNpi,i=1,2,…,k1
Genau wie beim Binomial gibt es eine asymptotische Normalnäherung für Multinomialwerte. Wenn Sie nur die Anzahl in einer bestimmten Zelle berücksichtigen ("in dieser Kategorie" oder nicht), ist dies ein Binomialwert. Genau wie beim Binom sind die Varianzen der Zählungen (sowie ihre Kovarianzen im Multinom) Funktionen von und den p ; Sie schätzen eine Varianz nicht separat.Np
Ei=NpiNk−1k−1Npi(1−pi)−Npipjk−1
Var(Oi)=Npi(1−pi)zi=Oi−EiEi(1−pi)√ziχ2kk−1kχ2k−1k−1
p1=pp2=1−pX=O1N−X=O2
XN(Np,Np(1−p))z=X−NpNp(1−p)√z2=(X−Np)2Np(1−p)∼χ21∼χ21
Beachte das
∑2i=1(Oi−Ei)2Ei=[X−Np]2Np+[(N−X)−(N−Np)]2N(1−p)=[X−Np]2Np+[X−Np]2N(1−p)=(X−Np)2[1Np+1N(1−p)]
Aber
1Np+1N(1−p)=Np+N(1−p)Np.N(1−p)=1Np(1−p)
∑2i=1(Oi−Ei)2Ei=(X−Np)2Np(1−p)z2χ21EiEi(1−pi)
(Oi−Ei)2Ei(Oi−Ei)2Ei(1−pi)kk−1
χ2k−1k