Das statistische Standardmodell, das der Analyse von Kontingenztabellen zugrunde liegt, geht davon aus, dass die Zellenzahlen (vorbehaltlos von der Gesamtzahl) unabhängige Poisson-Zufallsvariablen sind. Wenn Sie also eine n × m Kontingenztabelle haben, nimmt das statistische Modell, das als Grundlage für die Analyse verwendet wird, an, dass jede Zellenzahl eine bedingungslose Verteilung aufweist:
Xich , j ~ Pois ( μich , j)
Sobald Sie eine Gesamtzellenzahl für die Kontingenztabelle oder eine Zeilen- oder Spaltenanzahl festlegen, werden die resultierenden bedingten Verteilungen der Zellenzahlen multinomial. In jedem Fall haben wir für eine Poisson-Verteilung E ( Xich , j) = V ( Xich , j) = μich , j , daher ist die standardisierte Zellenzahl:
STD ( Xich , j) ≡ Xich , j- E ( Xich , j)V ( Xich , j)------√= Xich , j- μich , jμich , j---√
Was Sie also in der Formel sehen, nach der Sie fragen, ist die standardisierte Zellenzahl unter der Annahme, dass die Zellenzahlen eine (bedingungslose) Poisson-Verteilung haben.
Von hier aus ist es üblich, die Unabhängigkeit der Zeilen- und Spaltenvariablen in den Daten zu testen. In diesem Fall können Sie eine Teststatistik verwenden, die die Quadratsumme der obigen Werte betrachtet (die der Quadratnorm entspricht) des Vektors der standardisierten Werte). Der Chi-Quadrat-Test liefert einen p-Wert für diese Art von Test, basierend auf einer Näherung mit großer Stichprobe an die Nullverteilung der Teststatistik. Es wird normalerweise in Fällen angewendet, in denen keine der Verkaufszahlen zu gering ist.
stdres
für standardisierte Residuen gibt.