Was machst du, wenn deine Freiheitsgrade über das Ende deiner Tische hinausgehen?

Die Freiheitsgrade in meiner F-Tabelle sind für meine große Stichprobe nicht hoch genug.

Wenn ich beispielsweise ein F mit 5 und 6744 Freiheitsgraden habe, wie finde ich den kritischen Wert von 5% für eine ANOVA?

Was wäre, wenn ich einen Chi-Quadrat-Test mit großen Freiheitsgraden machen würde?

[Eine Frage wie diese wurde vor einiger Zeit veröffentlicht, aber das OP hat einen Fehler gemacht und hatte tatsächlich einen kleineren df, wodurch dieser auf ein Duplikat reduziert wurde - aber die ursprüngliche große df-Frage sollte irgendwo vor Ort eine Antwort haben]

— Glen_b - Monica neu starten
quelle

Einen größeren Tisch bekommen?

— Federico Poloni

F-Tabellen :

Der einfachste Weg von allen - wenn Sie können - ist die Verwendung eines Statistikpakets oder eines anderen Programms, um Ihnen den kritischen Wert zu geben. In R können wir beispielsweise Folgendes tun:
```
 qf(.95,5,6744)
[1] 2.215425
```
(Sie können aber genauso einfach einen genauen p-Wert für Ihr F berechnen).
Normalerweise haben F-Tabellen am Ende der Tabelle einen Freiheitsgrad von "unendlich", einige jedoch nicht. Wenn Sie eine sehr große df haben (zum Beispiel ist 6744 sehr groß), können Sie stattdessen den Eintrag unendlich ( ) verwenden. $\infty$

Sie könnten also Tabellen für , die 120 df und df ergeben: $\nu_1=5$ $\infty$
```
      ...    5      ...
 ⁞
120        2.2899   
 ∞         2.2141
```
Die df-Zeile dort funktioniert für jedes wirklich große (Nenner df). Wenn wir das verwenden, haben wir 2.2141 anstelle der exakten 2.2154, aber das ist nicht schlecht. $\infty$ $\nu_2$
Wenn Sie keinen Eintrag für unendlich viele Freiheitsgrade haben, können Sie einen aus einer Chi-Quadrat-Tabelle herausarbeiten, indem Sie den kritischen Wert für den Zähler df geteilt durch diesen df verwenden

Nehmen Sie zum Beispiel für einen kritischen Wert von , einen kritischen Wert von und dividieren Sie durch . Der kritische Wert von 5% für a beträgt . Wenn wir durch teilen , ist das was die Zeile aus der obigen Tabelle ist. $F_{5,\infty}$ $\chi^2_5$ $5$ $\chi^2_5$ $11.0705$ $5$ $2.2141$ $\infty$
Wenn Ihre Freiheitsgrade etwas zu klein sind, um den Eintrag "unendlich" zu verwenden (aber immer noch viel größer als 120 oder was auch immer Ihre Tabelle betrifft), können Sie die inverse Interpolation zwischen dem höchsten endlichen df und dem Eintrag "unendlich" verwenden. Angenommen, wir möchten einen kritischen Wert für df berechnen $F_{5, 674}$
```
   F       df     120/df    
 ------   ----    -------
 2.2899    120      1     
   C       674    0.17804
 2.2141     ∞       0    
```
Dann berechnen wir den unbekannten kritischen Wert as $C$

$C \approx 2.2141 + (2.2899-2.2141) \times (0.17804-0)/(1-0) \approx 2.2276$

(Der genaue Wert ist , das funktioniert also ziemlich gut.) $2.2274$

Weitere Details zur Interpolation und inversen Interpolation finden Sie in diesem verlinkten Beitrag.

Chi-Quadrat-Tische :

Wenn Ihr Chi-Quadrat-df wirklich groß ist, können Sie normale Tabellen verwenden, um eine Annäherung zu erhalten.

Für großes df die Chi-Quadrat-Verteilung mit dem Mittelwert und der Varianz ungefähr normal . Um den oberen 5% -Wert zu erhalten, nehmen Sie den kritischen 5% -Wert für eine Standardnormalen ( ) und multiplizieren Sie mit $\nu$ $\nu$ $2\nu$ $1.645$ und addiere. $\sqrt{2\nu}$ $\nu$

Stellen Sie sich zum Beispiel vor, wir bräuchten einen oberen kritischen Wert von 5% für einen . $\chi^2_{6744}$

Wir würden berechnen. Die genaue Antwort (aufsignifikante Zahlen) lautet. $1.645 \times \sqrt{2 \times 6744} + 6744 \approx 6935$ $5$ $6936.2$

Wenn die Freiheitsgrade sind kleiner, können wir die Tatsache nutzen , dass , wenn ist dann $X$ $\chi^2_\nu$ . $\sqrt{2X}\dot\sim N(\sqrt{2\nu-1},1)$

Wenn wir zum Beispiel df hätten, könnten wir diese Näherung verwenden. Der genaue obere kritische Wert von 5% für ein Chi-Quadrat mit 674 df beträgt (bis 5 Ziffern) . Mit dieser Näherung würden wir wie folgt berechnen: $674$ $735.51$

Nehmen Sie den oberen (einseitigen) kritischen Wert von 5% für eine Standardnormalen (1,645) und addieren Sie , quadriere die Summe und dividiere durch 2. In diesem Fall: $\sqrt{2\nu-1}$

. $(1.645+\sqrt{2\times 674-1})^2/2 \approx 735.2$

Wie wir sehen, ist dies ziemlich nah.

Für erheblich kleinere Freiheitsgrade könnte die Wilson-Hilferty-Transformation verwendet werden - sie funktioniert bis auf wenige Freiheitsgrade -, aber die Tabellen sollten dies abdecken. Diese Annäherung ist die . $(\frac{X}{\nu})^{\frac13}\dot\sim N(1-\frac{2}{9\nu},\frac{2}{9\nu})$

— Glen_b - Monica neu starten
quelle

+1 Die Idee

kann verbessert werden. Verwenden Sie die Tatsache, dass

auf eine rationale Funktion einer

-Verteilung beschränkt ist, wenn ihr zweiter Parameter groß wird. In würden Sie es zum Beispiel als berechnen . Sie erhalten

, genau auf drei signifikante Zahlen. Beachten Sie, dass der Parameter

eine kleine Ganzzahl ist, was darauf hinweist , dass er wahrscheinlich in der Tabelle enthalten und ohne Interpolation verfügbar ist.

χ^{2}

$\chi^2$

F

$F$

χ^{2}

$\chi^2$ Rdf2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))

2.2177

$2.2177$

χ^{2}

$\chi^2$

— whuber

\to \infty

$\to\infty$

... oder ist die Absicht, dass die Fehler der beiden Ansätze in entgegengesetzter Richtung sind (was vielleicht darauf hindeutet, die beiden zu kombinieren?).

— Glen_b -Rate State Monica

Ich erinnere mich, dass ich mich auf Punkt 4 bezog.

— whuber

Ah, das könnte sinnvoller sein. Tut mir leid, dicht zu sein. Ich werde es noch einmal versuchen.

— Glen_b -Rate State Monica