Was ist eine partielle F-Statistik?

Was ist eine partielle F-Statistik? Ist das dasselbe wie ein partieller F-Test? Wann würden Sie eine partielle F-Statistik berechnen? Ich gehe davon aus, dass dies etwas mit dem Vergleich von Regressionsmodellen zu tun hat, aber ich verfolge etwas nicht (?)

regression multiple-regression

— Vance L Albaugh
quelle

Eine Statistik ist nicht dasselbe wie ein Test, nein. Eine Z-Statistik ist kein Z-Test, eine T-Statistik ist kein T-Test, eine Chi-Quadrat-Statistik ist kein Chi-Quadrat-Test ... und daher ist eine partielle F- Statistik auch kein partieller Test F- Test . Bei einem Teil-F-Test wird jedoch eine Teil-F-Statistik verwendet (dies ist die Teststatistik im Test). Es ist teilweise, weil es nicht testet, ob das gesamte lineare Modell null ist, sondern nur einige Komponenten davon.

— Glen_b

Der partielle F-Test ist die gebräuchlichste Testmethode für ein verschachteltes normales lineares Regressionsmodell. "Verschachteltes" Modell ist nur eine ausgefallene Art, ein reduziertes Modell in Bezug auf die enthaltenen Variablen auszudrücken.

Nehmen wir zur Veranschaulichung an, Sie möchten die Hypothese testen, dass $p$ Koeffizienten Null sind, und daher können diese Variablen im Modell weggelassen werden, und Sie haben auch $k$ Koeffizienten im vollständigen Modell (einschließlich des Achsenabschnittes). Der Test basiert auf dem Vergleich der verbleibenden Quadratsumme (RSS). Daher müssen Sie zwei separate Regressionen ausführen und die RSS von jeder einzelnen speichern. Für das vollständige Modell wird der RSS-Wert niedriger sein, da das Hinzufügen neuer Variablen ausnahmslos zu einer Verringerung des RSS-Werts führt (und zu einer Erhöhung der erklärten Quadratsumme, was eng mit $R^2$ ). Wir testen daher, ob der Unterschied so groß ist, dass das Entfernen der Variablen das Modell beeinträchtigt. Lassen Sie uns etwas genauer sein. Der Test hat die folgende Form

F = \frac{\frac{R S S_{R e d u c e d} - R S S_{F u l l}}{p}}{\frac{R S S_{F u l l}}{n - k}}

$F=\frac{\frac{RSS_{Reduced}-RSS_{Full}}{p}}{\frac{RSS_{Full}}{n-k}}$

Es kann gezeigt werden, dass die Variablen im Zähler und im Nenner, wenn sie mit skaliert werden, unabhängige Variablen mit Freiheitsgraden bzw. sind, daher ist das Verhältnis ein F- verteilte Zufallsvariable mit den Parametern und . Sie lehnen die Nullhypothese ab, dass das reduzierte Modell geeignet ist, wenn die Statistik einen kritischen Wert der genannten Verteilung überschreitet, was wiederum der Fall ist, wenn Ihr Modell nach dem Entfernen der Variablen zu viel Erklärungskraft verliert. $\frac{1}{\sigma^2}$ $\chi^2$ $p$ $n-k$ $p$ $n-k$

Die Statistik kann tatsächlich aus der Sicht des Wahrscheinlichkeitsverhältnisses abgeleitet werden und weist daher einige gute Eigenschaften auf, wenn die Standardannahmen des linearen Modells erfüllt sind, beispielsweise konstante Varianz, Normalität und so weiter. Es ist auch leistungsfähiger als eine Reihe von Einzeltests, ganz zu schweigen davon, dass es das gewünschte Signifikanzniveau hat.

— JohnK
quelle