Fünf-Punkte-Zusammenfassung
Ja, die Idee ist, eine kurze Zusammenfassung der Verteilung zu geben. Es sollte ungefähr symmetrisch zum Mittelwert sein, der Median sollte nahe 0 sein, die 1Q- und 3Q-Werte sollten idealerweise ungefähr ähnliche Werte sein.
Koeffizienten undβi^s
Jeder Koeffizient im Modell ist eine Gaußsche (normale) Zufallsvariable. Die ist die Schätzung des Mittelwerts der Verteilung dieser Zufallsvariablen, und der Standardfehler ist die Quadratwurzel der Varianz dieser Verteilung. Es ist ein Maß für die Unsicherheit bei der Schätzung des .βi^βi^
Sie können sehen, wie diese bei Wikipedia berechnet werden (auch die verwendeten mathematischen Formeln) . Beachten Sie, dass jedes Programm für Statistiken mit Selbstachtung nicht die mathematischen Standardgleichungen verwendet, um den zu berechnen, da dies auf einem Computer zu einem großen Genauigkeitsverlust bei den Berechnungen führen kann.βi^
t -Statistiken
Die Statistiken sind die Schätzungen ( ) geteilt durch ihre Standardfehler ( ), z. B. . Angenommen, Sie haben dasselbe Modell im Objekt wie Ihr Q:tβi^σi^ti=βi^σi^mod
> mod <- lm(Sepal.Width ~ Petal.Width, data = iris)
dann werden die Werte R-Berichte wie folgt berechnet:t
> tstats <- coef(mod) / sqrt(diag(vcov(mod)))
(Intercept) Petal.Width
53.277950 -4.786461
Wo coef(mod)
sind die und gibt die Quadratwurzeln der diagonalen Elemente der Kovarianzmatrix der Modellparameter an, die die Standardfehler der Parameter sind ( ).βi^sqrt(diag(vcov(mod)))
σi^
Der p-Wert ist die Wahrscheinlichkeit, einso groß wie oder größer als der absolute beobachtet t - Wert , wenn die Nullhypothese ( ) wahr ist , wobei ist . Sie werden wie folgt berechnet (Verwendung von oben):|t|H0H0βi=0tstats
> 2 * pt(abs(tstats), df = df.residual(mod), lower.tail = FALSE)
(Intercept) Petal.Width
1.835999e-98 4.073229e-06
Daher berechnen wir die Wahrscheinlichkeit des oberen Endes, die Werte zu erreichen, die wir aus einer Verteilung mit Freiheitsgraden erzielt haben, die den verbleibenden Freiheitsgraden des Modells entsprechen. Dies stellt die Wahrscheinlichkeit dar, einen Wert zu erreichen, der größer als die absoluten Werte der beobachteten s ist. Es wird mit 2 multipliziert, da natürlich auch in negativer Richtung groß sein kann.ttttt
Reststandardfehler
Der verbleibende Standardfehler ist eine Schätzung des Parameters . Die Annahme in gewöhnlichen kleinsten Quadraten ist, dass die Residuen einzeln durch eine Gaußsche (Normal-) Verteilung mit Mittelwert 0 und Standardabweichung . Das bezieht sich auf die Annahme der konstanten Varianz; Jedes Residuum hat die gleiche Varianz und diese Varianz ist gleich .σσσσ2
BereinigtesR2
Das angepasste wird wie folgt berechnet:R2
1−(1−R2)n−1n−p−1
Das angepasste ist dasselbe wie , wird jedoch an die Komplexität (dh die Anzahl der Parameter) des Modells angepasst. Wenn wir bei einem Modell mit einem einzelnen Parameter und einem bestimmten diesem Modell einen weiteren Parameter hinzufügen, muss sich der des neuen Modells erhöhen, auch wenn der hinzugefügte Parameter keine statistische Aussagekraft hat. Das angepasste berücksichtigt dies, indem die Anzahl der Parameter in das Modell aufgenommen wird.R2R2R2R2R2
F Statistik
Das ist das Verhältnis zweier Varianzen ( ), die Varianz, die durch die Parameter im Modell (Summe der Regressionsquadrate, SSR) und die verbleibende oder unerklärte Varianz (Summe der Fehlerquadrate, SSE) erklärt wird. Sie können dies besser sehen, wenn wir die ANOVA-Tabelle für das Modell erhalten über :FSSR/SSEanova()
> anova(mod)
Analysis of Variance Table
Response: Sepal.Width
Df Sum Sq Mean Sq F value Pr(>F)
Petal.Width 1 3.7945 3.7945 22.91 4.073e-06 ***
Residuals 148 24.5124 0.1656
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Die sind in der ANOVA-Ausgabe und der Ausgabe gleich. Die Spalte enthält die beiden Varianzen und . Wir können aus einer Verteilung mit 1 und 148 Freiheitsgraden die Wahrscheinlichkeit berechnen, ein , das unter der Nullhypothese ohne Wirkung so groß ist . Dies ist, was in der letzten Spalte der ANOVA-Tabelle berichtet wird. Im einfachen Fall eines einzelnen kontinuierlichen Prädiktors (wie in Ihrem Beispiel) ist , weshalb die p-Werte gleich sind. Diese Äquivalenz gilt nur in diesem einfachen Fall.Fsummary(mod)
Mean Sq
3.7945/0.1656=22.91FFF=t2Petal.Width