Bei der linearen Regression erhalten wir oft ein Vielfaches von R und R im Quadrat. Was sind die Unterschiede zwischen ihnen?
Bei der linearen Regression erhalten wir oft ein Vielfaches von R und R im Quadrat. Was sind die Unterschiede zwischen ihnen?
Antworten:
Tatsächlich kann Mehrfaches R als Korrelation zwischen Antwort und angepassten Werten angesehen werden. Als solches ist es immer positiv. Mehrfaches R-Quadrat ist die quadratische Version.
Lassen Sie mich anhand eines kleinen Beispiels veranschaulichen:
set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)
fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared: 0.2347
(R <- cor(y, fitted(fit))) # 0.4845068
R^2 # 0.2347469
Es ist nicht nötig, viel Aufhebens um "mehrere" zu machen oder nicht. Diese Formel gilt immer, auch in einer Anova-Einstellung. In dem Fall, in dem es nur eine Kovariable gibt, dann ist R mit dem Vorzeichen der Steigung gleich der Korrelation zwischen und die Antwort.
Ich erkläre meinen Schülern einfach:
Das Vielfache R ist als absoluter Wert des Korrelationskoeffizienten (oder des Korrelationskoeffizienten ohne negatives Vorzeichen) zu betrachten!
Das R-Quadrat ist einfach das Quadrat des Vielfachen R. Es kann als Prozentsatz der durch die unabhängige (n) Variable (n) verursachten Variation durchlaufen werden.
Es ist leicht, das Konzept und den Unterschied auf diese Weise zu erfassen.