Insbesondere beziehe ich mich auf den Pearson-Produkt-Moment-Korrelationskoeffizienten.
Insbesondere beziehe ich mich auf den Pearson-Produkt-Moment-Korrelationskoeffizienten.
Antworten:
Was ist der Unterschied zwischen der Korrelation zwischen und und einer linearen Regression, die aus vorhersagt ?
Zunächst einige Gemeinsamkeiten :
Zweitens einige Unterschiede :
lm
und cor.test
in R
, ergibt identische p-Werte.
Hier ist eine Antwort, die ich auf der graphpad.com-Website gepostet habe :
Korrelation und lineare Regression sind nicht dasselbe. Betrachten Sie diese Unterschiede:
Im Fall einer linearen Regression mit einem einzelnen Prädiktor hat die standardisierte Steigung den gleichen Wert wie der Korrelationskoeffizient. Der Vorteil der linearen Regression besteht darin, dass die Beziehung so beschrieben werden kann, dass Sie (basierend auf der Beziehung zwischen den beiden Variablen) die Punktzahl für die vorhergesagte Variable bei einem bestimmten Wert der Prädiktorvariablen vorhersagen können. Insbesondere gibt eine lineare Regression an, dass eine Korrelation nicht der Achsenabschnitt ist, der Wert für die vorhergesagte Variable, wenn der Prädiktor 0 ist.
Kurz gesagt - sie führen rechnerisch zu identischen Ergebnissen, aber es gibt weitere Elemente, die in der einfachen linearen Regression interpretiert werden können. Wenn Sie nur die Größe der Beziehung zwischen zwei Variablen charakterisieren möchten, verwenden Sie die Korrelation. Wenn Sie Ihre Ergebnisse anhand bestimmter Werte vorhersagen oder erklären möchten, möchten Sie wahrscheinlich eine Regression.
Die Korrelationsanalyse quantifiziert nur die Beziehung zwischen zwei Variablen, wobei ignoriert wird, welche abhängige Variable und welche unabhängig ist. Bevor Sie die Regression anwenden, müssen Sie die Auswirkung der Variablen kalibrieren, die Sie auf die andere Variable überprüfen möchten.
Alle bisher gegebenen Antworten liefern wichtige Erkenntnisse, aber es sollte nicht vergessen werden, dass Sie die Parameter der einen in die andere umwandeln können:
Regression:
Zusammenhang zwischen Regressionsparametern und Korrelation, Kovarianz, Varianz, Standardabweichung und Mittelwert: b= ≤ y -m ≤ x
Sie können also beide ineinander transformieren, indem Sie ihre Parameter skalieren und verschieben.
Ein Beispiel in R:
y <- c(4.17, 5.58, 5.18, 6.11, 4.50, 4.61, 5.17, 4.53, 5.33, 5.14)
x <- c(4.81, 4.17, 4.41, 3.59, 5.87, 3.83, 6.03, 4.89, 4.32, 4.69)
lm(y ~ x)
##
## Call:
## lm(formula = y ~ x)
##
## Coefficients:
## (Intercept) x
## 6.5992 -0.3362
(m <- cov(y, x) / var(x)) # slope of regression
## [1] -0.3362361
cor(y, x) * sd(y) / sd(x) # the same with correlation
## [1] -0.3362361
mean(y) - m*mean(x) # intercept
## [1] 6.599196
Aus der Korrelation können wir nur einen Index erhalten, der die lineare Beziehung zwischen zwei Variablen beschreibt. In der Regression können wir die Beziehung zwischen mehr als zwei Variablen vorhersagen und damit identifizieren, welche Variablen x die Ergebnisvariable y vorhersagen kann .
Zitat Altman DG, "Praktische Statistik für die medizinische Forschung" Chapman & Hall, 1991, Seite 321: "Korrelation reduziert einen Datensatz auf eine einzelne Zahl, die keinen direkten Bezug zu den tatsächlichen Daten hat. Regression ist eine viel nützlichere Methode, mit Ergebnisse, die eindeutig mit der erhaltenen Messung zusammenhängen. Die Stärke der Beziehung ist eindeutig und die Unsicherheit kann anhand von Konfidenzintervallen oder Vorhersageintervallen deutlich gesehen werden.
Die Regressionsanalyse ist eine Technik zur Untersuchung der Wirkungsursache einer Beziehung zwischen zwei Variablen. Die Korrelationsanalyse ist eine Technik, mit der die Beziehung zwischen zwei Variablen quantifiziert werden kann.
Die Korrelation ist ein Index (nur eine Zahl) für die Stärke einer Beziehung. Regression ist eine Analyse (Schätzung von Parametern eines Modells und statistischer Test ihrer Signifikanz) der Angemessenheit einer bestimmten funktionalen Beziehung. Die Größe der Korrelation hängt davon ab, wie genau die Vorhersagen der Regression sein werden.
Korrelation ist ein Begriff in einer Statistik, der bestimmt, ob es eine Beziehung zwischen zwei und dann den Grad der Beziehung gibt. Der Bereich reicht von -1 bis +1. Während Regression bedeutet, zurück zum Durchschnitt zu gehen. Aus der Regression prognostizieren wir den Wert, indem wir eine Variable abhängig und die andere unabhängig halten. Es sollte jedoch klargestellt werden, welchen Wert die Variable haben soll, die wir vorhersagen möchten.