Multiple Regression oder partieller Korrelationskoeffizient? Und die Beziehungen zwischen den beiden

Ich weiß nicht einmal, ob diese Frage sinnvoll ist, aber was ist der Unterschied zwischen multipler Regression und partieller Korrelation (abgesehen von den offensichtlichen Unterschieden zwischen Korrelation und Regression, die ich nicht anstrebe)?

Ich möchte Folgendes herausfinden:
Ich habe zwei unabhängige Variablen ( $x_1$ , ) und eine abhängige Variable ( ). Jetzt werden die unabhängigen Variablen einzeln nicht mit der abhängigen Variablen korreliert. Aber für ein gegebenes nimmt ab, wenn abnimmt. Analysiere ich das also mittels multipler Regression oder partieller Korrelation ? $x_2$ $y$ $x_1$ $y$ $x_2$

bearbeiten, um hoffentlich meine Frage zu verbessern: Ich versuche den Unterschied zwischen multipler Regression und partieller Korrelation zu verstehen. Wenn also für ein gegebenes abnimmt, wenn abnimmt, ist dies auf die kombinierte Auswirkung von und auf (multiple Regression) oder auf die Beseitigung der Auswirkung von (partielle Korrelation)? $y$ $x_1$ $x_2$ $x_1$ $x_2$ $y$ $x_1$

multiple-regression regression-coefficients partial-correlation

— user34927
quelle

Welche inhaltliche Frage möchten Sie beantworten?

— gung - Wiedereinsetzung von Monica

Siehe auch sehr ähnliche Frage stats.stackexchange.com/q/50156/3277 .

— TTNPHNS

Multipler linearer Regressionskoeffizient und partielle Korrelation sind direkt miteinander verknüpft und haben die gleiche Signifikanz (p-Wert). Teil r ist neben dem Beta- Koeffizienten (standardisierter Regressionskoeffizient) nur eine andere Möglichkeit, den Koeffizienten zu standardisieren.. Wenn also die abhängige Variable und die unabhängigenVariablen und dann $^1$ $y$ $x_1$ $x_2$

Beta: β_{x_{1}} = \frac{r_{y x_{1}} - r_{y x_{2}} r_{x_{1} x_{2}}}{1 - r_{x_{1} x_{2}}^{2}}

$\text{Beta:} \quad \beta_{x_1} = \frac{r_{yx_1} - r_{yx_2}r_{x_1x_2} }{1-r_{x_1x_2}^2}$

Partial r: r_{y x_{1} . x_{2}} = \frac{r_{y x_{1}} - r_{y x_{2}} r_{x_{1} x_{2}}}{\sqrt{(1 - r_{y x_{2}}^{2}) (1 - r_{x_{1} x_{2}}^{2})}}

$\text{Partial r:} \quad r_{yx_1.x_2} = \frac{r_{yx_1} - r_{yx_2}r_{x_1x_2} }{\sqrt{ (1-r_{yx_2}^2)(1-r_{x_1x_2}^2) }}$

Sie sehen, dass die Zähler identisch sind, was darauf hinweist, dass beide Formeln den gleichen eindeutigen Effekt von messen . Ich werde versuchen zu erklären, wie die beiden Formeln strukturell identisch sind und wie sie nicht. $x_1$

Angenommen, Sie haben alle drei Variablen z-standardisiert (Mittelwert 0, Varianz 1). Der Zähler ist dann gleich der Kovarianz zwischen zwei Arten von Residuen : die (a) Residuen, die bei der Vorhersage von durch übrig sind [Standard für beide Variablen] und die (b) Residuen, die bei der Vorhersage von durch übrig sind [Standard für beide Variablen] . Darüber hinaus beträgt die Varianz der Residuen (a) ; Die Varianz der Residuen (b) beträgt . $y$ $x_2$ $x_1$ $x_2$ $1-r_{yx_2}^2$ $1-r_{x_1x_2}^2$

Die Formel für die partielle Korrelation ergibt sich dann eindeutig aus der Formel von Pearson , wie sie in diesem Fall zwischen den Residuen (a) und den Residuen (b) berechnet wird: Pearson ist bekanntlich die Kovarianz dividiert durch den Nenner, der das geometrische Mittel von ist zwei verschiedene Varianzen. $r$ $r$

Der standardisierte Koeffizient Beta ist strukturell wie Pearson , nur dass der Nenner das geometrische Mittel einer Varianz mit dem eigenen Selbst ist . Die Varianz der Residuen (a) wurde nicht gezählt; es wurde durch eine zweite Zählung der Varianz der Residuen (b) ersetzt. Beta ist also die Kovarianz der beiden Residuen relativ zur Varianz einer von ihnen $r$ (insbesondere derjenigen, die sich auf den interessierenden Prädiktor bezieht ). Während die partielle Korrelation, wie bereits bemerkt, dieselbe Kovarianz relativ zu ihrer hybriden Varianz ist. Beide Arten von Koeffizienten sind Möglichkeiten, den Effekt von im Milieu anderer Prädiktoren zu standardisieren . $x_1$ $x_1$

Einige numerische Konsequenzen des Unterschieds. Wenn das R-Quadrat der multiplen Regression von durch und zufällig 1 ist, sind beide Teilkorrelationen der Prädiktoren mit dem abhängigen ebenfalls 1 Absolutwert (aber die Betas sind im Allgemeinen nicht 1). In der Tat, wie zuvor gesagt, ist die Korrelation zwischen den Residuen von und den Residuen von . Wenn das, was nicht in ist, genau das ist , was nicht in $y$ $x_1$ $x_2$ $r_{yx_1.x_2}$ y <- x2x1 <- x2 $x_2$ $y$ $x_2$ $x_1$ dann gibt es nichts in , das weder noch wird hoch sein. $y$ $x_1$ : vollständige Passform. Was auch immer der Betrag des unerklärten (durch ) Teils ist, der in (dem )übrig ist, wenn er relativ stark durch den unabhängigen Teil von (durch das erfasst wird ) das $x_2$ $x_2$ $y$ $1-r_{yx_2}^2$ $x_1$ $1-r_{x_1x_2}^2$ $r_{yx_1.x_2}$ $\beta_{x_1}$ Andererseits wird es nur dann hoch sein, wenn der unerklärte Teil von , der erfasst wird, selbst ein wesentlicher Teil von . $y$ $y$

Aus den obigen Formeln erhält man (und erstreckt sich von einer 2-Prädiktor-Regression zu einer Regression mit einer beliebigen Anzahl von Prädiktoren )die Umwandlungsformel zwischen Beta- und entsprechenden Teil r: $x_1,x_2,x_3,...$

r_{y x_{1} . X} = β_{x_{1}} \sqrt{\frac{var (e_{x_{1} \leftarrow X})}{var (e_{y \leftarrow X})}},

$r_{yx_1.X} = \beta_{x_1} \sqrt{ \frac {\text{var} (e_{x_1 \leftarrow X})} {\text{var} (e_{y \leftarrow X})}},$

wobei für die Sammlung aller Prädiktoren mit Ausnahme des Stroms ( ) steht; sind die Residuen der Regression von um und $X$ $x_1$ $e_{y \leftarrow X}$ $y$ $X$ $e_{x_1 \leftarrow X}$ die Residuen aus Regressing sind durch , so dass sie die Variablen in diesen beiden Regressionen eingeben standardisiert . $x_1$ $X$

Anmerkung: Wenn wir Teilkorrelationen von berechnen müssen $y$ mit jedem Prädiktor wird diese Formel normalerweise nicht verwendet, sodass zwei zusätzliche Regressionen erforderlich sind. Vielmehr werden die Sweep-Operationen (häufig in schrittweisen und allen Untersatz-Regressionsalgorithmen verwendet) durchgeführt oder eine Anti-Bild-Korrelationsmatrix berechnet. $x$

$^1$ ist die Beziehung zwischen dem Ausgang $\beta_{x_1} = b_{x_1} \frac {\sigma_{x_1}}{\sigma_y}$ und den standardisierten Koeffizienten in Regression mit intercept. $b$ $\beta$

— ttnphns
quelle

Vielen Dank. Aber wie entscheide ich mich für einen, zB für den in meiner Frage beschriebenen Zweck?

— user34927

Sie können natürlich frei wählen: Die Zähler sind die gleichen, sodass sie die gleichen Informationen übermitteln . Was Ihre (nicht vollständig geklärte) Frage betrifft, scheint es sich um Themen zu handeln, bei denen "0 sein kann, wenn r nicht 0 ist". msgstr "kann Coef. ungleich 0 sein, wenn r 0 ist". Es gibt viele Fragen dazu auf der Website. Zum Beispiel könnten Sie stats.stackexchange.com/q/14234/3277 lesen ; stats.stackexchange.com/q/44279/3277 .

— TTNPHNS

Ich habe versucht, meine Frage zu klären ..

— user34927

Fixing X1 ("x1 given") = Entfernen (Steuern) der Wirkung von X1. Bei der multiplen Regression gibt es keinen "kombinierten Effekt" (es sei denn, Sie fügen die Interaktion X1 * X2 hinzu). Effekte bei der Mehrfachregression sind wettbewerbsfähig. Lineare Regressionseffekte sind tatsächlich Teilkorrelationen.

— TTNPHNS

Warten Sie ein bisschen, @ user34927.

to prove that the DV (Y) is significantly correlated with one of two IVs (X1) if the effect of the other IV (X2) is removed

Der Effekt von wo entfernt ? Wenn Sie X2 sowohl von Y als auch von X1 "entfernen", dann wird der korr. zwischen Y und X1 ist die partielle Korrelation. Wenn Sie nur X2 von X1 "entfernen", wird der korr. zwischen Y und X1 wird die Teilkorrelation (oder die semi-partielle Korrelation) genannt. Bist du wirklich fragen sie ?

— TTNPHNS

Bin nur zufällig auf diesen Schritt gestoßen. In der ursprünglichen Antwort ist in der Formel für der Faktor $\beta_{x_1}$ fehlt, dh $\sqrt{SSY/SSX_1}$

β_{x_{1}} = \frac{r_{y x_{1}} - r_{y x_{2}} r_{x_{1} x_{2}}}{1 - r_{x_{1} x_{2}}^{2}} \times \sqrt{\frac{S S Y}{S S X_{1}}},

$\beta_{x_1} = \frac{r_{yx_1} - r_{y x_2} ~r_{x_1 x_2}} {1-r^2_{x_1 x_2}} \times \sqrt{\frac{SSY}{SSX_1}},$

S S Y = \sum_{i} (y_{i} - \bar{y})^{2}

$SSY=\sum_i (y_i-\bar y)^2$

S S X_{1} = \sum_{i} (x_{1 i} - {\bar{x}}_{1})^{2}

$SSX_1 = \sum_i {(x_{1i} - \bar{x}_1)^2}$ .

— Brani
quelle

Sie geben die Formel von

b

$b$ . Meine Antwort war ungefähr

β

$\beta$ .

— TTNPHNS