Können standardisierte

Ich versuche, die Ergebnisse eines Artikels zu interpretieren, in dem mehrere Regressionen angewendet wurden, um verschiedene Ergebnisse vorherzusagen. Die -Werte (standardisierte B-Koeffizienten, definiert als $\beta$ wobeidie abhängige Variable undein Prädiktor ist) berichtet, scheint nicht mit dem gemeldeten: $\beta_{x_1} = B_{x_1} \cdot \frac{\mathrm{SD}_{x_1}}{\mathrm{SD}_y}$ $y$ $x_1$ $R^2$

Trotz s von -0.83, -0.29, -0.16, -0.43, 0.25, -0.29 , und die ausgewiesenen ist nur 0,20. $\beta$ $R^2$

Auch die drei Prädiktoren: Gewicht, BMI und Fettanteil sind multikollinear und korrelieren innerhalb der Geschlechter um r = 0,8-0,9 miteinander.

Ist der -Wert mit diesen plausibel oder gibt es keine direkte Beziehung zwischen den und den ? $R^2$ $\beta$ $\beta$ $R^2$

Könnten Probleme mit den multikollinearen Prädiktoren zusätzlich das eines vierten Prädiktors (VO2max) beeinflussen, der mit den oben genannten drei Variablen um r = 0,4 korreliert? $\beta$

— Sakari Jukarainen
quelle

Was ist

in diesem Zusammenhang? Ein Beta-Koeffizient (standardisierte Regression)? Oder etwas anderes? Wenn ja, dann können Sie nicht wirklich sagen, dass alles, was Sie bekommen, eine Interpretation in Bezug auf Standardabweichungen ist. Die Tatsache, dass der Koeffizient große Effekte impliziert, impliziert keinen hohen

-Wert

β

$\beta$

R^{2}

$R^2$

— Repmat

ß steht für standardisierte b-Koeffizienten. Für einen 1-Prädiktor-Fall ist ß gleich Pearsons r, das in direktem Zusammenhang mit dem R-Quadrat steht. Warum implizieren hohe ß in diesem multivariaten Fall jedoch kein hohes R-Quadrat?

— Sakari Jukarainen

Nein, in einem Regressorfall ist

nicht gleich der Pearson-Korrelation:

β

$\beta$

. Die Beziehung zwischen

s und

ist nicht so einfach.

β = \frac{Cov (y, x)}{Var (x)} \neq \frac{Cov (y, x)}{\sqrt{Var (y) \times Var (x)}} = ρ (y, x)

$\beta=\frac{\text{Cov}(y,x)}{\text{Var}(x)}\neq\frac{\text{Cov}(y,x)}{ \sqrt{ \text{Var}(y)\times\text{Var}(x) } }=\rho(y,x)$

β

$\beta$

R^{2}

$R^2$

— Richard Hardy

@RichardHardy Ich vermute, dass die Verwirrung darin besteht, dass Sakari

als standardisierten Regressionskoeffizienten definiert hat . In einer bivariaten linearen Regression ist der Regressionskoeffizient (

in Sakaris Notation)

β

$\beta$

b

$b$

, wobei

die Korrelation und

die Standardabweichung ist. Um einen Regressionskoeffizienten zu standardisieren, teilen wir den Koeffizienten mit der Standardabweichung von

und multiplizieren mit dieser Standardabweichung von

, sodass nur die Korrelation übrig bleibt. Sakari hat also recht.

r_{x y} \frac{s_{y}}{s_{x}}

$r_{xy}\frac{s_y}{s_x}$

r

$r$

s

$s$

y

$y$

x

$x$

— Maarten Buis

Ich verstehe immer noch nicht, warum Sie das für falsch halten? Wenn das Papier einige zusammenfassende Statistiken enthält, können Sie einfach überprüfen, ob sich die Zahlen summieren. Sie haben sogar die Formel dafür angegeben. Sie können nicht einfach deshalb schließen, weil die Effekte in abosulten Begriffen groß sind, dass die Modelle die Varianz in y gut erklären.

— Repmat

Die geometrische Interpretation der gewöhnlichen Regression der kleinsten Quadrate liefert den erforderlichen Einblick.

Das meiste, was wir wissen müssen, kann im Fall von zwei Regressoren und mit der Antwort . Die standardisierten Koeffizienten oder "Betas" entstehen, wenn alle drei Vektoren auf eine gemeinsame Länge standardisiert sind (die wir als Einheit betrachten können). Somit sind und Einheitsvektoren in einer Ebene - sie befinden sich auf dem Einheitskreis - und ist ein Einheitsvektor in einem dreidimensionalen euklidischen Raum , der diese Ebene enthält. Der Einbau Wert ist die orthogonal (senkrecht) Projektion $x_1$ $x_2$ $y$ $x_1$ $x_2$ $E^2$ $y$ $E^3$ $\hat y$ auf . Da einfach die quadratische Länge ist , brauchen wir nicht einmal alle drei Dimensionenvisualisieren: alle Informationenwir benötigenkönnen in dieser Ebene gezogen werden. $y$ $E^2$ $R^2$ $\hat y$

Orthogonale Regressoren

Die schönste Situation ist, wenn die Regressoren wie in der ersten Abbildung orthogonal sind.

$Abbildung 1 zeigt die Regressoren und $ \ hat y $ als Vektoren in einer Ebene.$

In dieser und den restlichen Abbildungen werde ich die Einheitsscheibe durchgehend in Weiß und die Regressoren als schwarze Pfeile zeichnen. zeigt immer direkt nach rechts. Die dicken Pfeile zeigen die roten Komponenten von in der und Richtungen: das heißt, und . Die Länge von ist der Radius des grauen Kreises , auf dem es liegt - aber denken Sie daran , dass die ist $x_1$ $\hat y$ $x_1$ $x_2$ $\beta_1 x_1$ $\beta_2 x_2$ $\hat y$ $R^2$ quadratisch dieser Länge.

Der Satz von Pythagoras behauptet

{R.}^{2} = | \hat{y} |^{2} = | β_{1} x_{1} |^{2} + | β_{2} x_{2} |^{2} = β_{1}^{2} (1) + β_{2}^{2} (1) = β_{1}^{2} + β_{2}^{2} .

$R^2 = |\hat y|^2 = |\beta_1 x_1|^2 + |\beta_2 x_2|^2 = \beta_1^2(1)+\beta_2^2(1) = \beta_1^2 + \beta_2^2.$

Da der Satz von Pythagoras in einer beliebigen Anzahl von Dimensionen gilt, verallgemeinert sich diese Argumentation auf eine beliebige Anzahl von Regressoren und liefert unser erstes Ergebnis:

Wenn die Regressoren orthogonal sind, entspricht der Summe der Quadrate der Betas. $R^2$

Eine unmittelbare Folge ist, dass wenn es nur einen Regressor gibt - univariate Regression - das Quadrat der standardisierten Steigung ist. $R^2$

Korreliert

Negativ korrelierte Regressoren treffen sich in Winkeln, die größer als ein rechter Winkel sind.

In diesem Bild ist visuell ersichtlich, dass die Summe der Quadrate der Betas streng größer als . Dies kann algebraisch unter Verwendung des Kosinusgesetzes oder durch Arbeiten mit einer Matrixlösung der Normalgleichungen bewiesen werden. $R^2$

Indem fast parallel die beiden Regressoren, können wir die Position in der Nähe des Ursprungs (für ein in der Nähe von ) , während er große Komponenten im haben weiterhin und Richtung. Somit gibt es keine Begrenzung, wie klein könnte. $\hat y$ $R^2$ $0$ $x_1$ $x_2$ $R^2$

Erinnern wir uns an dieses offensichtliche Ergebnis, unsere zweite Allgemeinheit:

Wenn Regressoren korreliert sind, kann beliebig kleiner sein als die Summe der Quadrate der Betas. $R^2$

Dies ist jedoch keine universelle Beziehung, wie die nächste Abbildung zeigt.

Jetzt überschreitet die Summe der Quadrate der Betas strikt. Indem die beiden Regressoren eng zusammen und halten zwischen ihnen, können wir die Betas machen beide Ansatz , auch wenn nahe an ist . Weitere Analysen erfordern möglicherweise etwas Algebra: Ich nehme das unten auf. $R^2$ $\hat y$ $1/2$ $R^2$ $1$

Ich überlasse es Ihrer Vorstellungskraft, ähnliche Beispiele mit positiv korrelierten Regressoren zu konstruieren, die sich dabei in spitzen Winkeln treffen.

Beachten Sie, dass diese Schlussfolgerungen unvollständig sind: Es gibt Grenzen, wie viel weniger mit der Summe der Quadrate der Betas verglichen werden kann. Insbesondere können Sie durch sorgfältige Prüfung der Möglichkeiten (für eine Regression mit zwei Regressoren) den Schluss ziehen, dass $R^2$

Wenn die Regressoren positiv korreliert sind und die Betas ein gemeinsames Vorzeichen haben oder wenn die Regressoren negativ korreliert sind und die Betas unterschiedliche Vorzeichen haben, muss mindestens so groß sein wie die Summe der Quadrate der Betas. $R^2$

Algebraische Ergebnisse

Im Allgemeinen seien die Regressoren (Spaltenvektoren) und die Antwort . Standardisierungsmittel (a) jedes ist orthogonal zum Vektor und (b) sie haben Einheitslängen: $x_1, x_2, \ldots, x_p$ $y$ $(1,1,\ldots,1)^\prime$

| x_{ich} |^{2} = | y |^{2} = 1.

$|x_i|^2 = |y|^2 = 1.$

Setze die Spaltenvektoren zu einer Matrix . Die Regeln der Matrixmultiplikation implizieren dies $x_i$ $n\times p$ $X$

Σ = {X.}^{'} X.

$\Sigma = X^\prime X$

ist die Korrelationsmatrix von . Die Betas sind durch die Normalgleichungen gegeben, $x_i$

β = ({X.}^{'} X.)^{- - 1} {X.}^{'} y = Σ^{- - 1} ({X.}^{'} y) .

$\beta = (X^\prime X)^{-1} X^\prime y = \Sigma^{-1} (X^\prime y).$

Darüber hinaus ist per Definition die Passform

\hat{y} = X. β = X. (Σ^{- - 1} {X.}^{'} y) .

$\hat y = X \beta = X (\Sigma ^{-1} X^\prime y).$

Seine quadratische Länge ergibt per Definition : $R^2$

{R.}^{2} = | \hat{y} |^{2} = {\hat{y}}^{'} \hat{y} = (X. β)^{'} (X. β) = β^{'} ({X.}^{'} X.) β = β^{'} Σ β .

$R^2 = |\hat y|^2 = \hat y^\prime \hat y = (X\beta)^\prime (X\beta) = \beta^\prime (X^\prime X)\beta = \beta^\prime \Sigma\beta.$

Die geometrische Analyse ergab, dass wir nach Ungleichungen suchen, die betreffen. $R^2$

\sum_{ich = 1}^{p} β_{ich}^{2} = β^{'} β .

$\sum_{i=1}^p \beta_i^2 = \beta^\prime \beta.$

$L_2$ $A$ $p^2$

| EIN |_{2}^{2} = \sum_{ich, j} {ein}_{ich j}^{2} = tr ({EIN}^{'} EIN) = tr (EIN {EIN}^{'}) .

$|A|_2^2 = \sum_{i,j} a_{ij}^2 = \operatorname{tr}(A^\prime A) = \operatorname{tr}(AA^\prime).$

Die Cauchy-Schwarz-Ungleichung impliziert

{R.}^{2} = tr ({R.}^{2}) = tr (β^{'} Σ β) = tr (Σ β β^{'}) \leq | Σ |_{2} | β β^{'} |_{2} = | Σ |_{2} β^{'} β .

$R^2 = \operatorname{tr}(R^2) = \operatorname{tr}(\beta^\prime \Sigma \beta) = \operatorname{tr}(\Sigma \beta \beta^\prime) \le |\Sigma|_2 | \beta\beta^\prime|_2 = |\Sigma|_2 \beta^\prime \beta.$

$1$ $p^2$ $p\times p$ $\Sigma$ $|\Sigma|_2$ $\sqrt{1\times p^2} = p$

{R.}^{2} \leq p β^{'} β .

$R^2 \le p\, \beta^\prime \beta.$

$x_i$

$R^2$ $R^2/p$

Schlussfolgerungen

$R^2$ $\hat y$ $R^2$

$1.1301$ $R^2$ $1$

$-0.83$ $0.69$ $R^2$ $0.20$ $\text{VO}_{2\,\text{max}}$

$R^2$ $x_1$ $x_2$ $\hat y$ $x_1$ $x_2$ $y$ um unbekannte Beträge (abhängig davon, wie alle drei mit den Kovariaten zusammenhängen), so dass wir fast nichts über die tatsächlichen Größen der Vektoren wissen, mit denen wir arbeiten.

— whuber
quelle

\hat{y}

$\hat y$

\hat{y}

$\hat y$

@amoeba Du hast ganz recht. Ich war zu voreilig bei der Erstellung dieser Bilder! Ich werde diesen Beitrag (hoffentlich vorübergehend) löschen, bis ich die Gelegenheit bekomme, das Problem zu beheben. Vielen Dank für den Hinweis.

— whuber

@Amoeba Ich habe die Bilder korrigiert und die Analyse entsprechend geändert. Obwohl sich die Details erheblich geändert haben, bleiben die Schlussfolgerungen dieselben.

— whuber

@amoeba Wieder bist du richtig. Mit dem Risiko, interessierte Leser zu verlieren, aber jetzt gezwungen zu sein, die geometrische Intuition zu quantifizieren, habe ich diese Schlussfolgerung verschärft und mit ein wenig Algebra begründet. (Ich vertraue darauf, dass die Algebra korrekt ist!)

— whuber

Vielen Dank! Als Nebenbemerkung korreliert VO2max negativ mit Gewicht und BMI, da sie mit einer höheren Muskelmasse verbunden sind. In der genannten Tabelle entspricht VO2max tatsächlich VO2max geteilt durch das Gewicht (was eine schlechte Methode ist, um VO2max auf die Körpergröße zu skalieren). Das VO2max / Gewicht in der Tabelle ist mit allen anderen Prädiktoren außer dem Geschlecht negativ korreliert, was, wie Sie erwähnt haben, das hohe ß, aber das niedrige R-Quadrat erklären könnte.

— Sakari Jukarainen