Bestimmungskoeffizient bei multipler linearer Regression: Bei multipler linearer Regression kann der Bestimmungskoeffizient in Form der paarweisen Korrelationen für die Variablen unter Verwendung der quadratischen Form geschrieben werden:
R2=rTy,xr−1x,xry,x,
wobei der Korrelationsvektor zwischen dem Antwortvektor und jedem der erklärenden Vektoren ist und ist die Matrix der Korrelationen zwischen den erklärenden Vektoren (mehr dazu in dieser verwandten Frage ). Im Falle einer bivariaten Regression haben Sie:ry,xrx,x
R2=[rY,X1rY,X2]T[1rX1,X2rX1,X21]−1[rY,X1rY,X2]=11−r2X1,X2[rY,X1rY,X2]T[1−rX1,X2−rX1,X21][rY,X1rY,X2]=11−r2X1,X2(r2Y,X1+r2Y,X2−2rX1,X2rY,X1rY,X2).
Sie haben die Richtungen der univariaten Korrelationen in Ihrer Frage nicht angegeben, daher bezeichnen wir ohne Verlust der Allgemeinheit . Einsetzen Ihrer Werte und ergibt:D≡sgn(rY,X1)⋅sgn(rY,X2)∈{−1,+1}r2Y,X1=0.3r2Y,X2=0.4
R2=0.7−20.12−−−−√⋅D⋅rX1,X21−r2X1,X2.
Es ist möglich, dass , da es möglich ist, dass die kombinierten Informationen aus den beiden Variablen größer sind als die Summe ihrer Teile. Dieses interessante Phänomen wird als "Verbesserung" bezeichnet (siehe z. B. Lewis und Escobar 1986 ).R2>0.7