Moderierte Regression: Warum berechnen wir einen * Produktterm * zwischen den Prädiktoren?


12

Moderierte Regressionsanalysen werden in den Sozialwissenschaften häufig verwendet, um die Interaktion zwischen zwei oder mehr Prädiktoren / Kovariaten zu bewerten.

In der Regel wird bei zwei Prädiktorvariablen das folgende Modell angewendet:

Y=β0+β1X+β2M+β3XM+e

Beachten Sie, dass der Moderationstest durch den Produktbegriff XM (die Multiplikation zwischen der unabhängigen Variablen X und der Moderatorvariablen M ) operationalisiert wird . Meine grundlegende Frage lautet: Warum berechnen wir eigentlich einen Produktterm zwischen X und M ? Warum nicht zum Beispiel die absolute Differenz |MX|oder nur die Summe X+M ?

Interessanterweise spielt Kenny auf dieses Problem hier http://davidakenny.net/cm/moderation.htm an, indem er sagt: "Wie man sehen wird, wird der Moderationstest nicht immer durch den Produktbegriff XM operationalisiert", aber es wird keine weitere Erklärung gegeben . Eine formale Illustration oder ein Beweis wären aufschlussreich, denke ich.

Antworten:


12

Ein "Moderator" beeinflusst die Regressionskoeffizienten von gegen : Sie können sich ändern, wenn sich die Werte des Moderators ändern. Ganz allgemein ist das einfache Regressionsmodell der ModerationYX

E(Y)=α(M)+β(M)X

Dabei sind und eher Funktionen des Moderators als Konstanten, die von den Werten von .αM MβMM

In demselben Sinne, in dem die Regression auf einer linearen Annäherung der Beziehung zwischen und beruht , können wir hoffen, dass sowohl als auch - zumindest annähernd - lineare Funktionen von gesamten Wertebereich von in den Daten:XYαβMM

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

Wenn die nichtlinearen ("big-O") Terme fallengelassen werden, in der Hoffnung, dass sie zu klein sind, um eine Rolle zu spielen, ergibt sich das multiplikative (bilineare) Interaktionsmodell

(1)E(Y)=α0+β0X+α1M+β1MX.

Diese Herleitung legt eine interessante Interpretation der Koeffizienten nahe: ist die Rate, mit der den ändert , während die Rate ist, mit der die Steigung ändert . ( ; und ; sind die Steigung und der Achsenabschnitt, wenn (formal) auf Null gesetzt ist.) ist der Koeffizient des "Produktterms" . Es beantwortet die Frage auf diese Weise: M β 1 M α 0 β 0 M β 1 M Xα1Mβ1Mα0β0Mβ1MX

Wir modellieren die Moderation mit einem Produktterm wenn wir erwarten, dass der Moderator (ungefähr im Durchschnitt) eine lineare Beziehung zur Steigung von vs .M YMXMY X


Interessant ist, dass diese Herleitung den Weg zu einer natürlichen Erweiterung des Modells weist, was möglicherweise Wege zur Überprüfung der Anpassungsgüte aufzeigt. Wenn Sie sich nicht mit Nichtlinearität in befassen - Sie wissen oder gehen davon aus, dass Modell genau ist -, sollten Sie das Modell erweitern, um die abgelegten Begriffe zu berücksichtigen:( 1 )X(1)

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

Durch Testen der Hypothese die Anpassungsgüte bewertet. Die Schätzung von und könnte angeben, auf welche Weise das Modell möglicherweise erweitert werden muss: um die Nichtlinearität in (wenn ) oder eine kompliziertere moderierende Beziehung (wenn ) oder möglicherweise beide. (Beachten Sie, dass dieser Test nicht durch eine Potenzreihenerweiterung einer generischen Funktion .)α 2 β 2 ( 1 ) M α 20 β 20α2=β2=0α2β2(1)Mα20β20f(X,M)


Wenn Sie schließlich feststellen würden, dass der Interaktionskoeffizient nicht signifikant von Null , sondern dass die Anpassung nichtlinear ist (wie durch einen signifikanten Wert von ), würden Sie folgern, dass (a) eine Moderation vorliegt, aber ( b) Es wird nicht durch einen Term modelliert , sondern durch einige Terme höherer Ordnung, die mit . Dies könnte das Phänomen sein, auf das sich Kenny bezog.β1β2MXM2X


8

Wenn Sie die Summe der Prädiktoren verwenden, um ihre Interaktion zu modellieren, lautet Ihre Gleichung:

Y=β0+β1X+β2M+β3(X+M)+e=β0+β1X+β2M+β3X+β3M+e=β0+(β1+β3)X+(β2+β3)M+e=β0+β1X+β2M+e

Dabei ist und . Daher würde Ihr Modell überhaupt keine Interaktion haben. Offensichtlich ist dies bei Produkten nicht der Fall.β1=β1+β3β2=β2+β3

Erinnern Sie sich an die Definition des absoluten Wertes:

|XM|={XM,XMMX,X<M

Obwohl Sie das Modell reduzieren können zu dem mit nur und Termen unter Verwendung des def. vonDer absolute Wert ist eine "spezialisierte Form der Moderation, die in vielen Situationen wahrscheinlich nicht realistisch ist", wie im folgenden Kommentar ausgeführt.β0+β1X+β2M+β3|XM|+eXM|XM|


1
Eigentlich inklusive einesBegriff ist nachweislich eine Form der Moderation: Der Wert von ändert sich . Es ist jedoch eine begrenzte, spezialisierte Form der Moderation, die in vielen Situationen wahrscheinlich nicht realistisch ist. Es ist nicht richtig zu sagen, dass ein solches Modell "nur Hauptwirkungen" hat. |XM|Mβ2
whuber

1
Ja, du hast recht,Ist eine Form der Mäßigung, habe ich mich von der Verwandlung mitreißen lassen und werde die Antwort entsprechend bearbeiten. Vielen Dank für den Hinweis. |XM|
Milos

@Milos: Dein Beispiel über die Summe der Prädiktoren war ein Augenöffner, ein etwas peinlicher, ich muss sagen, weil ich die mathematischen Implikationen bereits hätte erkennen müssen;) whuber: Soweit ich das verstehe, ist der absolute Wert nur nützlich wenn beide Prädiktorvariablen in denselben Einheiten gemessen werden (z. B. zwei psychometrische Tests unter Verwendung derselben Metrik, wie z-Scores oder T-Scores). Der absolute Unterschied zwischen X und M ist eine nützliche Metrik, obwohl nicht die einzig mögliche (dh der Produktterm könnte auch verwendet werden).
Nenner

6

Sie werden keinen formalen Beweis für die Verwendung des multiplikativen Moderators finden. Sie können diesen Ansatz auf andere Weise unterstützen. Schauen Sie sich zum Beispiel die Taylor-MacLaurin-Erweiterung einer Funktion :f(X,M)

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

Wenn Sie eine Funktion dieser Form in die Taylor-Gleichung , erhalten Sie :f(X,M)=β0+βXX+βMM+βXMXM

f(X,M)=β0+βXX+βMM+βXMXM

Das Grundprinzip hier ist also, dass diese besondere multiplikative Form der Moderation im Grunde eine Taylor-Approximation zweiter Ordnung einer generischen Moderationsbeziehungf(X,M)

UPDATE: Wenn Sie quadratische Terme einschließen, wie @whuber vorgeschlagen hat, geschieht Folgendes: Schließen Sie dies an Taylor an:

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

Dies zeigt, dass unser neues Modell mit quadratischen Termen im Gegensatz zum ursprünglichen Moderationsmodell einer Taylor-Approximation zweiter Ordnung entspricht .g(X,M)f(X,M)


Da die Grundlage Ihrer Argumentation die Taylor-Erweiterung ist, warum haben Sie nicht auch die anderen beiden quadratischen Terme und ? Es stimmt, es handelt sich nicht um Moderationsformen, aber ihre Aufnahme in das Modell normalerweise auf . X2M2βXM
Whuber

@whuber, ich habe beschlossen, den Beitrag kurz zu halten - das ist der Hauptgrund. Ansonsten begann ich zu schreiben, ob ich es vorziehen würde, Termini zweiter Ordnung einzuschließen, wenn Sie einen Kreuzterm haben, und schnitt ihn dann aus.
Aksakal
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.