Eine Möglichkeit besteht darin, dass die Effekte in jeder Gruppe in unterschiedliche Richtungen gehen und beim Aggregieren aufgehoben werden . Dies hängt auch damit zusammen, wie die Haupteffekte irreführend sein können, wenn Sie einen wichtigen Interaktionsterm in einem Regressionsmodell weglassen.
Angenommen, in Gruppe ist die wahre Beziehung zwischen der Antwort und dem Prädiktor :Ayixi
E(yi|xi,Group A)=1+xi
und in Gruppe ,B
E(yi|xi,Group B)=1−xi
Angenommen, die Gruppenmitgliedschaft ist so verteilt, dass . Wenn Sie dann über die Gruppenmitgliedschaft marginalisieren und durch berechnen Gesetz der totalen Erwartung, das Sie erhalten
P(Group A)=1−P(Group B)=p
E(yi|xi)
E(yi|xi)=E(E(yi|xi,Group))=p(1+xi)+(1−p)(1−xi)=p+pxi+1−xi−p+pxi=1−xi(2p−1)
Wenn daher , ist und hängt überhaupt nicht von ab. Es gibt also eine Beziehung innerhalb beider Gruppen, aber wenn Sie sie aggregieren, gibt es keine Beziehung. Mit anderen Worten, für eine zufällig ausgewählte Person in der Bevölkerung, deren Gruppenmitgliedschaft wir nicht kennen, besteht im Durchschnitt keine Beziehung zwischen und . Aber innerhalb jeder Gruppe gibt es.p=1/2E(yi|xi)=1xixiyi
Jedes Beispiel, bei dem der Wert von die Effektgrößen innerhalb jeder Gruppe perfekt ausgleicht, würde ebenfalls zu diesem Ergebnis führen - dies war nur dieses Spielzeugbeispiel, um die Berechnungen zu vereinfachen :)p
Hinweis: Bei normalen Fehlern entspricht die Signifikanz eines linearen Regressionskoeffizienten der Signifikanz der Pearson-Korrelation. In diesem Beispiel wird daher eine Erklärung für das, was Sie sehen, hervorgehoben.