Ist eine Regression kausal, wenn keine Variablen ausgelassen werden?


13

Eine Regression von y auf x muss nicht kausal sein, wenn Variablen ausgelassen werden, die sowohl x als auch y . Aber wenn nicht für ausgelassene Variablen und Messfehler, ist eine Regression kausal? Das heißt, wenn jede mögliche Variable in der Regression enthalten ist?


4
Nein, selbst wenn Sie jede Variable in der Welt einbeziehen, könnte dies umgekehrt kausal sein. Zum Beispiel könnte die Nähe eines Planeten zu seinem nächsten Stern durch die Oberflächentemperatur des Planeten genau vorhergesagt werden, aber die Kausalität geht eindeutig in die andere Richtung
gazza89

@ gazza89 - da dies die Frage effektiv beantwortet, möchten Sie sie möglicherweise zu einer Antwort erweitern.
Jbowman

3
Was ist "ausgelassene Variablen"? Angenommen, ich habe ein Y und 4 Xs in meinem Datensatz. Ich passe ein Modell mit allen 4 Xs an. Dann habe ich keine Variablen ausgelassen?
user158565

Antworten:


20

Nein, das ist es nicht. Ich zeige Ihnen einige Gegenbeispiele.

Das erste ist die umgekehrte Kausalität . Angenommen, das Kausalmodell ist YX , wobei X und Y Standard-Gauß-Zufallsvariablen sind. Dann E[Y|do(x)]=0 , da X nicht Ursache tut Y , aber E[Y|x] wird von X abhängen .

Das zweite Beispiel ist die Steuerung für Collider (siehe hier ). Betrachten Sie das Kausalmodell XZY , dh X verursacht nicht Y und Z ist eine häufige Ursache. Beachten Sie jedoch , dass der Regressionskoeffizient von X nicht Null ist , wenn Sie eine Regression mit Z ausführen , da die Konditionierung auf die gemeinsame Ursache eine Assoziation zwischen Y und X hervorruft (möglicherweise möchten Sie hier auch die Pfadanalyse in Gegenwart von X anzeigen) ein Conditioned-Upon-Collider ).XYX

Allgemein gesagt , die Regression von Y auf X wird kausale wenn das in den Regressions enthaltenen Variablen die Hintertür Kriterium erfüllen .


3
Sehr zu empfehlen das Buch Warum von Judea Pearl. Erklärt gründlich, worauf sich Carlos bezieht.
Markos Kashiouris

3
Was bedeutet bedeuten? do(x)
Naught101

5
@ naught101 es bedeutet , dass Sie X eigentlich = Kraft x, passiv im Gegensatz beobachtenden X = x, siehe hier stats.stackexchange.com/questions/211008/dox-operator-meaning/...
Carlos Cinelli

Danke, aber mir ist die Schreibweise nicht klar. Does Mittelwert Z bewirkt , dass X und Y ? Sollten die Pfeile umgekehrt werden? XZYZXY
Esha

@Esha Es bedeutet, dass sowohl als auch y z verursachenxyz
Carlos Cinelli

6

Neben der wichtigen Antwort von Carlos Cinelli auf diese Frage gibt es noch einige weitere Gründe dafür, dass die Regressionskoeffizienten möglicherweise nicht kausal sind.

Erstens kann eine falsche Modellspezifikation dazu führen, dass die Parameter nicht kausal sind. Nur weil Sie alle relevanten Variablen in Ihrem Modell haben, heißt das nicht, dass Sie sie korrekt angepasst haben. Stellen Sie sich als sehr einfaches Beispiel eine Variable X , die symmetrisch um 0 verteilt ist. Angenommen, Ihre Ergebnisvariable Y wird von X so beeinflusst, dass E(YX)=X2 . Wenn Sie Y auf X drücken (im Gegensatz zu X2 ), erhalten Sie einen geschätzten Koeffizienten für Xvon etwa 0, eindeutig voreingenommen, obwohl Sie alle (einzigen) Variablen berücksichtigt haben, die Y betreffen .

Zweitens besteht in Bezug auf das Thema der umgekehrten Kausalität auch das Risiko, dass Sie einen Selektionsbias haben , dh dass Ihre Stichprobe so ausgewählt wurde, dass sie für die Population, auf die Sie schließen möchten, nicht repräsentativ ist. Darüber hinaus können fehlende Daten zu Verzerrungen führen, wenn die Daten nicht zufällig vollständig fehlen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.