Bedeutet statistische Unabhängigkeit einen Mangel an Kausalität?


40

Zwei Zufallsvariablen A und B sind statistisch unabhängig. Das bedeutet im DAG des Prozesses: und natürlich . Aber heißt das auch, dass es von B nach A keine Haustür gibt?(AB)P(A|B)=P(A)

Denn dann sollten wir . Wenn dies der Fall ist, bedeutet statistische Unabhängigkeit dann automatisch einen Mangel an Kausalität?P(A|do(B))=P(A)

Antworten:


37

Wenn dies der Fall ist, bedeutet statistische Unabhängigkeit dann automatisch einen Mangel an Kausalität?

Nein, und hier ist ein einfaches Gegenbeispiel mit einer multivariaten Normalen:

set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)

Mit entsprechendem Diagramm

Bildbeschreibung hier eingeben

Hier haben wir, dass und geringfügig unabhängig sind (im multivariaten Normalfall impliziert die Nullkorrelation Unabhängigkeit). Dies geschieht, weil der Backdoor-Pfad über den direkten Pfad von nach genau aufhebt , d. . Somit ist . Doch verursacht direkt , und wir haben , dass , die aus unterschiedlichen ist .xyzxycov(x,y)=bac=0.10.1=0E[Y|X=x]=E[Y]=0xyE[Y|do(X=x)]=bxE[Y]=0

Assoziationen, Interventionen und Kontrafakten

Ich halte es für wichtig, hier einige Klarstellungen zu Assoziationen, Interventionen und Kontrafakten vorzunehmen.

Kausalmodelle beinhalten Aussagen über das Verhalten des Systems: (i) unter passiven Beobachtungen, (ii) unter Interventionen sowie (iii) Kontrafakten. Und Unabhängigkeit auf einer Ebene bedeutet nicht unbedingt, dass sie auf die andere übertragen wird.

Wie das obige Beispiel zeigt, können wir keine Assoziation zwischen und , dh , und es kann immer noch der Fall eintreten, dass Manipulationen an die Verteilung von , dh ändern .XYP(Y|X)=P(Y)XYP(Y|do(x))P(Y)

Jetzt können wir noch einen Schritt weiter gehen. Wir können Kausalmodelle haben, bei denen das Eingreifen in die Populationsverteilung von nicht verändert , aber dies bedeutet nicht, dass keine kontrafaktische Kausalität vorliegt! Das heißt, obwohl , wäre das Ergebnis von für jedes Individuum anders gewesen, wenn Sie sein geändert hätten . Dies ist genau der Fall, der von user20160 sowie in meiner vorherigen Antwort hier beschrieben wurde.XYP(Y|do(x))=P(Y)YX

Diese drei Ebenen bilden eine Hierarchie von kausalen Inferenzaufgaben in Bezug auf die Informationen, die für die Beantwortung der jeweiligen Fragen benötigt werden.


1
Danke, genau das habe ich gesucht. Ich schätze, meine Verwirrung ist darauf zurückzuführen, dass statistische Unabhängigkeit auch eine D-Trennung zwischen den beiden Variablen bedeutet. Aber es funktioniert nur umgekehrt, richtig?
user1834069

@ user1834069 das ist richtig, d-Separation impliziert Unabhängigkeit, aber Unabhängigkeit impliziert keine d-Separation. Diese beiden sind Beispiele , bei denen die Verteilung untreu dem Graphen, und man kann sehen , es auf die Wahl der Parametrisierung abhängt. Wenn wir die Parameter ändern, zeigt sich die Abhängigkeit wieder.
Carlos Cinelli

Nettes Beispiel. Wenn ich mich richtig erinnere, ist dies eine der nicht überprüfbaren Annahmen für das Mining von kausalen Daten aus Beobachtungsdaten. Für lineare Modelle in SEM wird in Pearl's Buch auch erwähnt, dass der Koeffizientensatz, der zu einer untreuen Verteilung führt, den Wert 0 hat.
Vimal,

37

Angenommen, wir haben eine Glühbirne, die von zwei Schaltern gesteuert wird. Lassen und bezeichnen den Zustand der Schalter, die entweder 0 oder 1 sein kann Let den Zustand des lighbulb bezeichnen, die entweder sein können 0 (aus) oder 1 (ein). Wir haben die Schaltung so eingerichtet, dass die Glühbirne eingeschaltet ist, wenn sich die beiden Schalter in unterschiedlichen Zuständen befinden, und ausgeschaltet, wenn sie sich in demselben Zustand befinden. Die Schaltung implementiert also die Exklusiv- oder Funktion: .S1S2LL=XOR(S1,S2)

Konstruktionsbedingt ist kausal mit und . Bei jeder Konfiguration des Systems ändert sich der Zustand der Glühbirne, wenn Sie einen Schalter umlegen.LS1S2

Angenommen, beide Schalter werden nach einem Bernoulli-Verfahren unabhängig voneinander betätigt, wobei die Wahrscheinlichkeit, im Zustand 1 zu sein, 0,5 beträgt. Also ist und und sind unabhängig. In diesem Fall wissen wir aus dem Entwurf der Schaltung, dass und außerdem . Das heißt, wenn wir den Status eines Schalters kennen, wissen wir nicht, ob die Glühbirne ein- oder ausgeschaltet ist. Also sind und unabhängig, ebenso wie und .p(S1=1)=p(S2=1)=0.5S1S2P(L=1)=0.5p(LS1)=p(LS2)=p(L)LS1LS2

Aber wie oben ist kausal mit und . Statistische Unabhängigkeit bedeutet also nicht, dass es an Kausalität mangelt.LS1S2


2
Benutzer, Sie haben Recht, dass dieses Beispiel eine Ursache mit mangelnder Abhängigkeit hat, wie ich hier erkläre. stackexchange.com/questions/26300/… , aber in diesem Beispiel haben wir auch , so dass es die Frage des OP nicht direkt beantwortet. P(L|do(S1))=P(L)
Carlos Cinelli

Benutzer, Frage bitte: Was ist mit ? Dh ist es auch gleich ? Ich persönlich denke für jedes , , aber . Habe ich recht? (Ich sehe, es ist nicht wirklich verwandt, aber ich möchte mein Verständnis überprüfen)p(L|S1,S2)p(L)(vL,v1,v2){0,1}3p(L=vL|S1=v1)=p(L=vL|S2=v2)=0.5 p(L=vL|S1=v1,S2=v2){0,1}
Höhlenmensch

0

Anhand Ihrer Frage können Sie wie folgt denken:

P(AB)=P(A)P(B) wenn und unabhängig sind. Sie können ähnlich implizierenAB

P(AB)/P(A)=P(B|A)=P(B) . Ebenfalls,

P(AB)/P(B)=P(A|B)=P(A) .

In dieser Hinsicht glaube ich, dass Unabhängigkeit einen Mangel an Kausalität bedeutet. Abhängigkeit bedeutet jedoch nicht notwendigerweise Kausalität.


2
Ich frage, ob bedeutet, dass ? (unter Verwendung der Pearl Do- P ( A | d o ( B ) ) = P ( A )P(AB)=P(A)P(B)P(A|do(B))=P(A)
Kalkülnotation
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.