Ein probabilistisches Structural verursachendes Modell (SCM) als Tupel definiert , wobei U eine Gruppe von exogenen Variablen ist, V eine Gruppe von endogenen Variablen, F eine Reihe von Strukturgleichungen die bestimmt , die Werte der einzelnen endogenen variable und P ( U ) eine Wahrscheinlichkeitsverteilung über den Bereich der U .M=⟨U,V,F,P(U)⟩UVFP(U)U
In einem SCM stellen wir die Wirkung einer Intervention auf eine Variable durch ein Submodell M x = ⟨ U , V , F x , P ( U ) ⟩ wobei F x zeigt an, dass die strukturelle Gleichung für X durch die neue interventionelle Gleichung ersetzt wird . Zum Beispiel kann die Atom Intervention der variable Einstellung X auf einen bestimmten Wert x bezeichnet --- normalerweise durch d o ( X = x ) --- besteht aus der Gleichung für den Ersatz XXMx=⟨U,V,Fx,P(U)⟩FxXXxdo(X=x)X mit der Gleichung .X=x
Stellen Sie sich zur Verdeutlichung ein nichtparametrisches strukturelles Kausalmodell das durch die folgenden Strukturgleichungen definiert wird:M
Z=UzX=f(Z,Ux)Y=g(X,Z,Uy)
Wobei die Störungen eine Wahrscheinlichkeitsverteilung P ( U ) haben . Dies induziert eine Wahrscheinlichkeitsverteilung über die endogenen Variablen P M ( Y , Z , X ) und insbesondere eine bedingte Verteilung von Y bei X , P M ( Y |UP(U)PM(Y,Z,X)YX .PM(Y|X)
Beachten Sie jedoch , dass die "beobachtende" Verteilung von Y bei gegebenem X im Kontext von Modell M ist . Was würde sich auf die Verteilung von Y auswirken, wenn wir auf X eingreifen und es auf x setzen würden ? Dies ist nichts weiter als die Wahrscheinlichkeitsverteilung von Y, die durch das modifizierte Modell M x induziert wird :PM(Y|X)YXMYXxYMx
Z=UzX=xY=g(X,Z,Uy)
Das heißt, die interventionelle Wahrscheinlichkeit von , wenn wir setzen X = x wird durch die die Wahrscheinlichkeit induziert in submodel gegeben M x , das heißt, P M x ( Y | X = x ) , und es ist in der Regel gekennzeichnet durch P ( Y | d o ( X = x ) ) . Die d o ( X = x ) in einem Teilmodell , wo es eine Intervention Einstellung X zu entsprechen xYX=xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x) Operator macht es klar , dass wir die Wahrscheinlichkeit , sind Rechen YXx, which corresponds to overriding the structural equation of X with the equation X=x.
The goal of many analyses is to find how to express the interventional distribution P(Y|do(X)) in terms of the joint probability of the observational (pre-intervention) distribution.
do-calculus
The do-calculus is not the same thing as the do(⋅) operator. The do-calculus consists of three inference rules to help "massage" the post-intervention probability distribution and get P(Y|do(X)) in terms of the observational (pre-intervention) distribution. Hence, instead of doing derivations by hand, such as in this question, you can let an algorithm perform the derivations and automatically give you a nonparametric expression for identifying your causal query of interest (and the do-calculus is complete for recursive nonparametric structural causal models).