Was ist die mathematische Definition eines Kausalzusammenhangs zwischen zwei Zufallsvariablen?
Mathematisch gesehen besteht ein Kausalmodell aus funktionalen Beziehungen zwischen Variablen. Betrachten Sie beispielsweise das folgende Strukturgleichungssystem:
x=fx(ϵx)y=fy(x,ϵy)
Dies bedeutet, dass den Wert von funktional bestimmt (wenn Sie auf eingreifen, ändert dies die Werte von ), aber nicht umgekehrt. Grafisch wird dies normalerweise durch , was bedeutet, dass in die Strukturgleichung von y eingeht. Als Ergänzung können Sie auch ein Kausalmodell in Form von gemeinsamen Verteilungen kontrafaktischer Variablen ausdrücken, das mathematisch den Funktionsmodellen entspricht .xyxyx→yx
Wann würde man bei einer Stichprobe aus der gemeinsamen Verteilung zweier Zufallsvariablen X und Y sagen, dass X Y verursacht?
Manchmal (oder meistens) haben Sie keine Kenntnis über die Form der Strukturgleichungen ,fxfy und auch nicht darüber, ob oder . Die einzige Information, die Sie haben, ist die gemeinsame Wahrscheinlichkeitsverteilung (oder Stichproben aus dieser Verteilung).x→yy→xp(y,x)
Dies führt zu Ihrer Frage: Wann kann ich die Richtung der Kausalität nur aus den Daten wiederherstellen? Oder genauer gesagt, wann kann ich aus den Daten herausfinden, ob in die Strukturgleichung von eingeht oder umgekehrt?xy
Ohne grundsätzlich nicht überprüfbare Annahmen über das Kausalmodell ist dies natürlich unmöglich . Das Problem ist, dass mehrere unterschiedliche Kausalmodelle die gleiche gemeinsame Wahrscheinlichkeitsverteilung der beobachteten Variablen zur Folge haben können. Das häufigste Beispiel ist ein kausales lineares System mit Gaußschem Rauschen.
Aber unter bestimmten kausalen Voraussetzungen könnte dies möglich sein - und daran arbeitet die Literatur über kausale Entdeckungen. Wenn Sie mit diesem Thema noch nicht vertraut sind , sollten Sie mit Elements of Causal Inference von Peters, Janzing und Scholkopf sowie mit Kapitel 2 aus Causality von Judea Pearl beginnen. Wir haben hier im Lebenslauf ein Thema für Verweise auf kausale Entdeckungen , aber wir haben dort noch nicht so viele Verweise aufgelistet.
Daher gibt es nicht nur eine Antwort auf Ihre Frage, da diese von den getroffenen Annahmen abhängt. In dem von Ihnen erwähnten Artikel werden einige Beispiele angeführt, beispielsweise die Annahme eines linearen Modells mit nicht-gaußschem Rauschen. Dieser Fall ist als LINGAN (kurz für lineares nicht-gaußsches azyklisches Modell) bekannt. Hier ein Beispiel in R
:
library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1
# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat")
# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
# [,1] [,2]
# [1,] . .
# [2,] TRUE .
Beachten Sie, dass wir hier ein lineares Kausalmodell mit nicht-gaußschem Rauschen haben, bei dem verursacht und Lingam die Kausalrichtung korrekt wiederherstellt. Beachten Sie jedoch, dass dies entscheidend von den LINGAM-Annahmen abhängt.x2x1
Für den Fall des von Ihnen zitierten Papiers gehen sie von dieser speziellen Annahme aus (siehe ihr "Postulat"):
Wenn , ist die minimale Beschreibungslänge des Mechanismus, der X auf Y abbildet, unabhängig vom Wert von X, wohingegen die minimale Beschreibungslänge des Mechanismus, der Y auf X abbildet, vom Wert von Y abhängt.x→y
Beachten Sie, dass dies eine Annahme ist. Dies ist, was wir ihre "Identifikationsbedingung" nennen würden. Im Wesentlichen legt das Postulat Einschränkungen für die gemeinsame Verteilung . Das heißt, das Postulat besagt, dass, wenn bestimmte Beschränkungen in den Daten gelten, und wenn andere Beschränkungen gelten. Diese Art von Einschränkungen, die überprüfbare Auswirkungen haben ( Einschränkungen auferlegen ), ermöglicht die gerichtete Wiederherstellung von Beobachtungsdaten.p(x,y)x→yy→xp(y,x)
Abschließend sei angemerkt, dass die Ergebnisse der kausalen Entdeckung immer noch sehr begrenzt sind und von starken Annahmen abhängen. Seien Sie vorsichtig, wenn Sie diese im Kontext der realen Welt anwenden.