Mathematische Definition der Kausalität

9

Sei und Zufallsvariablen. ist die bedingte Mittelwert von gegeben . Wir sagen, ist nicht kausal mit wenn nicht von abhängt , was impliziert, dass es gleich . Lassen Sie uns nun für eine Sekunde mit dieser Definition der Kausalität fortfahren. Nach dem Gesetz der iterierten Erwartungen ist . Dies bedeutet, dass wenn nicht von abhängt , wenn es gleich , . $Y$ $X$ $E(Y|X)$ $Y$ $X$ $Y$ $X$ $E(Y|X)$ $X$ $E(Y)$ $E(XE(Y|X)) = E(E(XY|X)) = E(XY)$ $E(Y|X)$ $X$ $E(Y)$ $E(X)E(Y) = E(XY)$

Mit anderen Worten:

Wenn und nicht kausal zusammenhängen, sind und nicht korreliert! - Das macht keinen Sinn und ich weiß, dass das falsch sein muss. Habe ich die Kausalität falsch definiert? Was habe ich falsch gemacht? $X$ $Y$ $X$ $Y$

In der Ökonometrie nehmen wir im Allgemeinen . Also ist äquivalent zu . Die Logik gilt auch in diesem speziellen Szenario. $E(Y|X) = b_0 + b_1X$ $E(Y|X) = E(Y)$ $b_1 = 0$

econometrics causality conditional-expectation

— Christian
quelle

2

Sie sagten, dass . Ich glaube das ist falsch. E (Y | X) ist eine Konstante. Daher ist gleich . Ein weiterer Punkt, stammt aus dem einfachen linearen Regressionsmodell.

E (X E (Y | X)) = E (E (X Y | X)) = E (X Y)

$E(XE(Y|X))=E(E(XY|X))=E(XY)$

E (X E (Y | X))

$E(XE(Y|X))$

E (Y | X) E (X)

$E(Y|X)E(X)$

E (Y | X) = b 0 + b 1 * X

$E(Y|X)=b0+b1*X$

— Budhapest

Sei E (Y | X) = b, wobei b eine Konstante ist. Dann nehmen Sie die Erwartungen beider Seiten. Man findet, dass E (E (Y | X)) = E (b) = b. Nach dem Gesetz der iterierten Erwartungen ist E (E (Y | X)) = E (Y). Wenn E (Y | X) konstant ist, muss es daher gleich E (Y) sein.

— Christian

Wenn E (Y / X) = b ist, bedeutet dies, dass Y nicht von X abhängt, und E (Y) = b, Sie verwirren sich.

— SAAN

Ich verstehe nicht, warum "das keinen Sinn macht". Sie beginnen mit einer Definition der Kausalität, die meiner Meinung nach der Definition der Unabhängigkeit in der Statistik entspricht. Und unabhängige Variablen haben keine Kovarianz. Wo ist die Geschichte?

— Januar

Januar, nein, sie sind nicht dasselbe! X und Y sind unabhängig, wenn die gemeinsame Verteilung in das Produkt der Marginals einfließt, und dies ist definitiv nicht dasselbe. Ich verstehe nicht, worum es dir geht? Azeem, haben Sie, abgesehen von dem, was ich zuvor gesagt habe, noch etwas beizutragen? Können Sie erklären, warum ich falsch liege, anstatt zu sagen, dass ich falsch liege?

— Christian

18

Sie haben die Kausalität falsch definiert, ja. Wahrscheinlich haben Sie das Sprichwort "Korrelation ist keine Kausalität" gehört. Sie haben Kausalität im Wesentlichen als Korrelation definiert. Das Problem ist jedoch schlimmer. Kausalität ist überhaupt kein statistisches oder probabilistisches Konzept, zumindest da diese Themen normalerweise gelehrt werden. Es gibt keine statistische oder probabilistische Definition der Kausalität: nichts, was bedingte Erwartungen oder bedingte Verteilungen oder ähnliches beinhaltet. Es ist jedoch schwierig, diese Tatsache aus Kursen in Statistik oder Ökonometrie aufzunehmen.

Leider neigen wir dazu, besser zu sagen, was Kausalität nicht ist als was Kausalität ist. Kausalität kommt immer und überall aus der Theorie, aus a priori Überlegungen, aus Annahmen. Sie haben die Ökonometrie erwähnt. Wenn Sie kompetent instrumentelle Variablen gelernt haben, wissen Sie, dass kausale Effekte nur gemessen werden können, wenn Sie eine "Ausschlussbeschränkung" haben. Und Sie wissen, dass Ausschlussbeschränkungen immer aus der Theorie stammen.

Sie sagten, Sie wollten Mathe. Der Typ, den Sie lesen möchten, ist Judea Pearl . Es ist keine einfache Mathematik, und die Mathematik wandert manchmal in die Philosophie ab, aber das liegt daran, dass Kausalität ein schwieriges Thema ist. Hier ist eine Seite mit weiteren Links zum Thema. Hier ist ein kostenloses Online-Buch, auf das ich gerade gestoßen bin. Schließlich ist hier eine vorherige Frage, in der ich eine Antwort gegeben habe, die Sie vielleicht nützlich finden.

— Rechnung
quelle

Herzlichen Dank. Ich werde seine Arbeit lesen und mich bei Ihnen melden, wenn ich Zeit habe.

— Christian

4

Hervorragende Antwort. Das Morgan & Winship-Buch ist viel einfacher als Pearl und konzentriert sich auf sozialwissenschaftliche Probleme.

— Dimitriy V. Masterov

8

Wir sagen, ist nicht kausal mit wenn nicht von abhängt , was impliziert, dass es gleich . $Y$ $X$ $E(Y|X)$ $X$ $E(Y)$

Das ist falsch. Bei kausalen Beziehungen geht es um funktionale / strukturelle Abhängigkeiten, nicht um statistische / assoziative Abhängigkeiten. Sie sollten hier einen Blick darauf werfen.

Habe ich die Kausalität falsch definiert? Was habe ich falsch gemacht?

Ja, Sie haben es falsch definiert. Hier können Sie kausale Inferenzbücher / Referenzen überprüfen . In einem Strukturgleichungsmodell Formal die kausale Wirkung von auf die Verteilung von , die wir mit bezeichnen kann --- das heißt, wie die Änderung wirkt sich auf die Verteilung von --- ist mathematisch definiert als die Wahrscheinlichkeitsverteilung, die durch das modifizierte Strukturgleichungsmodell induziert wird, wobei die Gleichung für wird . $X$ $Y$ $P(Y|do(X = x))$ $X$ $Y$ $X$ $X = x$

Angenommen, Ihr Kausalmodell wird durch die folgenden Strukturgleichungen definiert:

U. = ϵ_{u} X. = f (U., ϵ_{x}) Y. = G (X., U., ϵ_{y})

$U = \epsilon_u\\ X = f(U, \epsilon_x)\\ Y = g(X,U, \epsilon_y)$

Wo die Störungen voneinander unabhängig sind und eine gewisse Wahrscheinlichkeitsverteilung haben. Dies entspricht der DAG:

$\hskip2in$

Dann ist die Wahrscheinlichkeitsverteilung von durch die modifizierten Gleichungen Struktur induziert: $P(Y|do(X = x))$ $Y$

U. = ϵ_{u} X. = x Y. = G (X., U., ϵ_{y})

$U = \epsilon_u\\ X = x\\ Y = g(X, U, \epsilon_y)$

Was der verstümmelten DAG entspricht:

$\hskip2in$

Der durchschnittliche kausale Effekt wäre einfach die Erwartung von die kausalen CDF mit . $Y$ $P(Y|do(X=x))$

E. [Y. | d Ö (X. = x)]] = \int Y. d P. (Y. | d Ö (X. = x))

$E[Y|do(X =x)] = \int Y dP(Y|do(X = x))$

Dies ist die mathematische Definition. Ob Sie den Effekt mit Beobachtungsdaten identifizieren können, hängt davon ab, ob Sie in Bezug auf die Beobachtungsverteilung ohne den Operator ausdrücken können. $P(Y|do(X=x))$ $do()$

— Carlos Cinelli
quelle

3

Ein Gegenbeispiel

Das Problem scheint nicht die mittlere Unabhängigkeit zu sein (die Bedingung, bei der ), impliziert, dass und nicht korreliert sind. Wenn und nicht korreliert sind, ist es im Allgemeinen nicht wahr, dass sie mittelunabhängig sind. Das scheint also bisher nicht problematisch zu sein. $E[Y|X] = E[Y]$ $Y$ $X$ $X$ $Y$

Angenommen, Sie hatten eine Beziehung (wir können sie als kausal bezeichnen) definiert als , wobei mit einer Standardnormalverteilung und mit einer Rademacher-Verteilung verteilt ist, so dass oder , jeweils mit Wahrscheinlichkeit ( siehe diesen Wikipedia - Artikel ). Beachten Sie dann, dass . Nach Ihrer Definition wäre diese Beziehung keine Ursache, obwohl $Y = WX$ $X$ $W$ $W = 1$ $-1$ $1/2$ $E[Y|X] = E[Y]$ $Y$ hängt eindeutig von . $X$

Ein Beispiel für eine formale Denkweise über Kausalität

Nehmen Sie das folgende Beispiel, um Ihnen eine klarere und mathematischere Möglichkeit zu geben, die Kausalität zu betrachten. (Ich leihe dieses Beispiel aus dem Buch "Mostly Harmless Econometrics" aus.) Angenommen, Sie möchten die Auswirkungen von Krankenhausaufenthalten auf die Gesundheit analysieren. Definieren Sie als ein Gesundheitsmaß für Person und um anzugeben, ob diese Person ins Krankenhaus eingeliefert wurde oder nicht. Nehmen wir in unserem ersten Versuch an, wir betrachten den durchschnittlichen Gesundheitsunterschied der beiden Arten von Individuen: $Y_i$ $i$ $D_i \in \{0,1\}$ Beim ersten Blick auf die Daten werden Sie möglicherweise intuitiv feststellen, dass Personen, die ins Krankenhaus eingeliefert wurden, tatsächlich einen schlechteren Gesundheitszustand haben als Personen, die dies nicht getan haben. Ein Krankenhausaufenthalt macht die Menschen jedoch sicherlich nicht kranker. Vielmehr besteht eine Auswahlverzerrung. Menschen, die ins Krankenhaus gehen, sind Menschen mit schlechterer Gesundheit. Diese erste Maßnahme funktioniert also nicht. Warum? Weil wir nicht nur an denbeobachtetenUnterschiedeninteressiert sind, sondern an den möglichen Unterschieden (wir wollen wissen, was in der kontrafaktischen Welt passieren würde).

E. [{Y.}_{ich} | {D.}_{ich} = 1]] - - E. [{Y.}_{ich} | {D.}_{ich} = 0]] .

$E[Y_i | D_i=1] - E[Y_i|D_i=0].$

Mögliches Ergebnis = {\begin{cases} {Y.}_{1, ich} & wenn {D.}_{ich} = 1 \\ {Y.}_{0, ich} & wenn {D.}_{ich} = 0. \end{cases}

$\text{Potential Outcome} = \left \{ \begin{array}{ll} Y_{1,i} & \text{if } D_i = 1 \\ Y_{0,i} & \text{if } D_i = 0. \end{array} \right .$

Y_{0, i}

$Y_{0,i}$

i

$i$

Y_{1, i}

$Y_{1,i}$

{Y.}_{ich} = {\begin{cases} {Y.}_{1, ich} & wenn {D.}_{ich} = 1 \\ {Y.}_{0, ich} & wenn {D.}_{ich} = 0. \end{cases}

$Y_i = \left \{ \begin{array}{ll} Y_{1,i} & \text{if } D_i = 1 \\ Y_{0,i} & \text{if } D_i = 0. \end{array} \right.$

Y_{i} = Y_{0, i} + (Y_{1, i} - Y_{0, i}) D_{i}

$Y_i = Y_{0,i} + (Y_{1,i} - Y_{0,i}) D_i$

Y_{1, i} - Y_{0, i}

$Y_{1,i} - Y_{0,i}$

\begin{aligned} E. [{Y.}_{ich} | {D.}_{ich} = 1]] - - E. [{Y.}_{ich} | {D.}_{ich} = 0]] & = E. [{Y.}_{1, ich} | {D.}_{ich} = 1]] - - E. [{Y.}_{0, ich} | {D.}_{ich} = 1]] \\ + E. [{Y.}_{0, ich} | {D.}_{ich} = 1]] - - E. [{Y.}_{0, ich} | {D.}_{ich} = 0]] . \end{aligned}

$\begin{align*} E[Y_i | D_i=1] - E[Y_i|D_i=0] &= E[Y_{1,i}|D_i = 1] - E[Y_{0,i}|D_i = 1] \\ & \qquad + E[Y_{0,i}|D_i=1] - E[Y_{0,i}|D_i=0]. \end{align*}$

E [Y_{1, i} | D_{i} = 1] - E [Y_{0, i} | D_{i} = 1]

$E[Y_{1,i}|D_i = 1] - E[Y_{0,i}|D_i = 1]$

E [Y_{0, i} | D_{i} = 1] - E [Y_{0, i} | D_{i} = 0]

$E[Y_{0,i}|D_i=1] - E[Y_{0,i}|D_i=0]$

D_{i}

$D_i$

\begin{aligned} E. [{Y.}_{ich} | {D.}_{ich} = 1]] - - E. [{Y.}_{ich} | {D.}_{ich} = 0]] & = E. [{Y.}_{1, ich} | {D.}_{ich}]] - - E. [{Y.}_{0, ich} | {D.}_{ich} = 0]] \\ = E. [{Y.}_{1, ich} | {D.}_{ich}]] - - E. [{Y.}_{0, ich} | {D.}_{ich} = 1]] \\ = E. [{Y.}_{1, ich} - - {Y.}_{0, ich} | {D.}_{ich} = 1]] \\ = E. [{Y.}_{1, ich} - - {Y.}_{0, ich}]], \end{aligned}

$\begin{align*} E[Y_i | D_i=1] - E[Y_i|D_i=0] &= E[Y_{1,i}|D_i] - E[Y_{0,i}|D_i=0] \\ &= E[Y_{1,i}|D_i] - E[Y_{0,i}|D_i=1] \\ &= E[Y_{1,i} - Y_{0,i}|D_i=1] \\ &= E[Y_{1,i} - Y_{0,i}], \end{align*}$

E [Y_{1, i} - Y_{0, i}]

$E[Y_{1,i} - Y_{0,i}]$

— jmbejara
quelle

1

$E()$ $E(Y|X) = E(Y)$ $E(X\cdot Y) = E( X )\cdot E( Y )$

Ich sehe jedoch nicht, wo Ihr Problem liegt.

$X$ $Y$
$X$ $Y$

Beispiel: Betrachten Sie folgende Tabelle:

     Y
 X | -1      0      1
 --+---------------------
-1 | 0.25    0     0.25
 1 |   0    0.5      0

$P(X=1 \wedge Y=0) = 0.5$

$E(Y) = E(X) = E(X \cdot Y) = 0$ $E(Y|X=-1)=E(Y|X=1)=0$ $E(Y|X)=E(X)$

$E(X\cdot Y) = E(X)\cdot E(Y)$

$P(X = 1 \wedge Y = 0 ) = 0.5 \ne 0.5 \cdot 0.5 = P(X=1)\cdot P(Y=0)$

— Januar
quelle