Bedeutet keine Korrelation keine Kausalität?


73

Ich weiß, dass Korrelation nicht Kausalität impliziert, aber impliziert ein Fehlen von Korrelation ein Fehlen von Kausalität?


46
Um Andrew Gelman zu zitieren: "Korrelation impliziert nicht einmal Korrelation."
Mike Hunter

9
Nein. A kann die Ursache von B sein, sie jedoch nur nichtlinear beeinflussen.
Neil G

3
"Korrelation korreliert mit Kausalität. (Nur nicht sehr viel.)"
Adrian

7
Bitte schauen Sie auf diese Seite für die kontrapositiven. Wenn Kausalität keine Korrelation impliziert, dann impliziert keine Korrelation keine Kausalität.
EdM

4
Es ist zwar ein guter Anfang, zu verdeutlichen, dass Korrelation keine Kausalität bedeutet, und dann Details zu erörtern. Aber ich habe lange darüber nachgedacht, warum Korrelation herausgegriffen werden sollte. Ich schreibe es auf die Übereinstimmung und die Idee, die für Lehrer (auch für mich) attraktiv ist, dass Schüler sich mit etwas Mühe einen Slogan merken und ihn in ihrem Denken verwenden können. Aber die Wahrheit ist, nicht viel in der Statistik impliziert Kausalität. Anders ausgedrückt, diese Warnung kommt häufig im Korrelationskapitel oder in der Korrelationsvorlesung vor, gehört aber überall hin.
Nick Cox

Antworten:


76

Bedeutet das Fehlen einer Korrelation das Fehlen einer Kausalität?

Nein. Jedes gesteuerte System ist ein Gegenbeispiel.

Ohne kausale Zusammenhänge ist eine Kontrolle eindeutig unmöglich, aber eine erfolgreiche Kontrolle bedeutet - grob gesagt -, dass eine bestimmte Menge konstant gehalten wird, was impliziert, dass sie mit nichts korreliert, auch mit den Dingen, die sie konstant machen.

In dieser Situation wäre es also ein Fehler, keinen Kausalzusammenhang aus mangelnder Korrelation zu schließen.

Hier ist ein etwas aktuelles Beispiel .


Eine intuitive Art, darüber nachzudenken
Repmat

+1, interessante Einstellung. Es scheint jedoch zu implizieren, dass eine Kausalität vorhanden sein könnte, während eine Korrelation jeglicher Art fehlt. Das kann doch nicht wahr sein. Wenn ein Ereignis ein anderes verursacht, liegt eine "Art Korrelation" vor, die von Ihnen erwähnte Konstante wird in Form einer nichtlinearen Korrelation
vorliegen

1
+1 Bra vo! Als ich den Fragentitel in der Seitenleiste sah, war alles "Dies muss aus einer Systemperspektive beantwortet werden." Du hast den Nagel auf den Kopf getroffen.
Alexis

Wenn aus einem Fehlen der Korrelation die Kausalität beseitigt wird, ist die verbleibende Funktion Kandidat für die Bezeichnung "Lässigkeit"?
TTNPHNS

1
Ich bin mir nicht sicher, ob ich die Frage von @ttnphns verstehe, aber ich denke, die Antwort lautet: Wenn Sie das Bremskabel lösen (oder das Gaspedal abnehmen), zeigen die Hügel tatsächlich ihre kausalen Auswirkungen auf die Geschwindigkeit eines Autos.
Conjugateprior

30

Nein. Hauptsächlich, weil Sie unter Korrelation wahrscheinlich eine lineare Korrelation verstehen . Zwei Variablen können nichtlinear korreliert werden und zeigen möglicherweise keine lineare Korrelation . Es ist einfach, ein solches Beispiel zu konstruieren, aber ich gebe Ihnen ein Beispiel, das Ihrer (engeren) Frage näher kommt.

Betrachten wir die Zufallsvariable und die nicht zufällige Funktion , mit der wir eine Zufallsvariable erstellen . Letztere deutlich wird verursacht durch die ehemalige Variable, nicht nur korreliert. Lassen Sie uns ein Punktdiagramm zeichnen:xf(x)=x2y=f(x)

Bildbeschreibung hier eingeben

Nettes, klares nichtlineares Korrelationsbild , aber in diesem Fall auch direkte Kausalität. Der lineare Korrelationskoeffizient ist jedoch nicht signifikant, dh es gibt keine lineare Korrelation trotz offensichtlicher nichtlinearer Korrelation und sogar Kausalität:

>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)

rho =

    0.0140


pval =

    0.8904

UPDATE: @Kodiologist ist richtig im Kommentar. Es kann mathematisch gezeigt werden, dass der lineare Korrelationskoeffizient für diese beiden Variablen tatsächlich Null ist. In meinem Beispiel die Standardnormalvariable ist, so haben wir die folgenden: Somit Die Kovarianz (und damit die Korrelation) ist Null: x

E[x]=0
E[x2]=1
E[xx2]=E[x3]=0
Cov[x,x2]=E[xx2]E[x]E[x2]=0

Wir erhalten das gleiche Ergebnis für jede symmetrische Verteilung, z. B. .U[1,1]


8
Nicht-Signifikanz impliziert nicht die Wahrheit der Nullhypothese. In Ihrem Beispiel ist es wichtig, dass der Populationskorrelationskoeffizient 0 beträgt.
Kodiologist,

1
Warum bedeutet OP Ihrer Meinung nach lineare Korrelation?
user253751

@immibis, weil die Kausalität zu einer nichtlinearen Korrelation führen muss.
Aksakal

Warum ist die Korrelation Null? Die Kovarianz ist , und im Allgemeinen für eine Zufallsvariable dann . Es gilt für Standard aber normalE[X3]E[X2]E[X]XE[X3]E[X2]E[X]X
Ant

@Ant, im MATLAB-Beispiel verwende ich Standardnormal für . Ich habe meinen Beitrag aktualisiert, um dies zu verdeutlichen. Vielen Dank für den Hinweis. x
Aksakal

18

Nein . Insbesondere können Zufallsvariablen abhängig, aber nicht korreliert sein.

Hier ist ein Beispiel. Angenommen, ich habe eine Maschine, die eine einzelne Eingabe und eine Zufallszahl , die mit gleicher Wahrscheinlichkeit entweder oder entspricht. Offensichtlich bewirkt . Sei nun eine auf gleichmäßig verteilte Zufallsvariable und wähle mit , was eine gemeinsame Verteilung auf induziert . und sind abhängig, dax[1,1]YxxxYX[1,1]Yx=X(X,Y)XY

P(X<12)P(|Y|<12)=1412=180=P(X<12,|Y|<12).

Die Korrelation von und ist jedoch 0, weilYXY

Corr(X,Y)=Cov(X,Y)σXσY=E[XY]E[X]E[Y]σXσY=000σXσY=0.

1
Eigentlich ist dies meiner Meinung nach ein schlechtes Beispiel. X verursacht nicht Y. Eine binäre Variable, die im Modell PresenceOfX fehlt, ist die tatsächliche Ursache mit einer Korrelation von 1. Sie beweisen, dass der Wert von X Y nicht beeinflusst.
user2088176

6
Ich bin wirklich ratlos, wie Sie fühlen könnten, dass die Wahl von nicht zu . Vielleicht solltest du angeben, was du mit "Ursache" meinst. xY
Kodiologist

5
@ user2088176 Hier ist ein schneller Beweis dafür, dass die Wahl von zu . Verwenden wir ein kontrafaktisches Kausalitätsmodell, in dem ein Index für eine Menge möglicher Verteilungen für . Wenn , dann ist oder mit gleicher Wahrscheinlichkeit. Wenn , dann ist oder mit gleicher Wahrscheinlichkeit. Da durch den Wert von unterscheidbare Kontrafakten unterschiedliche Verteilungen für implizieren , bewirkt die Wahl vonxYxYx=12Y1212x=34Y3434xYxY .
Kodiologist

1
Dieses Beispiel wäre vielleicht einfacher (und funktioniert immer noch), wenn wir auf . x[0,1]
JiK

3
Was ist mit dem einfachen und standardmäßigen Beispiel: und . Sie sind aber die unkorreliert -verteilt auf perfekt abhängt . XN(0,1)X2χ2(1)X2X
Therkel

14

Vielleicht hilft es, es aus einer rechnerischen Perspektive zu betrachten.

Nehmen Sie als konkretes Beispiel einen Pseudozufallszahlengenerator.

Gibt es einen kausalen Zusammenhang zwischen dem Samen , den Sie festgelegt und der Ausgabe vom Generator?kth

Gibt es eine messbare Korrelation?


7

Die bessere Antwort auf die Frage ist, dass Korrelation eine statistische, mathematische und / oder physikalische Beziehung ist, während Kausalität eine metaphysische Beziehung ist. Ohne eine (große) Menge von Annahmen, die die Metaphysik an die Physik binden, kann man nicht LOGISCH von Korrelation (oder Nichtkorrelation) zu Kausalität gelangen. (Ein Beispiel ist, dass das, was zwei Leute als "rationaler Beobachter" bezeichnen könnten, weitgehend willkürlich und wahrscheinlich mehrdeutig ist.) Wenn A B bezahlt, um C zu tun, was zu D führt, was ist die Ursache von D? Es gibt einfach keinen vernünftigen Grund, C oder B oder A (oder eines der Vorläuferereignisse von A) zu wählen. Die Kontrolltheorie befasst sich mit Systemen in Bereichen, in denen sie unter Kontrolle sind. Eine Möglichkeit, eine abhängige Variable in den Griff zu bekommen, besteht darin, die Reaktion dieser Variablen auf den möglichen Bereich der (kontrollierten) Variation der unabhängigen Variablen auf statistisches Rauschen zu reduzieren. Zum Beispiel wissen wir, dass Luftdruck mit der Gesundheit korreliert (versuchen Sie einfach, Vakuum zu atmen), aber wenn wir den Luftdruck auf 1 +/- 0,001 atm regeln, wie wahrscheinlich ist es, dass JEDE Veränderung des Luftdrucks die Gesundheit beeinträchtigt?


Die Unterscheidung, nach der Sie streben, ist "in einer Stichprobe beobachtet" (Korrelation) gegenüber der Abhängigkeit, die besteht, unabhängig davon, ob sie in einer Stichprobe beobachtet wird (Physik) oder nicht. Es gibt keine Rolle für die Metaphysik in dieser Erklärung (obwohl einige für die physikalische Annahme). Federn haben elastische Grenzen, unabhängig davon, ob sie diese jemals erreichen oder nicht. Oder in einem einfacheren Beispiel: Ein Zuckerwürfel ist löslich - ein klar kausaler Begriff, der ungefähr impliziert, dass er sich auflöst , wenn Sie ihn in Tee fallen lassen. Diese kausale Eigenschaft beruht jedoch ausschließlich auf ihrer physikalischen Struktur. Zuckerwürfel wären löslich, selbst wenn wir niemals daran gedacht hätten, sie aufzulösen.
Conjugateprior

1
Sie haben natürlich Recht, dass Sie ohne kausale Annahmen in ein Argument keine kausalen Schlussfolgerungen daraus ziehen. Aber das ist wirklich nicht sehr metaphysisch!
Conjugateprior

Die kontrafaktische Theorie der Kausalität (z. B. Pearl oder Woodward) ist genau so angelegt, dass sie den Sinn ergibt: "Wenn A B für C bezahlt, was ergibt D, was ist die Ursache von D? Es gibt einfach keinen vernünftigen Grund, C oder B oder A zu wählen." . Die einzige altmodische Vorstellung und nicht hilfreiche Vorstellung, die diese Theorien auf den Prüfstand stellen, ist, dass wir immer davon ausgehen können, dass es die Ursache für etwas gibt. Natürlich gibt es nicht.
Conjugateprior

5

Ja , im Gegensatz zu früheren Antworten. Ich werde die Frage als nicht technisch betrachten, insbesondere die Definition von "Korrelation". Vielleicht verwende ich es zu allgemein, aber siehe meine zweite Kugel. Ich hoffe, dass es angebracht ist, hier andere Antworten zu diskutieren, da sie verschiedene Teile der Frage beleuchten. Ich beziehe mich auf Pearl's Herangehensweise an die Kausalität und insbesondere darauf, wie ich es in einigen Zeitungen mit Kevin Korb aufnehme. Woodward hat wahrscheinlich den klarsten nichttechnischen Bericht.

  • @conjugateprior sagt "jedes gesteuerte System ist ein Gegenbeispiel". Ja, zu der stärkeren Behauptung, dass die in Ihrem Experiment beobachtete Nichtkorrelation keine Ursache impliziert. Ich gehe davon aus, dass die Frage allgemeiner ist. Sicherlich konnte ein Experiment die Ursachen nicht oder nur unzureichend auf häufige Auswirkungen hin kontrollieren und die Korrelation verbergen. Aber wenn verursacht , wird es ein kontrolliertes Experiment geben, in dem diese Beziehung aufgedeckt wird. Fast alle Definitionen oder Begründungen der Kausalität behandeln sie als einen Unterschied, der einen Unterschied macht. Daher keine Kausalität ohne (irgendeine) Korrelation. Wenn es in einem kausalen Bayes'schen Netzwerk eine direkte Verknüpfung , heißt das nicht, dassxyxyx macht immer einen Unterschied zu , nur dass es ein Experiment gibt, das alle anderen Ursachen von behebt, bei denen wackelt .yyxy

  • @aksakal hat ein gutes Beispiel dafür, warum lineare Kausalität nicht ausreicht. Einverstanden, aber ich möchte breit und nicht technisch sein. Wenn , ist es unvollständig, einem Client mitzuteilen, dass mit korreliert ist . Also werde ich die Korrelation sehr allgemein verwenden, um einen Unterschied in zu bedeuten , der zuverlässig mit einem Unterschied in assoziiert ist . Es kann so nichtlinear oder nichtparametrisch sein, wie Sie möchten. Schwelleneffekte sind in Ordnung ( macht einen Unterschied zu , jedoch nur über einen endlichen Bereich, oder nur, indem es größer oder kleiner als ein bestimmter Wert ist, wie die Spannung in digitalen Schaltkreisen).y=x2yxxyxy

  • @Kodiologist erstellt ein Beispiel mit , alsoaber keine lineare Korrelation. Aber es gibt eindeutig eine auffindbare Beziehung, die im weiteren Sinne korreliert.| y | = | x |y=Unif(x,x)|y|=|x|

  • @Szabolcs verwendet Zufallszahlengeneratoren, um einen nicht korrelierten Ausgabestream anzuzeigen. Wie die Ziffern von erscheint der Stream zufällig, ist aber deterministisch. Ich bin damit einverstanden, dass Sie die Beziehung wahrscheinlich nicht finden, wenn Sie nur die Daten angeben, aber sie ist da.π

  • @ Li Zhi stellt fest, dass Sie nicht logisch von der Korrelation zur Kausalität springen können. Ja, keine Ursachen rein, keine Ursachen raus. Aber die Frage geht von der Kausalität aus: impliziert sie Korrelation? Im Beispiel Luftdruck haben wir einen Schwelleneffekt. Es gibt einen Bereich, in dem der Luftdruck nicht mit der Gesundheit korreliert. In der Tat plausibel, wenn es keine gesundheitsschädigende Wirkung hat. Aber es gibt einen Bereich, in dem es funktioniert. Das reicht aus. Aber wahrscheinlich ist es besser, Bereiche zu notieren, in denen es einen Effekt gibt und nicht. Wenn , dann gibt es Korrelation entlang der gesamten Kette, weil es eine Kausalität gibt. Wiederholte Beobachtungen (oder Experimente) können zeigen, dass nicht direkt verursachtA DABCDAD aber die Korrelation ist da, weil es eine kausale Geschichte gibt.

Ich weiß nicht, was @ user2088176 im Sinn hatte, aber ich denke, wenn wir die Frage ganz allgemein beantworten, lautet die Antwort ja. Zumindest denke ich, dass dies die Antwort ist, die von der Literatur über kausale Entdeckungen und dem interventionistischen Bericht über die Kausalität verlangt wird. Ursachen sind Unterschiede, die einen Unterschied machen. Und dieser Unterschied wird sich in einigen Experimenten als beständige Assoziation herausstellen.


1
Ich hatte gehofft, dies aus einer einfacheren und nicht-technischen Perspektive zu betrachten, wie Sie es getan haben. Was bedeutet "Ursache"? Vermutlich handelt es sich um eine Änderung von etwas, die zu einer Änderung von etwas anderem führt. Ich kann die Kausalität nicht ohne irgendeine Korrelation ergründen.
Behacad

1
@Behacad Ich denke, der Kontrast besteht zwischen einer Art Korrelation (die Art der Dinge, die Sie beobachten können) und einer Art Abhängigkeit (die möglicherweise nie ausgelöst wird). Es gibt ungetriggerte Abhängigkeiten, aber keine unbeobachteten Korrelationen. Dies ist der Grund, warum die Kausalität ein kontrafaktisches Element zu ihrer Definition hat, während dies bei der Korrelation nicht der Fall ist.
Conjugateprior
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.