Warum muss der Confounder kausal mit dem Ergebnis zusammenhängen? Wäre es ausreichend, wenn der Störer mit dem Ergebnis in Verbindung gebracht würde?
Nein, das reicht nicht.
Beginnen wir mit dem Fall, dass Sie eine Variable haben können, die sowohl mit dem Ergebnis als auch mit der Behandlung verbunden ist, deren Steuerung jedoch Ihre Schätzung verzerren würde.
Betrachten Sie zum Beispiel das folgende Kausendiagramm aus Pearl , wobeiZ ist ein Vorbehandlungscollider:
In diesem Fall gibt es keine Verwirrung, Sie können die Auswirkung von X auf Y direkt abschätzen.
Beachten Sie jedoch, dass Z sowohl mit der Behandlung als auch mit dem Ergebnis verbunden ist. Aber es ist immer noch kein Störfaktor. Wenn Sie in diesem Fall für Z steuern, würden Sie Ihre Schätzung sogar verzerren. Diese Situation nennt man M-Bias (wegen der Graphenstruktur).
Ein anderer ähnlicher, direkterer Fall, bei dem Sie keine Kontrolle haben sollten, ist der, wenn die Variable das Ergebnis beider Behandlungen ist X und des Ergebnisses Y.. Nehmen Sie dieses einfache Collider-Diagramm:
Auch hier ist Z mit X und Y verbunden, aber kein Mitbegründer. Sie sollten nicht dafür kontrollieren.
Es sollte beachtet werden, dass eine Variable , auch wenn sie kausal mit dem Ergebnis zusammenhängt , nicht unbedingt ein Störfaktor ist.
Nehmen wir den Fall der Mediatoren in der folgenden einfachen Grafik:
Wenn Sie den Gesamteffekt von D auf Y messen möchten, sollten Sie nicht nach Dingen suchen, die den Effekt vermitteln - in diesem Fall M. Das heißt, M ist kausal mit Y verbunden, ist jedoch kein Störfaktor in Bezug auf Gesamteffekt von D auf Y auch nicht.
Beachten Sie jedoch, dass das Definieren von Confouding viel einfacher ist als das Definieren eines Confounders . Für eine strengere Diskussion über die Definition von confouder , möchten Sie vielleicht dieses Papier von VanderWeele und Shpitser lesen.
Warum ist das so? Denn hier geht es in erster Linie um das Verwirren selbst, nicht um das Verwirren. Für Ihre Forschungsfrage sollten Sie sich fragen: "Wie kann ich Verwechslungen beseitigen?" anstelle von "Ist diese Variable ein Confounder?"
Abschließend sei erwähnt, dass diese Missverständnisse nach wie vor weit verbreitet sind. Um dies zu veranschaulichen, zitieren Sie einen Artikel aus dem Jahr 2016 :
In Abwesenheit eines randomisierten Experiments oder eines starken quasi-experimentellen Designs erfordert die kausale Folgerung eine angemessene Konditionierung aller Vorbehandlungsvariablen, die sowohl die Behandlung als auch das Ergebnis vorhersagen, auch als verwirrende Kovariaten bezeichnet.
Wie wir in den vorherigen Beispielen gezeigt haben, ist dies falsch. Confounder sind nicht "alle Variablen vor der Behandlung, die sowohl die Behandlung als auch das Ergebnis vorhersagen". Das Kontrollieren für alle ist möglicherweise nicht erforderlich, um Verwechslungen zu vermeiden, oder es kann sogar zu einer Verzerrung Ihrer Ergebnisse führen. Pearl hat hier einen sehr guten Überblick über das Verwechseln.