Carlos 'Antwort ist insofern gut, als sie einen großen Mangel in der Regressionsmodellierungspraxis behebt. Der Begriff OVB ist sehr ungenau. Außer unter atypischen mathematischen Strukturen, die Anpassung für andere Variablen wird die Wirkung verändern für einen primären Regressor geschätzt. Dies allein bedeutet nicht, dass alle diese Variablen in ein Modell aufgenommen werden sollten.
Das "Backdoor-Kriterium" befasst sich speziell mit verwirrenden Vorurteilen. Ein Expertenpublikum akzeptiert / glaubt im Allgemeinen keine Ergebnisse von Modellen, bei denen verwirrende Variablen bei der Anpassung weggelassen werden. Das hat gute Gründe. Ausgelassene Störfaktoren haben in großen Bestätigungsstudien zu völlig falschen Schlussfolgerungen geführt und außerdem zu Richtlinien, Arzneimittelindikationen oder Medienberichterstattung, die kostspielig und schädlich waren. Die bevorzugte Terminologie ist hier eher eine verwirrende Verzerrung als nur eine OVB. Dies gilt für alle Arten von Modellen, einschließlich der am weitesten verbreiteten linearen Regression.
Das zweithäufigste (vielleicht) Modell ist die logistische Regression. Es gibt eine andere Art von "Voreingenommenheit" (vielleicht), die sich aus logistischen Modellen ergibt, die nichts mit Verwirrung zu tun haben. Sie können den primären Effekt ändern, indem Sie Variablen anpassen, die nicht mit dem primären Regressor korreliert sind. Dies liegt an der Nichtkollabierbarkeit des Quotenverhältnisses . Dies tritt auf, wenn die primäre Exposition eine heterogene Verteilung von Kovariaten aufweist, die dem Basisrisiko des Ergebnisses zugrunde liegen. Die Steigung des Sigmoid, die die "gemittelte" Akkumulation des Risikos pro Einheitsdifferenz in einem primären Regressor schätzt, wird abgeschwächt. Diese Art von Verzerrung tritt auf, wenn das Ziel der Inferenz eher das Risiko auf individueller Ebene als das gemittelte Bevölkerungsniveau war.
Im Allgemeinen wird den Modellierern empfohlen, prognostische Variablen oder Variablen anzupassen , die, obwohl sie nicht mit dem primären Regressor zusammenhängen, das Ergebnis kausal vorhersagen. Beispiele könnten in einer Studie über Lungenkrebs und Rauchen sein, Gruppen von Teilnehmern durch Umweltverschmutzung. Nehmen wir im Moment an, dass keine Beweise darauf hindeuten, dass Unterschiede in der Regionalität die Backdoor-Kriterien erfüllen, um die Beziehung zwischen Rauchen und Krebs zu verwechseln. Der Unterschied im Risiko für diese Umweltexposition sagt jedoch im Wesentlichen das Risiko für Lungenkrebs voraus. Die Anpassung an die Umweltexposition schichtet diese Teilnehmer feiner, so dass die offensichtlichen Unterschiede zwischen Rauchen und Nichtrauchen sowie das Krebsrisiko offensichtlich sind.
Eine sehr schöne Beschreibung des Unterschieds finden Sie hier: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3147074/pdf/dyr041.pdf