Simpsons Paradoxon verstehen: Andrew Gelmans Beispiel mit rückläufigem Einkommen in Bezug auf Geschlecht und Körpergröße

22

Andrew Gelman in einem seiner letzten Blog-Beiträge sagt:

Ich glaube nicht, dass für das Simpson-Paradoxon Kontrafakten oder potenzielle Ergebnisse notwendig sind. Ich sage das, weil man Simpsons Paradoxon mit Variablen aufstellen kann, die nicht manipuliert werden können oder für die Manipulationen nicht direkt von Interesse sind.

Das Simpson-Paradoxon ist Teil eines allgemeineren Problems, bei dem sich die Regressionsfaktoren ändern, wenn Sie mehr Prädiktoren hinzufügen. Das Umkehren des Vorzeichens ist nicht wirklich erforderlich.

Hier ist ein Beispiel, das ich in meinem Unterricht verwende und das beide Punkte veranschaulicht:

Ich kann eine Regression durchführen, die das Einkommen nach Geschlecht und Größe vorhersagt. Ich stelle fest, dass der Koeffizient des Geschlechts 10.000 USD beträgt (dh, wenn ein Mann und eine Frau gleicher Größe verglichen werden , verdient der Mann durchschnittlich 10.000 USD mehr) und der Koeffizient der Größe 500 USD beträgt (dh wenn zwei Männer oder zwei Frauen verglichen werden) Bei unterschiedlichen Körpergrößen verdient die größere Person im Durchschnitt 500 USD mehr pro Zoll Körpergröße.

Wie kann ich diese Coefs interpretieren? Ich bin der Meinung, dass der Koeffizient der Körpergröße leicht zu interpretieren ist (man kann sich leicht vorstellen, zwei Personen desselben Geschlechts mit unterschiedlichen Körpergrößen zu vergleichen). In der Tat scheint es „falsch“ zu sein, die Körpergröße zu reduzieren, ohne den Sex zu kontrollieren Der Unterschied zwischen kleinen und großen Menschen kann durch Unterschiede zwischen Männern und Frauen „erklärt“ werden. Aber der Geschlechtskoeffizient im obigen Modell scheint sehr schwer zu interpretieren: Warum zum Beispiel einen Mann und eine Frau vergleichen, die beide 66 Zoll groß sind? Das wäre ein Vergleich eines kleinen Mannes mit einer großen Frau. All diese Überlegungen scheinen vage kausal zu sein, aber ich halte es nicht für sinnvoll, darüber anhand möglicher Ergebnisse nachzudenken.

Ich habe darüber nachgedacht (und sogar den Beitrag kommentiert) und denke, dass es hier etwas gibt, das klarer verstanden werden muss.

Bis zum Teil über die Interpretation des Geschlechts ist es so okay. Aber ich verstehe nicht, was das Problem ist, wenn man einen kleinen Mann mit einer großen Frau vergleicht. Hier ist mein Punkt: In der Tat macht es noch mehr Sinn (unter der Annahme, dass Männer im Durchschnitt größer sind). Man kann einen "kleinen Mann" und eine "kleine" Frau nicht genau aus dem gleichen Grund vergleichen, dass der Einkommensunterschied zum Teil durch den Höhenunterschied erklärt wird. Gleiches gilt für große Männer und große Frauen und noch mehr für kleine Frauen und große Männer (was sozusagen weiter außer Frage steht). Die Auswirkung der Körpergröße wird also im Grunde genommen nur dann eliminiert, wenn kleine Männer und große Frauen verglichen werden (und dies hilft bei der Interpretation des Koeffizienten für das Geschlecht). Läutet es nicht ähnliche Konzepte hinter den beliebten Matching-Modellen ein?

Die Idee hinter Simpsons Paradoxon ist, dass sich der Populationseffekt möglicherweise von dem / den Untergruppen-Effekt (en) unterscheidet. Dies hängt in gewissem Sinne mit seinem Punkt 2 und der Tatsache zusammen, dass er anerkennt, dass die Höhe nicht für sich allein gesteuert werden sollte (was wir sagen, ohne variable Vorspannung). Dies konnte ich jedoch nicht mit der Kontroverse über den Koeffizienten für das Geschlecht in Verbindung bringen.

Vielleicht können Sie es klarer ausdrücken? Oder mein Verständnis kommentieren?

regression interaction simpsons-paradox

— Abhimanyu Arora
quelle

Bei der Kreuzvalidierung werden zufällige Untergruppen der Grundgesamtheit untersucht, wobei versucht wird, eine minimale Überanpassung und die beste Verallgemeinerung zu erzielen.

— EngrStudent

1

Wenn ich Ihre Bedenken richtig verstehe, könnte es für Sie von Vorteil sein, auch das Paradox des Herrn zu betrachten. @article {lord67, author = {Lord, FM}, title = {Ein Paradoxon bei der Interpretation von Gruppenvergleichen}, journal = {Psychological Bulletin}, year = {1967}, volume = {68}, pages = {304- -305}, keywords = {change scores}} @article {lord69, author = {Lord, FM}, title = {Statistische Anpassungen beim Vergleich bestehender Gruppen}, journal = {Psychological Bulletin}, year = {1969}, volume = {72}, pages = {336--337}, keywords = {change scores}}

— mdewey,

1

Judea Pearl hat kürzlich einen weiteren Beitrag zu Simpsons Paradox gemacht . Ich bin mir ziemlich sicher, dass er mit Gelmans Präsentation nicht einverstanden ist. Der zweite Punkt ist ausnahmsweise nicht das "Paradoxon". Die Umkehrung von Schätzungen als Folge Ihrer Bedingung ist eine mathematische Tatsache. Was es möglicherweise paradox macht, ist, wenn Sie beide Schätzungen kausal interpretieren. Zweitens, warum diese Beschränkung auf manipulierbare Ursachen?

— NRH

9

Ich bin mir Ihrer Frage nicht ganz sicher , kann aber auf seine Behauptungen und Ihre Verwirrung im Beispielmodell hinweisen.

Andrew ist nicht ganz klar , ob wissenschaftliches Interesse liegt in der Höhe verstellt Geschlecht Einkommen Verband oder das Geschlecht angepasst Höhe Einkommen Verein. In einem kausalen Modell bewirkt Sex Höhe, aber Höhe bewirkt keinen Sex. Wenn wir also die Auswirkung des Geschlechts wollen, würde die Anpassung an die Körpergröße zu einer Mediator- Voreingenommenheit führen (möglicherweise auch zu einer Kollider-Voreingenommenheit, da reiche Menschen größer sind!). Ich finde es verwirrend und lustig, wenn ich angewandte Forschung sehe, die den anderen interpretiert"Kovariaten" (Confounder und Präzisionsvariablen), die in einem Modell enthalten sind. Sie sind Unsinn, bieten aber einfach eine angemessene Schichtung, um den notwendigen Vergleich anzustellen. Wenn Sie an geschlechtsspezifischen Einkommensunterschieden interessiert sind, ist es falsch , die Körpergröße anzupassen .

Ich bin damit einverstanden, dass Kontrafakten nicht notwendig sind, um Simpsons Paradoxon zu erklären. Sie können einfach ein Merkmal von Daten sein. Ich denke, dass sowohl rohe als auch angepasste RRs in gewissem Sinne korrekt sind, ohne kausal zu sein. Problematischer ist es natürlich, wenn das Ziel die Kausalanalyse ist und eine Überanpassung Probleme mit der Nicht-Kollabierbarkeit (die einen OP aufbläst) und einer unzureichenden Stichprobengröße aufdeckt.

Zur Erinnerung an die Leser: Simpsons Paradoxon ist ein sehr spezifisches Phänomen, das sich auf einen Fall bezieht, in dem eine Assoziation die Richtung wechselt, nachdem sie nach einer verwirrenden Variablen gesteuert hat. Die Berkeley Admissions-Daten waren das motivierende Beispiel. Dort zeigten rohe RRs, dass Frauen weniger wahrscheinlich in Berkeley aufgenommen wurden. Nach Abteilungen geschichtet , zeigten die RRs jedoch, dass Frauen mit größerer Wahrscheinlichkeit in jeder einzelnen Abteilung akzeptiert werden . Sie bewarben sich eher bei den schwierigen Abteilungen, die viele Leute zurückwiesen.

In der Theorie der kausalen Folgerung würden wir verwirrt sein, wenn wir uns vorstellen würden, dass die Abteilung , auf die man sich bezieht, das Geschlecht verursacht . Geschlecht ist inhärent richtig? Ja und nein Miettenen plädiert für einen "Study Base" -Ansatz für solche Probleme: Wer ist die Bevölkerung? Es sind nicht alle teilnahmeberechtigten Studenten, die sich speziell für Berkeley bewerben. Die wettbewerbsfähigeren Abteilungen haben die Frauen angezogen, sich bei Berkeley zu bewerben, wenn sie sich nicht anders beworben hätten. Zu erweitern: Eine Frau, die zutiefst intelligent ist, möchte zum Beispiel in das beste Ingenieurprogramm einsteigen. Wenn Berkeley kein großartiges Ingenieurprogramm gehabt hätte, hätte sie sich sowieso nicht bei Berkeley beworben, sie hätte sich beim MIT oder bei CalPoly beworben. In diesem Licht verursacht die "bewerbende Studenten" -Population, Abteilung Geschlecht und ist ein Störfaktor. (Einschränkung: Ich bin ein Student der ersten Generation, weiß also nicht viel darüber, welche Programme für was bekannt sind).

Wie fassen wir diese Daten zusammen? Es ist wahr, dass Berkeley eher einen Mann zuließ, der sich bewarb, als eine Frau. Und es ist wahr, dass die Abteilungen von Berkeley eher Frauen als Männer zuließen. Rohe und geschichtete RRs sind sinnvolle Maßnahmen, auch wenn sie nicht kausal sind. Dies unterstreicht, wie wichtig es ist, mit unserer Formulierung als Statistiker genau umzugehen (der bescheidene Autor nimmt sich nicht an, im entferntesten genau zu sein).

Confounding ist ein Phänomen, das sich von der Nicht-Kollabierbarkeit unterscheidet, einer anderen Form der ausgelassenen variablen Verzerrung, von der jedoch bekannt ist, dass sie mildere Auswirkungen auf Schätzungen hat. Im Gegensatz zur logistischen Regression führt die Nichtkollapsibilität nicht zu einer Verzerrung der linearen Regression, und die Berücksichtigung einer Kontinuität in Gelmans Beispiel hätte genauer beschrieben werden müssen.

Andrews Interpretation des Geschlechtskoeffizienten in seinem geschlechts- / höhenbereinigten Einkommensmodell zeigt die Art der Modellannahmen: die Annahme der Linearität. Tatsächlich werden im linearen Modell solche Vergleiche zwischen Männern und Frauen ermöglicht, da wir für eine bestimmte Frau Vorhersagen treffen könnenWas für eine ähnliche Größe Männchen verdient haben kann, auch wenn er nicht beobachtet wurde. Dies ist auch der Fall, wenn man Effektmodifikationen zulässt, so dass sich die Tendenz bei Frauen von der bei Männern unterscheidet. Andererseits finde ich es nicht so verrückt, sich Männer und Frauen gleicher Größe vorzustellen, 66 Zoll wären in der Tat eine große Frau und ein kleiner Mann. Es scheint mir eher eine milde Projektion als eine grobe Extrapolation zu sein. Da die Modellannahmen klar angegeben werden können, kann der Leser besser verstehen, dass der geschlechtsspezifische Zusammenhang zwischen Einkommen und Körpergröße Informationen enthält, die über verschiedene Länder geliehen oder zwischen diesen gemittelt werdenProben von Männern und Frauen. Wäre eine solche Assoziation der Gegenstand einer Schlussfolgerung, würde der ernsthafte Statistiker offensichtlich die Möglichkeit einer Effektmodifikation in Betracht ziehen.

— AdamO
quelle

2

Tolle Diskussion. Als Statistiker ärgert es mich ohne Ende, wenn Leute über die Ergebnisse einer Studie sprechen, aber nicht sicher sind, ob sie über marginale oder bedingte Effekte sprechen.

— Cliff AB

1

"Warum zum Beispiel einen Mann und eine Frau vergleichen, die beide 66 Zoll groß sind? Das wäre ein Vergleich eines kleinen Mannes mit einer großen Frau. "

Das Modell geht davon aus, dass das Einkommen von Geschlecht und Größe abhängt. Die Art und Weise, in der die Körpergröße ein höheres Einkommen generiert, ist jedoch für Männer und Frauen möglicherweise nicht gleich. Frauen können als "groß genug" in einer Größe angesehen werden, für die ein Mann immer noch als klein gilt.

Es kann nützlich sein, das Modell auf folgende Weise zu vereinfachen.

Angenommen, Sie möchten die Wahrscheinlichkeit einer Anstellung als Verkäufer in großen Bekleidungsgeschäften verringern, und ziehen Sie die folgende Identifikationsstrategie in Betracht.

Sie stellen fest, dass Arbeitgeber mit größerer Wahrscheinlichkeit Arbeitnehmer einstellen, die eine bestimmte Mindestgröße erfüllen, wobei sich das "Minimum" nach dem Geschlecht richtet.

Anstatt die Größe in cm zu messen, nehmen wir an, dass zwei Schwellenwerte existieren, die definieren, bei welcher Größe ein Mann und eine Frau "groß" sind:> = 180 cm für Männer und> = 170 cm für Frauen.

Unter der Annahme, dass die Schwellenwerte in der Realität vorhanden sind (dh Arbeitgeber machen einen deutlichen Unterschied zwischen der Größe von Frauen und 169 cm oder 171 cm) und dass sie die richtigen sind, können Sie einen Dummy erstellen, der große / kleine Männer und Frauen definiert. Männer und Frauen unterschiedlicher Größe fallen möglicherweise immer noch in dieselbe Kategorie Ihres Dummys, und gleichzeitig entspricht Ihr Maß der tatsächlichen Dynamik auf dem jeweiligen Arbeitsmarkt.

— Caserio
quelle

-1

Würden Sie (mit klareren Worten) sagen, dass der typische Geschlechterkampf, dass Männer mehr Chancen als Frauen haben, da ihr Einkommen um p% höher ist, paradoxerweise voreingenommen wäre?

Vielleicht ist das ein Punkt. Wir neigen dazu, Dinge so zu sehen, wie sie aussehen, und die zugrunde liegenden Implikationen nicht zu analysieren.

Um über das Simpson-Paradoxon hinauszugehen, müssten wir die Frage beantworten: "Wie viel mehr Geld bringt eine Frau dazu, im Vergleich zu einem Mann die gleiche Menge an unvoreingenommener Arbeit zu leisten?" dann könnte jemand sagen, dass sie schwanger sein und Kinder mehr erziehen müssen als ihre Amtskollegen, was aber wichtig ist, dass man nur seufzt, wenn man sagt: "Frauen haben eben weniger Chancen, weil sie Frauen sind" und ein tiefgreifendes Gefühl Eine Analyse mit bedingten Statistiken würde dazu führen, dass im Wesentlichen Chancengleichheit besteht und es sich um andere Faktoren handelt, die nicht mit dem Geschlecht zusammenhängen.

— Javier Bañez
quelle

Es kann nützlich sein zu verstehen, dass eine solche Analyse nicht unbedingt kausal oder erklärend sein muss, sondern das vorhandene Phänomen beschreibt.

— AdamO