Passen Sie alles an, was Sie in der Neigungsbewertung haben?

9

Ich habe eine methodische Frage und daher ist kein Beispieldatensatz beigefügt.

Ich plane eine an den Neigungsscore angepasste Cox-Regression, mit der untersucht werden soll, ob ein bestimmtes Medikament das Risiko eines Ergebnisses verringert. Die Studie ist eine Beobachtungsstudie mit 10.000 Personen.

Der Datensatz enthält 60 Variablen. Ich schätze, dass 25 davon die Behandlungszuordnung beeinflussen könnten. Ich würde niemals alle 25 in einer Cox-Regression anpassen, aber ich habe gehört, dass Sie so viele Variablen als Prädiktoren in eine Neigungsbewertung aufnehmen können und dann nur die Unterklasse der Neigungsbewertung und die Behandlungsvariable in die Cox-Regression einbeziehen können.

(Kovariaten, die nach der Anpassung des Prop-Scores nicht gleich sind, müssten natürlich in die Cox-Regression einbezogen werden).

Fazit: Ist es wirklich klug, so viele Prädiktoren in die Requisitenbewertung einzubeziehen?

@ Dimitriy V. Masterov Vielen Dank, dass Sie diese wichtigen Fakten geteilt haben. Im Gegensatz zu Büchern und Artikeln, die andere Regressionsrahmen berücksichtigen, sehe ich in Propensity-Score-Analysen keine (Rosenbaums Buch) Richtlinien zur Modellauswahl. Während Standardlehrbücher / Übersichtsartikel immer eine strenge Variablenauswahl zu empfehlen und die Anzahl der Prädiktoren niedrig zu halten scheinen, habe ich in Prop-Score-Analysen nicht viel von dieser Diskussion gesehen. Sie schreiben: (1) "Theoretische Einsicht, institutionelles Wissen und gute Forschung sollten die Auswahl von Xs leiten.". Ich stimme zu, aber es gibt Umstände, unter denen wir eine Variable zur Hand haben und nicht wirklich wissen (aber es könnte möglich sein), ob die Variable entweder die Behandlungszuordnung oder das Ergebnis beeinflusst. Zum Beispiel: Sollte ich die Nierenfunktion als Maß für die Filtrationsrate in einen Prop-Score einbeziehen, um die Statinbehandlung anzupassen? Die Statinbehandlung hat nichts mit der Nierenfunktion zu tun, und ich habe bereits eine Reihe von Variablen aufgenommen, die die Statinbehandlung beeinflussen. Aber es ist immer noch verlockend, die Nierenfunktion einzubeziehen. es könnte sich noch mehr anpassen. Nun würden einige sagen, dass es aufgenommen werden sollte, weil es das Ergebnis beeinflusst, aber ich könnte Ihnen ein anderes Beispiel (wie die binäre Variable Leben in Stadt / Land) für eine Variable geben, die, soweit wir wissen, weder die Behandlung noch das Ergebnis beeinflusst. Aber ich würde es gerne aufnehmen, solange es nicht geht. t die Genauigkeit der Requisitenbewertung beeinflussen. (2)"Die Einbeziehung von Xs, die von der Behandlung betroffen sind, entweder nachträglich oder vorab im Vorgriff auf die Behandlung, macht die Annahme ungültig." Ich bin mir nicht sicher, was du hier meinst. Wenn ich jedoch die Wirkung von Statinen auf das kardiovaskuläre Ergebnis untersuche, werde ich verschiedene Messungen von Blutfetten in den Neigungswert einbeziehen. Blutfette werden durch die Behandlung beeinflusst. Ich glaube, ich habe diese Aussage falsch verstanden.

@statsRus, vielen Dank, dass Sie uns die Fakten mitgeteilt haben, insbesondere das, was Sie als "Hinweis zur Auswahl von Eingaben" bezeichnen. Ich denke, ich begründe genauso wie Sie.

Leider diskutieren Prop-Score-Methoden verschiedene Anpassungsstrategien anstelle von Modellauswahlstrategien. Vielleicht ist die Modellanpassung nicht wichtig. Wenn dies der Fall ist, würde ich jede verfügbare Variable anpassen, die das Ergebnis und die Behandlungszuordnung am geringsten beeinflussen könnte. Ich bin kein Statistiker, aber wenn die Modellanpassung keine Rolle spielt, möchte ich alle Variablen anpassen, die die Behandlungszuordnung und das Behandlungsergebnis beeinflussen könnten. Dies würde in vielen Fällen bedeuten, Variablen einzubeziehen, die durch die Behandlung beeinflusst werden.

Darüber hinaus schlagen einige Leute vor, dass die nachfolgende Cox-Regression nur die Behandlungsvariable und die Prop-Score-Unterklasse umfassen sollte. Während andere vorschlagen, dass die Cox-Anpassung den Prop-Score zusätzlich zu allen anderen Variablen, für die Sie sich anpassen würden, enthalten sollte.

— Adam Robinsson
quelle

8

Ich persönlich habe diese Frage seit mindestens 5 Jahren gestellt, da es für mich die "große" praktische Frage ist, wie man den Neigungswertabgleich für Beobachtungsdaten verwendet, um kausale Effekte abzuschätzen. Dies ist eine hervorragende Frage, und es gibt eine subtile Meinungsverschiedenheit, die tief in der Statistik im Vergleich zu Informatik-Communities liegt.

Nach meiner Erfahrung befürworten Statistiker eher das "Werfen des Spülbeckens" beobachtbarer Eingaben in die Schätzung des Neigungswerts, während Informatiker eher einen theoretischen Grund für die Eingaben befürworten (obwohl Statistiker gelegentlich die Bedeutung der Theorie für die Rechtfertigung der Auswahl von erwähnen Eingaben in das Propensity-Score-Modell). Der Unterschied ergibt sich meines Erachtens aus der Tatsache, dass Informatiker (insbesondere Judea Pearl) dazu neigen, in Bezug auf gerichtete azyklische Graphen kausal zu denken. Wenn Sie die Kausalität durch gerichtete azyklische Graphen betrachten, ist es ziemlich leicht zu erkennen, dass Sie eine sogenannte "Collider" -Variable bedingen können, die Backdoor-Pfade "entsperren" und tatsächlich zu einer Verzerrung Ihrer Einschätzung eines kausalen Effekts führen kann.

Mein Essen zum Mitnehmen? Wenn Sie eine solide Theorie darüber haben, was die Auswahl in der Behandlung beeinflusst, verwenden Sie diese in der Neigungsbewertung. Führen Sie dann eine Sensitivitätsanalyse durch, um festzustellen, wie empfindlich Ihre Schätzung für nicht beobachtete verwirrende Variablen ist. Wenn Sie fast keine Theorie haben, die Sie leiten könnte, werfen Sie das "Spülbecken" hinein und führen Sie dann eine Sensitivitätsanalyse durch.

Ein Hinweis zur Auswahl von Eingaben für das Propensity-Score-Modell (dies mag offensichtlich sein, aber es ist erwähnenswert für andere, die mit der Abschätzung der kausalen Auswirkungen anhand von Beobachtungsdaten nicht vertraut sind): Kontrollieren Sie nicht nach Nachbehandlungsvariablen. Das heißt, Sie möchten, dass Ihre Eingaben im Propensity-Score-Modell vor der Behandlung und Ihr Ergebnis nach der Behandlung gemessen werden. In Beobachtungsdaten bedeutet dies praktisch, dass Sie drei Datenwellen mit einem detaillierten Satz von Kovariatengrundlinien, der in der zweiten Welle gemessenen Behandlung und dem in der letzten Welle gemessenen Ergebnis benötigen.

— statsRus
quelle

Dies ist ein kürzlich veröffentlichtes Papier, das sich mit dem Problem der Konditionierung einer Collider-Variablen befasst (ihr Papier legt nahe, dass die M-Verzerrung wahrscheinlich gering ist, was dem Ansatz der "Küchenspüle", Eingaben in das Propensity-Score-Modell zu werfen, Glaubwürdigkeit verleiht: arxiv.org/abs /1408.0324

— statsRus

7

In Ermangelung von Fachwissen ist die Übereinbeziehung von Variablen im Allgemeinen besser als die Untereinbeziehung, und es gibt wenig Grund, eine Modellauswahl zu treffen, um eine PS zu erstellen. Wichtiger ist es, ein flexibles Modell zu erstellen. Mein Standardansatz besteht darin, jede kontinuierliche Variable zu spinnen und nicht auf Werte für Variablen im PS zu achten , dh ich verwende ein flexibles additives logistisches Regressionsmodell. $P$

Es gibt viele Vorteile der kovariaten Anpassung mit dem logit PS. Normalerweise verzahne ich das Logit von PS so, dass es als Anpassungsvariable mit mehreren Freiheitsgraden aufgenommen wird, nachdem ich die Due Diligence in Bezug auf nicht überlappende Regionen durchgeführt habe. Siehe http://www.citeulike.org/user/harrelfe/article/13340175 und http://www.citeulike.org/user/harrelfe/article/13265389 und weitere Artikel unter http://www.citeulike.org/ user / harrelfe / tag / propensity-score .

Sie müssen sicher sein, dass Sie als separate Kovariaten auch die wahrscheinlich starken Prädiktoren von einbeziehen, da PS nur zur Anpassung der Verzerrung und nicht zur Erfassung der Heterogenität der Ergebnisse dient. $Y$

Ich bezweifle jede Übereinstimmungsmethode, die dazu führt, dass übereinstimmende Beobachtungen verworfen werden oder die stark von der Datensatzreihenfolge abhängt. Verworfene Beobachtungen haben viel darüber zu sagen, wie kovariate Effekte geschätzt werden sollten.

— Frank Harrell
quelle

Die Links sind defekt. Können Sie bitte erklären, welche Vorteile die Verwendung von PS-Logit anstelle von Roh-PS für den Abgleich bietet?

— DS_Enthusiast

Für das Matching spielt es keine Rolle. Ich empfehle jedoch, kein Matching zu verwenden.

— Frank Harrell

3

$X$

$X$ $X$ im Vorgriff auf die Behandlung wird die Annahme ungültig. Wenn ein Agent beispielsweise weiß, dass der Impfstoff kommt, kann er sein Verhalten vor dem Schuss anpassen. Das Einbeziehen von Instrumenten - Variablen, die die Teilnahme und nicht die Ergebnisse beeinflussen - ist ebenfalls eine schlechte Idee. Sie helfen nicht bei der Auswahlverzerrung und können das Support-Problem drastisch verschlimmern. Wenn zum Beispiel einige Menschen ermutigt werden, sich einer Behandlung zu unterziehen, möchten Sie dies nicht bedingen. Die Einbeziehung irrelevanter Variablen in die Neigungsbewertungsspezifikation kann die Varianz erhöhen, da entweder einige behandelte Variablen aus der Analyse verworfen werden müssen oder Steuereinheiten mehr als einmal verwendet werden müssen oder weil die Bandbreite zunehmen muss. Kurz gesagt, der Ansatz der Küchenspüle wird definitiv nicht empfohlen.

Die CIA kann nicht ohne experimentelle Daten oder "überidentifizierende" Annahmen getestet werden (wie im Fall des Vorprogrammtests oder anderer falscher Placebo-Tests). Wenn Sie genügend historische Daten haben, würde ich letztere auf jeden Fall auf Ihrem sorgfältig kuratierten Set ausprobieren.

Antwort zum Bearbeiten:
Ich kann die Nieren nicht kommentieren, da diese zu weit außerhalb meines Bereichs liegen (außer Kuchen, von denen ich etwas weiß). Urban scheint eine Variable zu sein, die sowohl die Teilnahme als auch das Ergebnis durch die Kosten beeinflusst, die mit der Reise zum Krankenhaus zur Behandlung und Untersuchung verbunden sind. Es könnte einige der nicht beobachtbaren Dinge aufnehmen, die uns nachts wach halten. Die Vorfreude, die ich im Sinn habe, ist, dass Menschen ihr Verhalten anpassen können, wenn sie wissen, dass sie in Zukunft behandelt werden, beispielsweise durch eine Änderung ihrer Ernährung.

— Dimitriy V. Masterov
quelle

2

Da das Propensity-Score-Modell rein prädiktiv ist - Sie interessieren sich nicht für Koeffizienten -, habe ich es immer verstanden, als Sie alle Ihre Variablen einfließen lassen können, die sowohl den Kohorteneintritt als auch das Ergebnis beeinflussen. Sie können diese Variablen beliebig verdrehen - quadrieren, wurzeln, alle Arten von Interaktionen usw. usw. -, solange Sie die Vorhersagequalität Ihres Modells erhöhen.

Theoretisch sollten Sie sich nicht einmal um Hold-out-Daten für Ihr Vorhersagemodell kümmern müssen, da Sie diese Ergebnisse nicht über Ihre Stichprobe hinaus verallgemeinern möchten (im Grunde ist das Risiko einer Überanpassung kein Problem). Schließlich müssen Sie sich nicht auf logistische Regression beschränken. Wenn Sie eine binäre Ausgabe modellieren, können Sie sogar ein GAM-Modell verwenden - im Grunde alles, um die Vorhersageraten zu verbessern.

(Ich muss @statsRus 'Verwendungshinweis als gegenteiligen Hinweis hinzufügen: Nach meiner Erfahrung verwenden die Informatiker alle Variablen, während die Statistiker jede sorgfältig prüfen. Ich denke, unterschiedliche Arbeitshintergründe führen zu unterschiedlichen Arbeitsgewohnheiten.)

Es wird generell davon abgeraten, die Punktzahl als Kovariate zu verwenden - sie hat weniger Auswirkungen - und sicherlich nicht neben den Variablen, die zur Erstellung der Bewertungsvariablen verwendet werden. Ein Argument könnte vorgebracht werden, wenn Sie in der Neigungsbewertung eine kontinuierliche Variable - beispielsweise das Alter - kategorisiert haben, in der Sie dann möglicherweise die kontinuierliche Version in das Modell aufnehmen, die Variable jedoch nicht an erster Stelle kategorisieren ...

Die Verwendung der Punktzahl für das Matching (mit Bremssätteln - insbesondere mit variablem 1: N-Matching) ist beliebt, aber ich glaube, die wirkungsvollste Technik ist das inverse proportionale Behandlungsgewicht (IPTW) - obwohl ich diese Methode nicht verwendet habe und mich nicht erinnern kann, wie Es klappt.

Schauen Sie sich Peter C. Austins Arbeit an der Universität von Toronto an - er hat eine Menge Artikel über Neigungswerte geschrieben. Hier ist zum Beispiel eine zum Matching .

— streift
quelle