Ich habe eine methodische Frage und daher ist kein Beispieldatensatz beigefügt.
Ich plane eine an den Neigungsscore angepasste Cox-Regression, mit der untersucht werden soll, ob ein bestimmtes Medikament das Risiko eines Ergebnisses verringert. Die Studie ist eine Beobachtungsstudie mit 10.000 Personen.
Der Datensatz enthält 60 Variablen. Ich schätze, dass 25 davon die Behandlungszuordnung beeinflussen könnten. Ich würde niemals alle 25 in einer Cox-Regression anpassen, aber ich habe gehört, dass Sie so viele Variablen als Prädiktoren in eine Neigungsbewertung aufnehmen können und dann nur die Unterklasse der Neigungsbewertung und die Behandlungsvariable in die Cox-Regression einbeziehen können.
(Kovariaten, die nach der Anpassung des Prop-Scores nicht gleich sind, müssten natürlich in die Cox-Regression einbezogen werden).
Fazit: Ist es wirklich klug, so viele Prädiktoren in die Requisitenbewertung einzubeziehen?
@ Dimitriy V. Masterov Vielen Dank, dass Sie diese wichtigen Fakten geteilt haben. Im Gegensatz zu Büchern und Artikeln, die andere Regressionsrahmen berücksichtigen, sehe ich in Propensity-Score-Analysen keine (Rosenbaums Buch) Richtlinien zur Modellauswahl. Während Standardlehrbücher / Übersichtsartikel immer eine strenge Variablenauswahl zu empfehlen und die Anzahl der Prädiktoren niedrig zu halten scheinen, habe ich in Prop-Score-Analysen nicht viel von dieser Diskussion gesehen. Sie schreiben: (1) "Theoretische Einsicht, institutionelles Wissen und gute Forschung sollten die Auswahl von Xs leiten.". Ich stimme zu, aber es gibt Umstände, unter denen wir eine Variable zur Hand haben und nicht wirklich wissen (aber es könnte möglich sein), ob die Variable entweder die Behandlungszuordnung oder das Ergebnis beeinflusst. Zum Beispiel: Sollte ich die Nierenfunktion als Maß für die Filtrationsrate in einen Prop-Score einbeziehen, um die Statinbehandlung anzupassen? Die Statinbehandlung hat nichts mit der Nierenfunktion zu tun, und ich habe bereits eine Reihe von Variablen aufgenommen, die die Statinbehandlung beeinflussen. Aber es ist immer noch verlockend, die Nierenfunktion einzubeziehen. es könnte sich noch mehr anpassen. Nun würden einige sagen, dass es aufgenommen werden sollte, weil es das Ergebnis beeinflusst, aber ich könnte Ihnen ein anderes Beispiel (wie die binäre Variable Leben in Stadt / Land) für eine Variable geben, die, soweit wir wissen, weder die Behandlung noch das Ergebnis beeinflusst. Aber ich würde es gerne aufnehmen, solange es nicht geht. t die Genauigkeit der Requisitenbewertung beeinflussen. (2)"Die Einbeziehung von Xs, die von der Behandlung betroffen sind, entweder nachträglich oder vorab im Vorgriff auf die Behandlung, macht die Annahme ungültig." Ich bin mir nicht sicher, was du hier meinst. Wenn ich jedoch die Wirkung von Statinen auf das kardiovaskuläre Ergebnis untersuche, werde ich verschiedene Messungen von Blutfetten in den Neigungswert einbeziehen. Blutfette werden durch die Behandlung beeinflusst. Ich glaube, ich habe diese Aussage falsch verstanden.
@statsRus, vielen Dank, dass Sie uns die Fakten mitgeteilt haben, insbesondere das, was Sie als "Hinweis zur Auswahl von Eingaben" bezeichnen. Ich denke, ich begründe genauso wie Sie.
Leider diskutieren Prop-Score-Methoden verschiedene Anpassungsstrategien anstelle von Modellauswahlstrategien. Vielleicht ist die Modellanpassung nicht wichtig. Wenn dies der Fall ist, würde ich jede verfügbare Variable anpassen, die das Ergebnis und die Behandlungszuordnung am geringsten beeinflussen könnte. Ich bin kein Statistiker, aber wenn die Modellanpassung keine Rolle spielt, möchte ich alle Variablen anpassen, die die Behandlungszuordnung und das Behandlungsergebnis beeinflussen könnten. Dies würde in vielen Fällen bedeuten, Variablen einzubeziehen, die durch die Behandlung beeinflusst werden.
Darüber hinaus schlagen einige Leute vor, dass die nachfolgende Cox-Regression nur die Behandlungsvariable und die Prop-Score-Unterklasse umfassen sollte. Während andere vorschlagen, dass die Cox-Anpassung den Prop-Score zusätzlich zu allen anderen Variablen, für die Sie sich anpassen würden, enthalten sollte.