Gewichtung des Neigungsscores bei der Cox-PH-Analyse und der kovariaten Auswahl


10

In Bezug auf die Neigungsbewertung (IPTW) bei der Cox-Proportional-Hazard-Modellierung von Überlebensdaten für die Zeit bis zum Ereignis:

Ich habe prospektive Registrierungsdaten, bei denen wir daran interessiert sind, den Behandlungseffekt eines Medikaments zu untersuchen, das die Patienten in den meisten Fällen bereits zu Studienbeginn eingenommen haben. Ich bin mir daher nicht sicher, wie ich die Daten am besten analysieren soll. Möglicherweise werden einige der Basisvariablen in erheblichem Maße von der Behandlung beeinflusst und nicht umgekehrt (z. B. bestimmte Biomarker). Ich bin ein bisschen verloren, welche Kovariaten ich in das Propensity-Score-Modell zur Schätzung von Gewichten aufnehmen sollte und welche Kovariaten ich als Kovariaten in das coxphModell aufnehmen sollte (falls überhaupt). Hinweise in die richtige Richtung wären hilfreich! Bisher konnte ich in der CoxPh-Modellierung noch keine Literatur dazu finden.

Ich denke, dass Kovariaten, die zu Studienbeginn eingeleitete Behandlungen darstellen, die das Ergebnis (möglicherweise) beeinflussen, als Cox-PH-Kovariaten aufgenommen werden sollten, aber ich bin mir nicht sicher.

Wie bestimme ich, welche Variablen als Kovariaten in das Cox-Modell aufgenommen werden sollen, anstatt zur Berechnung der Neigungsbewertungsgewichte verwendet zu werden?


Zusatzfrage:

Ich verstehe das ererbte Problem der Bewertung eines Behandlungseffekts einer bestimmten Intervention, die bereits begonnen hat - dh bei den Patienten vor Beginn der Beobachtung vorherrscht. Sowohl in Bezug auf die Einführung einer Verzerrung in Bezug auf die zeitliche Variation des Risikos (z. B. Nebenwirkungen, die im ersten Therapiejahr häufiger auftreten) als auch in Bezug auf Kovariaten, die von der Behandlung betroffen sind. Wenn ich mich nicht irre - dies wurde als Ursache für die Diskrepanz zwischen Beobachtung und Randomisierung in Bezug auf kardiovaskuläre Endpunkte und Hormonersatztherapie vorgeschlagen. In meinem Datensatz hingegen sind wir daran interessiert, mögliche nachteilige Auswirkungen der Behandlung zu untersuchen.

Wenn ich die Neigungs-Score-Anpassung verwende, um den Behandlungseffekt bei vorherrschenden Anwendern zu untersuchen, dh das Medikament bereits vor Beginn der Beobachtung in Kohortendaten zu verwenden, und wir einen nachteiligen Effekt einer pharmakologischen Therapie beobachten (und das ist, wonach wir gesucht haben). Kann ich ausschließen, dass das mit der Behandlung verbundene Risiko möglicherweise überschätzt wird? Dh solange das Risiko signifikant erhöht ist, ist es "definitiv" nicht schützend?

Ich kann mir kein Beispiel vorstellen, bei dem diese Art von Voreingenommenheit in diesem Zusammenhang zu einer Überschätzung des Risikos einer falschen Risikoassoziation führen kann.

Antworten:


8

Theoretisch muss jede Variable, die Sie als Teil des Neigungsbewertungsgewichts auswählen, nicht als Kovariate in das Modell aufgenommen werden, da die Gewichtung bereits auf ihre mögliche Verwechslung hin kontrolliert wurde. Mit einem geeigneten Gewichtungsmodell können Sie buchstäblich nur den Effekt der Belichtung modellieren.

Abgesehen davon gibt es Gründe, warum Sie Begriffe in das Modell aufnehmen möchten:

  • "Doppelt robuste" Schätzungen. Abgesehen von einem Genauigkeitsverlust gibt es keinen Grund, dass Sie Variablen nicht sowohl im Gewichtungsmodell als auch als Kovariaten verwenden können. Theoretisch schützen Sie sich vor zwei möglichen Verwechslungen (daher wird diese Technik als "doppelt robust" bezeichnet). Denken Sie daran, dass dies Sie nur vor einer Fehlspezifikation des PS-Modells oder des Kovariatenmodells schützt, indem Sie eine "zweite Chance" erhalten, das richtige Modell anzugeben. Es ist kein magisches Allheilmittel.
  • Mehrere Schätzungen von Interesse. Durch die Gewichtung verschwinden die Effektschätzungen aus den Kovariaten. Wenn Sie einen Regressionskoeffizienten für die Variable wünschen, möchten Sie ihn als Kovariate in den CoxPH-Schritt und nicht in das PS-Modell aufnehmen.

Wenn Sie in Zeitschriften wie Epidemiology oder The American Journal of Epidemiology sowie in der biostatistischen Literatur nach "doppelt robusten" und ähnlichen Begriffen suchen , sollten Sie einige nützliche Quellen aufdecken.


Vielen Dank für eine (schnelle) und klare Antwort! Ich habe gesehen, wie doppelt robust erwähnt wurde, habe aber zu viel darüber nachgedacht. Ich werde es jetzt definitiv tun. Würden Sie sagen, dass die Verwendung doppelt robuster Schätzungen gerechtfertigt ist, wenn die Kovariaten nach der Gewichtung (z. B.) immer noch signifikanter Unterschiede zwischen den Behandlungsgruppen nicht angemessen angepasst werden?
Kjetil Loland

1
@KjetilLoland Dies kann ein Grund sein, eine doppelt robuste Schätzung zu verwenden. Im Allgemeinen sollten Sie sich ansehen, wann immer Sie befürchten, dass eine Methode zur Steuerung von Variablen unter einer Fehlspezifikation leidet. Ich würde auch überprüfen, ob Ihr PS-Modell nicht funktioniert und Ihnen nette, überlappende Neigungswerte zwischen den beiden Gruppen liefert.
Fomite

1
Aufgrund der Nichtkollabierbarkeit der Hazard Ratio ist es nicht ausreichend, nur die Variablen in das PS aufzunehmen. Es ist üblich, die PS die "Küchenspüle" einschließen zu lassen und die bekannten wichtigsten Prädiktoren wieder als Kovariaten einzubeziehen. Dies verhindert eine Unterschätzung des Gefährdungsverhältnisses der Exposition.
Frank Harrell

Nochmals vielen Dank an @EpiGrad und Frank für Ihre Antworten. Ich kann nicht genau sagen, dass die Behandlungsgruppen schöne, überlappende Neigungswerte haben. Daher würde ich wahrscheinlich eine umfassende Anpassung der Kovariate verwenden. Nebenbei bemerkt, ich habe bemerkt, dass ich IPTW geschrieben habe, obwohl ich tatsächlich das Twang-Paket verwende - das eine generalisierte verstärkte Regression verwendet, um Gewichte zu schätzen (wenn ich recht habe) -, aber ich denke, das ändert nichts am allgemeinen Ansatz viel.
Kjetil Loland

@KjetilLoland Sie können zumindest visuell überprüfen, ob sich Ihre PS-Werte überschneiden, indem Sie sich überlappende Diagramme ihrer Verteilung nach Behandlungsgruppen ansehen.
Fomite

3

Es ist wichtig, zwischen "von der Behandlung betroffen" und "mit der Behandlung verbunden" zu unterscheiden. Letzteres kann Behandlungsauswahlfaktoren umfassen, wie diejenigen, die wir mit Neigung und / oder kovariater Anpassung anpassen möchten. "Von der Behandlung betroffen" impliziert, dass die Kovariaten nach dem Zeitpunkt Null gemessen werden (z. B. nach Randomisierung oder nach Beginn der Behandlung), was bedeutet, dass sie selten verwendet werden sollten.


Nochmals vielen Dank, Dr. Harrell. Einige unserer Variablen sind definitiv "von der Behandlung betroffen". Die Behandlung, die wir untersuchen möchten, wurde vor Beginn der Studie eingeleitet, was natürlich nicht ideal ist. Ob die Anpassung des Neigungsscores überhaupt für diese Art der Analyse geeignet ist oder nicht, ist vielleicht eine bessere Frage. Mir ist jedoch kein anderer Weg bekannt, dies zu untersuchen.
Kjetil Loland

Das Studiendesign ist möglicherweise nicht für das geeignet, was Sie tun möchten. Die Studie wird sehr schwer zu interpretieren sein. Sie könnten Fachexperten dazu bringen, zu versuchen, eine Teilmenge von Variablen zu finden, die sich höchstwahrscheinlich nicht mit der Behandlung ändern, aber die Anpassung für implizite Verwechslungen kann unvollständig sein.
Frank Harrell

Aha. Ich denke, dies sieht ein bisschen aus wie die alten Beobachtungs- und randomisierten HRT-Studien zu CVD. Korrigieren Sie mich, wenn ich falsch liege, aber nicht alles, was ich "riskiere", um das Risiko eines möglichen nachteiligen Behandlungseffekts zu unterschätzen (wonach wir suchen) - dh solange wir zeigen, dass die Behandlung nachteilig ist, diese Art von Störfaktoren konnten den Befund nur schwächen? Ich habe die Frage entsprechend aktualisiert.
Kjetil Loland

2
Dies ist mehr als ein Beobachtungs- oder randomisiertes Problem, aber es besteht ein Zusammenhang mit HRT-Studien. Sie haben vielleicht Recht, dass eine sorgfältige Überlegung es rechtfertigen könnte, die Ergebnisse als Untergrenze zu behandeln.
Frank Harrell
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.