Ich werde versuchen, Ihnen ein intuitives Verständnis mit minimalem Schwerpunkt auf der Mathematik zu vermitteln.
Das Hauptproblem bei Beobachtungsdaten und daraus resultierenden Analysen ist verwirrend. Verwirrung tritt auf, wenn eine Variable nicht nur die zugewiesene Behandlung, sondern auch die Ergebnisse beeinflusst. Wenn ein randomisiertes Experiment durchgeführt wird, werden die Probanden nach Behandlungen randomisiert, so dass die jeder Behandlung zugewiesenen Probanden im Durchschnitt in Bezug auf die Kovariaten (Alter, Rasse, Geschlecht usw.) ähnlich sein sollten. Aufgrund dieser Randomisierung ist es unwahrscheinlich (insbesondere bei großen Stichproben), dass Unterschiede im Ergebnis auf Kovariaten zurückzuführen sind, jedoch auf die angewandte Behandlung, da die Kovariaten in den Behandlungsgruppen im Durchschnitt ähnlich sind.
Andererseits gibt es bei Beobachtungsdaten keinen zufälligen Mechanismus, der Probanden Behandlungen zuordnet. Nehmen Sie zum Beispiel eine Studie, um die Überlebensraten von Patienten nach einer neuen Herzoperation im Vergleich zu einem chirurgischen Standardverfahren zu untersuchen. Normalerweise kann man Patienten aus ethischen Gründen nicht für jedes Verfahren randomisieren. Infolgedessen wählen sich Patienten und Ärzte selbst für eine der Behandlungen aus, häufig aus einer Reihe von Gründen, die mit ihren Kovariaten zusammenhängen. Zum Beispiel könnte das neue Verfahren etwas riskanter sein, wenn Sie älter sind, und infolgedessen könnten Ärzte jüngeren Patienten die neue Behandlung häufiger empfehlen. Wenn dies passiert und Sie sich die Überlebensraten ansehen, scheint die neue Behandlung möglicherweise effektiver zu sein. Dies wäre jedoch irreführend, da jüngere Patienten dieser Behandlung zugewiesen wurden und jüngere Patienten tendenziell länger leben. alles andere ist gleich. Hier bieten sich Neigungswerte an.
Propensity Scores helfen bei dem grundsätzlichen Problem der kausalen Inferenz - dass Sie aufgrund der Nicht-Randomisierung der behandelten Probanden möglicherweise Verwirrung stiften und dies möglicherweise die Ursache für die "Effekte" ist, die Sie sehen, und nicht die Intervention oder Behandlung allein. Wenn Sie Ihre Analyse irgendwie so ändern könnten, dass die Kovariaten (z. B. Alter, Geschlecht, Geschlecht, Gesundheitszustand) zwischen den Behandlungsgruppen „ausgewogen“ sind, hätten Sie starke Beweise dafür, dass der Unterschied in den Ergebnissen auf die Intervention / Behandlung zurückzuführen ist eher als diese Kovariaten. Die Neigungsbewertungen bestimmen die Wahrscheinlichkeit jedes Probanden, der Behandlung zugeordnet zu werden, die es angesichts der beobachteten Kovariten erhalten hat. Wenn Sie dann mit diesen Wahrscheinlichkeiten übereinstimmen (Neigungswerte),
Sie fragen sich vielleicht, warum die Kovariaten nicht genau übereinstimmen (z. B. stellen Sie sicher, dass Sie 40-jährige Männer bei guter Gesundheit in Behandlung 1 mit 40-jährigen Männern bei guter Gesundheit in Behandlung 2 übereinstimmen)? Dies funktioniert gut für große Stichproben und einige wenige Kovariaten, ist jedoch nahezu unmöglich, wenn die Stichprobengröße klein und die Anzahl der Kovariaten sogar mäßig groß ist (siehe den Fluch der Dimensionalität bei Cross-Validated, warum dies der Fall ist). .
Nun, all dies gesagt, ist die Achillesferse der Neigungsbewertung die Annahme, dass keine unbeobachteten Störfaktoren auftreten. Diese Annahme besagt, dass Sie keine Kovariaten in Ihre Anpassung einbezogen haben, die potenzielle Störfaktoren darstellen. Intuitiv ist der Grund dafür, dass Sie sich darauf einstellen können, wenn Sie bei der Erstellung Ihrer Neigungsbewertung keinen Störfaktor berücksichtigt haben. Es gibt auch zusätzliche Annahmen wie die Annahme eines stabilen Einheitsbehandlungswerts, die besagt, dass die einem Subjekt zugewiesene Behandlung das potenzielle Ergebnis der anderen Subjekte nicht beeinflusst.