Betrachten Sie die Stichprobendaten einer Population der Größe folgendermaßen: Für
Beobachten Sie den Krankheitsstatus des einzelnen
Wenn sie an der Krankheit leiden, nehmen Sie sie mit der Wahrscheinlichkeit in die Stichprobe auf.
Wenn sie die Krankheit nicht haben, schließen Sie sie mit der Wahrscheinlichkeit .
Angenommen, Sie haben eine binäre Ergebnisvariable und einen Prädiktorvektor für Probanden beobachtet, die auf diese Weise abgetastet wurden. Die Ergebnisvariable ist nicht der "Krankheits" -Status. Ich möchte die Parameter des logistischen Regressionsmodells schätzen:
Alles, was mich interessiert, sind die (logarithmischen) Quotenverhältnisse . Der Abschnitt ist für mich irrelevant.
Meine Frage lautet: Kann ich vernünftige Schätzungen von indem ich die Stichprobenwahrscheinlichkeiten , i = 1, ..., n ignoriere und das Modell so anpasse , als ob es war eine gewöhnliche Zufallsstichprobe?
Ich bin mir ziemlich sicher, dass die Antwort auf diese Frage "Ja" lautet. Was ich suche, ist eine Referenz, die dies bestätigt.
Es gibt zwei Hauptgründe, warum ich von der Antwort überzeugt bin:
Ich habe viele Simulationsstudien durchgeführt und keine davon widerspricht dem, und
Es ist unkompliziert zu zeigen, dass, wenn die Population durch das obige Modell bestimmt wird, das Modell für die abgetasteten Daten gilt
Wenn die Stichprobenwahrscheinlichkeiten nicht von abhängen würden, würde dies eine einfache Verschiebung zum Achsenabschnitt darstellen und die Punktschätzung von würde eindeutig nicht beeinflusst. Wenn jedoch die Offsets für jede Person unterschiedlich sind, gilt diese Logik nicht ganz, da Sie sicherlich eine andere Punktschätzung erhalten, obwohl ich vermute, dass etwas Ähnliches der Fall ist.
Verwandte: Die klassische Arbeit von Prentice und Pyke (1979) besagt, dass logistische Regressionskoeffizienten aus einer Fallkontrolle (mit dem Krankheitsstatus als Ergebnis) dieselbe Verteilung haben wie diejenigen, die aus einer prospektiven Studie gesammelt wurden. Ich vermute, dass das gleiche Ergebnis hier zutreffen würde, aber ich muss gestehen, dass ich nicht jedes Stück des Papiers vollständig verstehe.
Vielen Dank im Voraus für alle Kommentare / Referenzen.