Ich arbeite derzeit mit einer Vielzahl von Daten zu Krankenversicherungsansprüchen, einschließlich einiger Angaben zu Labor- und Apothekenansprüchen. Die konsistentesten Informationen im Datensatz bestehen jedoch aus Diagnose- (ICD-9CM) und Verfahrenscodes (CPT, HCSPCS, ICD-9CM).
Meine Ziele sind:
- Identifizieren Sie die einflussreichsten Vorläuferzustände (Komorbiditäten) für einen medizinischen Zustand wie eine chronische Nierenerkrankung.
- Identifizieren Sie die Wahrscheinlichkeit (oder Wahrscheinlichkeit), dass ein Patient einen medizinischen Zustand entwickelt, basierend auf den Zuständen, die er in der Vergangenheit hatte.
- Machen Sie dasselbe wie 1 und 2, aber mit Prozeduren und / oder Diagnosen.
- Vorzugsweise sind die Ergebnisse von einem Arzt interpretierbar
Ich habe mir Dinge wie die Meilensteinpapiere zum Heritage Health Prize angeschaut und viel von ihnen gelernt, aber sie konzentrieren sich auf die Vorhersage von Krankenhausaufenthalten.
Hier sind meine Fragen: Welche Methoden eignen sich Ihrer Meinung nach für solche Probleme? Und welche Ressourcen wären am nützlichsten, um mehr über datenwissenschaftliche Anwendungen und Methoden im Gesundheitswesen und in der klinischen Medizin zu erfahren?
BEARBEITEN SIE 2, um eine Klartext-Tabelle hinzuzufügen:
CNE ist die Zielerkrankung, "chronische Nierenerkrankung", ".alle" bedeutet, dass sie diese Erkrankung zu einem beliebigen Zeitpunkt erworben haben, ".vor.ckd" bedeutet, dass sie diese Erkrankung vor ihrer ersten Diagnose von CNE hatten. Die anderen Abkürzungen entsprechen anderen Bedingungen, die durch ICD-9CM-Codegruppierungen identifiziert werden. Diese Gruppierung erfolgt in SQL während des Importvorgangs. Jede Variable mit Ausnahme von patient_age ist binär.