Da die Frage immer noch nicht beantwortet wird, hier meine 2ct:
Ich denke, hier sind zwei verschiedene Themen, die in diese Frage eingemischt sind:
Wie kann ich die Sensitivität und Spezifität (oder analoge Maßnahmen) eines kontinuierlichen diagnostischen Tests berechnen, um ein kontinuierliches Ergebnis (z. B. Blutdruck) vorherzusagen, ohne das Ergebnis zu dichotomisieren?
Ich gehe davon aus, dass Sie die Leistung des Modells messen möchten. Das Modell sagt ein kontinuierliches (metrisches) Ergebnis aus einer Eingabe voraus (zufällig auch in Ihrem Beispiel, aber das spielt hier keine Rolle). Dies ist ein Regressionsszenario, keine Klassifizierung. Suchen Sie also besser nach Leistungsmaßstäben für Regressionsmodelle. Sensitivität und Spezifität sind nicht das, wonach Sie suchen *.
Einige Regressionsprobleme haben eine "natürliche" Gruppierung in Vorhandensein und Nichtvorhandensein von etwas, die einen Zusammenhang mit der Klassifizierung herstellt. Dafür haben Sie möglicherweise eine bimodale Verteilung: viele Fälle ohne Abwesenheit und eine metrische Verteilung der Werte für Fälle mit Anwesenheit. Stellen Sie sich zum Beispiel eine Substanz vor, die ein Produkt kontaminiert. Viele der Produktproben enthalten keine Verunreinigungen, aber für diejenigen, die dies tun, wird ein Konzentrationsbereich beobachtet.
Dies ist jedoch bei Ihrem Beispiel für Blutdruck nicht der Fall (das Fehlen von Blutdruck ist hier kein vernünftiges Konzept). Ich würde sogar vermuten, dass der Blutdruck unimodal verteilt ist. All dies deutet auf ein Regressionsproblem ohne enge Verbindung zur Klassifizierung hin.
* Mit dem Vorbehalt, dass beide Wörter in der analytischen Chemie für die Regression (Kalibrierung) verwendet werden, jedoch mit einer anderen Bedeutung: Dort ist die Empfindlichkeit die Steigung der Kalibrierungs- / Regressionsfunktion, und spezifisch bedeutet manchmal, dass die Methode vollständig selektiv ist ist es unempfindlich gegenüber anderen Substanzen als dem Analyten und es treten keine Querempfindlichkeiten auf.
AD McNaught und A. Wilkinson, Hrsg.: Compendium of Chemical Terminology (das „Gold Book“). Blackwell Scientific, 1997. ISBN: 0-9678550-9-8. DOI: doi: 10.1351 / Goldbook. URL: http://goldbook.iupac.org/ .
Analoga der Sensitivität und Spezifität für kontinuierliche Ergebnisse
Wenn die zugrunde liegende Natur des Problems jedoch eine Klassifizierung ist, können Sie es dennoch durch eine Regression besser beschreiben:
- Die Regression beschreibt einen Grad der Zugehörigkeit zu den Klassen (wie in Fuzzy-Mengen).
- die Regressionsmodelle (posterior) Wahrscheinlichkeit, zu den Klassen zu gehören (wie bei der logistischen Regression )
- Ihre Fälle können als Mischungen der reinen Klassen beschrieben werden (sehr nahe an der "normalen" Regression, das obige Kontaminationsbeispiel).
In diesen Fällen ist es sinnvoll, die Konzepte hinter Sensitivität und Spezifität auf "kontinuierliche Ergebnisklassifikatoren" auszudehnen. Die Grundidee besteht darin, jeden Fall nach seinem Zugehörigkeitsgrad zur betreffenden Klasse zu gewichten. Für die Sensitivität und Spezifität, die sich auf das Referenzetikett bezieht, für die Vorhersagewerte für die vorhergesagten Klassenmitgliedschaften. Es stellt sich heraus, dass dies zu einer sehr engen Verbindung mit Leistungsmessungen vom Regressionstyp führt.
Wir haben dies kürzlich in
C. Beleites, R. Salzer und V. Sergo beschrieben:
Validierung von Soft-Klassifizierungsmodellen unter Verwendung von
Teilklassenmitgliedschaften : Ein erweitertes Konzept von Sensitivity & Co., das auf die Einstufung von Astrocytoma Tissues Chemom angewendet wird. Intell. Labor. Syst., 122 (2013), 12 - 22.
Der Link verweist auf die Homepage des R-Pakets, in dem die vorgeschlagenen Leistungsmaßnahmen umgesetzt werden.
Auch hier wird das Blutdruckbeispiel IMHO nicht ausreichend als Klassifizierungsproblem beschrieben. Vielleicht möchten Sie das Papier dennoch lesen - ich denke, die Formulierung der dortigen Referenzwerte wird deutlich machen, dass der Blutdruck nicht sinnvoll in einer für die Klassifizierung geeigneten Weise beschrieben wird.
(Wenn Sie einen kontinuierlichen Grad an "Bluthochdruck" formulieren, wäre dies selbst ein Modell und ein anderes als das von Ihnen beschriebene Problem.)
Ich hatte nur einen kurzen Blick auf das von Ihnen verlinkte Papier, aber wenn ich es richtig verstanden habe, verwenden die Autoren Schwellenwerte (dichotomize) für beide Modellierungsstrategien: Für die kontinuierliche Vorhersage wird weiterverarbeitet: Ein Vorhersageintervall wird berechnet und mit einem bestimmten Schwellenwert verglichen. Am Ende haben sie eine dichotome Vorhersage und erzeugen den ROC durch Variieren der Spezifikation für das Intervall.
Wenn Sie angeben, dass Sie dies vermeiden möchten, scheint das Papier nicht übermäßig relevant zu sein.