Ich lerne die SVM-Klassifizierung und stoße auf ein Problem. Ich bin mir nicht sicher, ob dieses Dilemma eine Terminologie dafür hat.
Angenommen, wir möchten Patienten anhand der Stichproben von gesunden Menschen (beiderlei Geschlechts) und Menschen mit Leberkrebs (beiderlei Geschlechts) nach SVM klassifizieren. Wenn wir gesunde Menschen als Klasse 1 und krebskranke als Klasse 2 bezeichnen, können wir eine binäre SVM trainieren und einen Klassifikator 1 erhalten, um jeden neuen Patienten vorherzusagen. Stellen Sie sich jetzt ein anderes Szenario vor. Angenommen, wir teilen vor der SVM-Klassifizierung zunächst alle Stichproben nach Geschlecht auf. Für jedes Geschlecht kennzeichnen wir weiterhin gesunde Patienten gegenüber Krebspatienten in zwei Klassen und trainieren eine binäre SVM, um die Klassifikatoren 2 und 3 für weibliche bzw. männliche Proben zu erhalten. Die Frage ist, ob es eine neue Patientin gibt. Welcher Klassifikator 1 oder 2 sollte verwendet werden, um eine genauere Vorhersage zu erhalten? Hier ist das Dilemma für die Argumente, die ich habe
(1) Wenn die Anzahl der Proben groß ist, sollte die Vorhersage genauer sein. Basierend auf diesem Argument scheint der Klassifikator 1 eine gute Wahl zu sein.
(2) Wenn wir jedoch zuerst die Proben in weibliche und männliche Gruppen unterteilen, scheint der Klassifikator 2 eine bessere Wahl zu sein, da der neue Patient (unbekannte Testprobe) weiblich ist.
Hat diese Art von Dilemma eine Terminologie oder kennt jemand weitere Informationen oder wie man ein solches Problem löst? Ich bin mir nicht einmal sicher, ob dies eine legitime Frage ist, und entschuldige mich für die naive Frage im Voraus. Vielen Dank