Welcher Klassifikator ist für eine SVM-Klassifikation genauer?


10

Ich lerne die SVM-Klassifizierung und stoße auf ein Problem. Ich bin mir nicht sicher, ob dieses Dilemma eine Terminologie dafür hat.

Angenommen, wir möchten Patienten anhand der Stichproben von gesunden Menschen (beiderlei Geschlechts) und Menschen mit Leberkrebs (beiderlei Geschlechts) nach SVM klassifizieren. Wenn wir gesunde Menschen als Klasse 1 und krebskranke als Klasse 2 bezeichnen, können wir eine binäre SVM trainieren und einen Klassifikator 1 erhalten, um jeden neuen Patienten vorherzusagen. Stellen Sie sich jetzt ein anderes Szenario vor. Angenommen, wir teilen vor der SVM-Klassifizierung zunächst alle Stichproben nach Geschlecht auf. Für jedes Geschlecht kennzeichnen wir weiterhin gesunde Patienten gegenüber Krebspatienten in zwei Klassen und trainieren eine binäre SVM, um die Klassifikatoren 2 und 3 für weibliche bzw. männliche Proben zu erhalten. Die Frage ist, ob es eine neue Patientin gibt. Welcher Klassifikator 1 oder 2 sollte verwendet werden, um eine genauere Vorhersage zu erhalten? Hier ist das Dilemma für die Argumente, die ich habe

(1) Wenn die Anzahl der Proben groß ist, sollte die Vorhersage genauer sein. Basierend auf diesem Argument scheint der Klassifikator 1 eine gute Wahl zu sein.

(2) Wenn wir jedoch zuerst die Proben in weibliche und männliche Gruppen unterteilen, scheint der Klassifikator 2 eine bessere Wahl zu sein, da der neue Patient (unbekannte Testprobe) weiblich ist.

Hat diese Art von Dilemma eine Terminologie oder kennt jemand weitere Informationen oder wie man ein solches Problem löst? Ich bin mir nicht einmal sicher, ob dies eine legitime Frage ist, und entschuldige mich für die naive Frage im Voraus. Vielen Dank


4
Dies kann im Allgemeinen nicht beantwortet werden. Vielleicht, wenn wir wüssten, wie stark das Geschlecht Krebs beeinflusst und wie viele Proben Sie haben, welche Verlustfunktion Sie verwenden usw. Es ist wahrscheinlich viel einfacher, mit Kreuzvalidierung zu experimentieren.
AdrianN

Vielen Dank. Es ergibt Sinn. Ich denke, es sollte keine allgemeine Regel geben.
Cassie

Dies klingt nach einer allgemeinen ML-Frage zum Thema "Wie soll ich ML verwenden, um dieses Problem zu lösen?". Es gibt keine Standardantwort. Es ist wichtig / akzeptiert / Standard, verschiedene Ansätze auszuprobieren und herauszufinden, welche Strategien zu den genauesten Vorhersageergebnissen führen. Die allgemeine Überschrift ist so etwas wie "Darstellung des Problems der realen Welt im abstrakten ML-Framework" oder grob "Modellierung" und wird in guten Standardreferenzen behandelt. Siehe auch stats.se
vzn

Antworten:


2

Sie sollten sich die Funktionsauswahl und die Algorithmen ansehen , die diesen Prozess automatisieren. Es ist in Ordnung, wenn Sie neu in ML sind und nicht den gesamten Prozess der Funktionsauswahl verstehen. Holen Sie sich einfach die richtige Intuition und verwenden Sie eine Bibliothek, um den Prozess zu automatisieren.

Die Schlüsselidee eines Lernalgorithmus besteht darin, dass er die Muster finden kann. Das Beste, was Sie tun können, ist, ihm zu helfen , indem Sie viele (nicht redundante) Daten bereitstellen und einen guten Vorverarbeitungsschritt ausführen, der normalerweise Dinge beinhaltet wie Funktionsauswahl und Normalisierung .

Wenn Sie Lernalgorithmen implementieren, sollten Sie nicht versuchen, Ihren Datensatz nur durch "Betrachten" zu ändern, es sei denn, Sie haben konkrete Metriken, die belegen, dass Änderungen erforderlich sind. Oft war dies der Fall, dass das Lernen durchgeführt wurde Der Algorithmus legte großen Wert auf Merkmale, die nicht einmal im Zusammenhang mit dem Klassifizierungsprozess zu stehen schienen. Versuchen Sie immer, einen Funktionsauswahlschritt durchzuführen, bevor Sie Änderungen an Ihren Daten vornehmen.


1

Eine allgemeine Überschrift für diese Art von Schritt des maschinellen Lernprozesses ist die Datenvorverarbeitung, die laut Wikipedia "Bereinigen, Normalisieren, Transformieren, Extrahieren und Auswählen von Merkmalen usw." umfasst.

Ein weiterer Aspekt des maschinellen Lernens ist das "Erstellen des Modells". Dies beinhaltet Entscheidungen, z. B. darüber, wie viele Klassen erkannt werden, wie "Größe" oder "Dimensionen" der ML-Struktur sein werden (z. B. "wie viele Kernel die SVM enthalten wird" usw., ungefähr analog zur Wahl der Anzahl der Neuronen in einem NN Modell). Leider neigen einige Schiedsrichter dazu, diesen Schritt zu überspringen oder zu "beschönigen". Beachten Sie jedoch, dass es mit Statistiken gemeinsam ist und einige Statistikbücher eine gute Beschreibung haben.

Bei Ansätzen vom ML-Typ ist es üblich, dass es einen starken iterativen / Feedback- / Evolutionsprozess gibt, um sowohl die effektive Vorverarbeitung als auch die Modellierung zu bestimmen. Der Experimentator probiert verschiedene Vorverarbeitungs- und Modellierungsideen aus und bewegt sich in Richtung der erfolgreicheren. Die allgemeine Faustregel lautet: "Je besser die Vorhersagen sind, desto korrekter [und vermutlich auch realistisch ] ist die Vorverarbeitung und Modellierung", aber auch, da eine Überanpassung sorgfältig ausgeschlossen wird.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.