Ich möchte versuchen, Support Vector Machines (SVMs) für mein Dataset zu verwenden. Bevor ich das Problem versuchte, wurde ich gewarnt, dass SVMs bei extrem unausgeglichenen Daten keine gute Leistung bringen. In meinem Fall kann ich bis zu 95-98% 0 und 2-5% 1 haben.
Ich habe versucht, Ressourcen zu finden, bei denen es um die Verwendung von SVMs für spärliche / unausgeglichene Daten ging, aber alles, was ich finden konnte, waren spärliche SVMs (die eine kleine Menge von Unterstützungsvektoren verwenden).
Ich hatte gehofft, jemand könnte kurz erklären:
- Wie gut würde SVM mit einem solchen Datensatz auskommen?
- Falls vorhanden, müssen Änderungen am SVM-Algorithmus vorgenommen werden
- Welche Ressourcen / Papiere diskutieren dies?