Was ist der beste Weg, um die Ansätze zu kategorisieren, die entwickelt wurden, um das Problem der Ungleichgewichtsklassen zu lösen?
Dieser Artikel kategorisiert sie in:
- Vorverarbeitung: umfasst Oversampling, Undersampling und Hybridmethoden,
- Kostensensitives Lernen: Umfasst direkte Methoden und Meta-Lernen, das letztere weiter in Schwellenwerte und Stichproben unterteilt.
- Ensemble-Techniken: Umfasst kostensensitive Ensembles und Datenvorverarbeitung in Verbindung mit Ensemble-Lernen.
Die zweite Klassifikation:
- Datenvorverarbeitung: Beinhaltet Verteilungsänderungen und die Gewichtung des Datenraums. Ein-Klassen-Lernen wird als Verteilungsänderung betrachtet.
- Spezielle Lernmethoden
- Vorhersage Nachbearbeitung: Beinhaltet die Schwellenwertmethode und die kostensensitive Nachbearbeitung
- Hybridmethoden:
Der dritte Artikel :
- Methoden auf Datenebene
- Methoden auf Algorithmenebene
- Hybridmethoden
Die letzte Klassifizierung betrachtet die Leistungsanpassung auch als unabhängigen Ansatz.
Danke im Voraus.