Ich möchte mein trainiertes Modell an einem unausgeglichenen Datensatz testen lassen. Gibt es Algorithmen, um synthetische Daten aus einem ausgewogenen, beschrifteten Datensatz (Spam / Nicht-Spam) zu generieren?
Ich möchte mein trainiertes Modell an einem unausgeglichenen Datensatz testen lassen. Gibt es Algorithmen, um synthetische Daten aus einem ausgewogenen, beschrifteten Datensatz (Spam / Nicht-Spam) zu generieren?
Antworten:
Probieren Sie SMOTE aus , einen Algorithmus, der für die Überabtastung verwendet wird. Es werden synthetische Samples aus der Klasse erstellt, die überabgetastet werden soll.
Sie können dies verwenden, um eine beliebige Anzahl von Proben zu erstellen, die Sie benötigen.