Was halten Sie von Überabtastung bei der Klassifizierung im Allgemeinen und dem SMOTE-Algorithmus im Besonderen? Warum sollten wir nicht einfach eine Gebühr / Strafe anwenden, um das Ungleichgewicht in den Klassendaten und etwaige nicht ausgeglichene Fehlerkosten auszugleichen? Für meine Zwecke ist die Genauigkeit der Vorhersage für einen zukünftigen Satz von experimentellen Einheiten das ultimative Maß.
Als Referenz das SMOTE-Papier: http://www.jair.org/papers/paper953.html