Dies ist im Allgemeinen eine Frage, die sich nicht auf eine Methode oder einen Datensatz bezieht. Wie gehen wir mit einem Klassenungleichgewichtsproblem beim überwachten maschinellen Lernen um, bei dem die Zahl 0 etwa 90% und die Zahl 1 etwa 10% in Ihrem Datensatz beträgt. Wie trainieren wir den Klassifikator optimal.
Eine der Möglichkeiten, die ich befolge, besteht darin, Stichproben zu entnehmen, um den Datensatz auszugleichen, den Klassifikator zu trainieren und dies für mehrere Stichproben zu wiederholen.
Ich denke, das ist zufällig. Gibt es einen Rahmen, um diese Art von Problemen anzugehen?