Ich frage mich, welche Art von Modellkreuzvalidierung für das Klassifizierungsproblem gewählt werden soll: K-fach oder zufällige Unterabtastung (Bootstrap-Abtastung)?
Ich gehe davon aus, dass 2/3 des Datensatzes (das sind ~ 1000 Elemente) für das Training und 1/3 für die Validierung verwendet werden.
In diesem Fall ergibt K-Fold nur drei Iterationen (Folds), was nicht ausreicht, um einen stabilen Durchschnittsfehler zu sehen.
Auf der anderen Seite mag ich keine Funktion für zufällige Teilstichproben: Einige Elemente werden nie für die Schulung / Validierung ausgewählt, andere werden mehrmals verwendet.
Verwendete Klassifizierungsalgorithmen: zufällige Gesamtstruktur und logistische Regression.