Ich sehe oft Leute, die über 5x2-Kreuzvalidierung als Sonderfall der verschachtelten Kreuzvalidierung sprechen .
Ich nehme an, die erste Zahl (hier: 5) bezieht sich auf die Anzahl der Falten in der inneren Schleife und die zweite Zahl (hier: 2) bezieht sich auf die Anzahl der Falten in der äußeren Schleife. Wie unterscheidet sich dies von einem "traditionellen" Modellauswahl- und Bewertungsansatz? Mit "traditionell" meine ich
- Teilen Sie den Datensatz in ein separates Training (z. B. 80%) und einen Testsatz auf
- Verwenden Sie die k-fache Kreuzvalidierung (z. B. k = 10) für die Optimierung der Hyperparameter und die Modellauswahl im Trainingssatz
- Bewerten Sie die Generalisierungsleistung des ausgewählten Modells mithilfe des Testsatzes
Ist 5x2 nicht genau gleich, außer dass Test- und Trainingssatz gleich groß sind, wenn k = 2 ist?