Ich habe über die k-fach-Validierung gelesen und möchte sicherstellen, dass ich verstehe, wie es funktioniert.
Ich weiß, dass für die Holdout-Methode die Daten in drei Gruppen aufgeteilt werden und die Testgruppe nur ganz am Ende zur Bewertung der Leistung des Modells verwendet wird, während die Validierungsgruppe zum Optimieren von Hyperparametern usw. verwendet wird.
Halten wir bei der K-Fold-Methode noch einen Testsatz ganz zum Schluss aus und verwenden nur die verbleibenden Daten für das Training und die Optimierung der Hyperparameter, dh, wir teilen die verbleibenden Daten in K-Fold- Werte auf und verwenden dann die durchschnittliche Genauigkeit nach dem Training Mit jeder Falte (oder welcher Leistungsmetrik auch immer, die wir für die Optimierung unserer Hyperparameter auswählen)? Oder verwenden wir überhaupt keinen separaten Testsatz und teilen einfach den gesamten Datensatz in k-Faltungen auf (wenn dies der Fall ist, gehe ich davon aus, dass wir nur die durchschnittliche Genauigkeit der k-Faltungen als unsere endgültige Genauigkeit betrachten)?