Kürzlich bin ich auf ein Dokument gestoßen, das die Verwendung eines k-NN- Klassifikators für einen bestimmten Datensatz vorschlägt . Die Autoren verwendeten alle verfügbaren Datenproben, um eine k-fache Kreuzvalidierung für verschiedene k- Werte durchzuführen und Kreuzvalidierungsergebnisse der besten Hyperparameterkonfiguration zu melden.
Meines Wissens ist dieses Ergebnis verzerrt, und sie sollten einen separaten Testsatz beibehalten, um eine Genauigkeitsschätzung für Proben zu erhalten, die nicht zur Durchführung der Hyperparameteroptimierung verwendet wurden.
Habe ich recht? Können Sie einige Referenzen (vorzugsweise Forschungsarbeiten) angeben, die diesen Missbrauch der Kreuzvalidierung beschreiben?