Sie sind beide in ihrem eigenen Kontext korrekt. Sie beschreiben zwei verschiedene Arten der Modellauswahl in verschiedenen Situationen.
Wenn Sie Modellauswahl und -tests durchführen, werden Ihre Daten im Allgemeinen in drei Teile unterteilt: Trainingssatz, Validierungssatz und Testsatz. Sie verwenden Ihren Trainingssatz, um verschiedene Modelle zu trainieren, die Leistung Ihres Validierungssatzes zu schätzen, dann das Modell mit der optimalen Leistung auszuwählen und es an Ihrem Testsatz zu testen.
Wenn Sie dagegen die K-fache Kreuzvalidierung verwenden, um die Leistung eines Modells abzuschätzen, werden Ihre Daten in K-Faltungen unterteilt, Sie durchlaufen die K-Faltungen und verwenden jedes Mal eine Falte als Test (oder Validierung). Setze und benutze die restlichen (K-1) Falten als Trainingsset. Dann mitteln Sie über alle Falten, um die geschätzte Testleistung Ihres Modells zu erhalten. Darauf bezieht sich die Wikipedia-Seite.
Beachten Sie jedoch, dass dies zum Testen eines bestimmten Modells dient. Wenn Sie mehrere Kandidatenmodelle haben und auch eine Modellauswahl durchführen möchten, müssen Sie ein Modell nur mit Ihrem Trainingssatz auswählen, um diesen subtilen Irrtum der zirkulären Logik zu vermeiden. Sie teilen also Ihre (K-1) Falten-Trainingsdaten weiter in zwei Teile, einen für das Training und einen für die Validierung. Dies bedeutet, dass Sie zuerst eine zusätzliche Kreuzvalidierung durchführen, um das optimale Modell innerhalb der (K-1) -Falten auszuwählen, und dann dieses optimale Modell auf Ihrer Testfalte testen. Mit anderen Worten, Sie führen eine zweistufige Kreuzvalidierung durch, eine ist die K-fache Kreuzvalidierung im Allgemeinen, und innerhalb jeder Kreuzvalidierungsschleife gibt es eine zusätzliche (K-1) -fache Kreuzvalidierung für Modellauswahl. Dann haben Sie das, was Sie in Ihrer Frage angegeben haben: "Von den k Unterproben wird eine Unterprobe als Validierungsdaten beibehalten, eine andere Unterprobe wird als Testdaten beibehalten und k-2 Unterproben werden als Trainingsdaten verwendet."