Ich habe eine Antwort überdacht , die ich vor ein paar Wochen auf eine Frage gegeben habe
Die Hold-out-Kreuzvalidierung erzeugt einen einzelnen Testsatz, der wiederholt zur Demonstration verwendet werden kann. Wir scheinen uns alle einig zu sein, dass dies in vielerlei Hinsicht ein negatives Merkmal ist, da sich herausstellen könnte, dass der eine durchgehaltene Satz durch Zufälligkeit nicht repräsentativ ist. Darüber hinaus können Sie sich auf die gleiche Weise an die Testdaten anpassen wie an die Trainingsdaten.
Es scheint mir jedoch, dass die statische Natur einer durchgehaltenen Stichprobe eine bessere Annäherung an das "Erhalten von mehr Daten" als der k-fache Lebenslauf darstellt und das Problem der Mittelwertbildung über Falten hinweg vermeidet. Ich kann jedoch keine statistische Grundlage für dieses Gefühl finden, das ich habe. Gibt es eine Logik in meiner Intuition?
Zum Beispiel denke ich für ein bevorstehendes Projekt daran, zuerst die Hold-Out-Validierung zum Erstellen und Testen eines Modells zu verwenden und dann als Validierungsschritt den Hold-Out-Satz mehrmals neu zu zeichnen, um zu zeigen, dass meine Schätzungen des Vorhersagefehlers ( auf dem Testsatz) sind robust gegenüber Stichprobenfehlern im Testsatz. Ist das aus irgendeinem Grund eine schlechte Idee? Diese Frage wurde schon einmal gestellt , aber nie beantwortet.