k fache Kreuzvalidierung
Angenommen, Sie haben 100 Datenpunkte. Für Kreuzvalidierung -fach werden diese 100 Punkte unterteilt gleich große und gegenseitig ausschließenden ‚Falten‘. Für = 10 können Sie Punkte 1-10 zuweisen, um Nr. 1 zu folden, 11-20, um Nr. 2 zu folden, und so weiter, indem Sie Punkte 91-100 zuweisen, um Nr. 10 zu folden. Als nächstes wählen wir eine Falte aus, um als Test-Set zu fungieren, und verwenden die verbleibenden Falten, um die Trainingsdaten zu bilden. Für den ersten Lauf können Sie die Punkte 1-10 als Testsatz und 11-100 als Trainingssatz verwenden. Der nächste Lauf verwendet dann die Punkte 11-20 als Testsatz und trainiert die Punkte 1-10 plus 21-100 usw., bis jede Falte einmal als Testsatz verwendet wird.k k k - 1kkkk−1
Monte-Carlo-Kreuzvalidierung
Monte Carlo arbeitet etwas anders. Sie wählen zufällig (ohne Ersatz) einen Teil Ihrer Daten aus, um den Trainingssatz zu bilden, und weisen dann die restlichen Punkte dem Testsatz zu. Dieser Vorgang wird dann mehrmals wiederholt, wobei jedes Mal (nach dem Zufallsprinzip) neue Trainings- und Testpartitionen erstellt werden. Angenommen, Sie möchten 10% Ihrer Daten als Testdaten verwenden. Dann könnte Ihr Testsatz für Wiederholung Nr. 1 die Punkte 64, 90 , 63, 42 , 65, 49, 10, 64, 96 und 48 sein. Beim nächsten Durchlauf könnte Ihr Testsatz 90 , 60, 23, 67 sein. 16, 78, 42 , 17, 73 und 26. Da die Partitionen für jeden Lauf unabhängig durchgeführt werden, kann derselbe Punkt mehrmals im Testsatz erscheinen.Das ist der Hauptunterschied zwischen Monte Carlo und Kreuzvalidierung .
Vergleich
Jede Methode hat ihre Vor- und Nachteile. Bei der Kreuzvalidierung wird jeder Punkt genau einmal getestet, was fair erscheint. Bei der Kreuzvalidierung werden jedoch nur einige der Möglichkeiten untersucht, wie Ihre Daten partitioniert werden könnten. Mit Monte Carlo können Sie etwas mehr mögliche Partitionen untersuchen, obwohl es unwahrscheinlich ist, dass Sie alle erhalten - es gibt Möglichkeiten, einen 100-Datenpunkt zu 50/50 aufzuteilen einstellen(!).(10050)≈1028
Wenn Sie versuchen, eine Inferenz zu erstellen (dh zwei Algorithmen statistisch zu vergleichen), erhalten Sie durch Mitteln der Ergebnisse eines fachen Kreuzvalidierungslaufs eine (nahezu) unvoreingenommene Schätzung der Leistung des Algorithmus, jedoch mit einer hohen Varianz (wie Sie es möchten) erwarten Sie von nur 5 oder 10 Datenpunkten). Da Sie es im Prinzip so lange ausführen können, wie Sie es sich leisten können, kann die Monte-Carlo-Kreuzvalidierung zu einer weniger variablen, aber voreingenommeneren Schätzung führen.k
Einige Ansätze verschmelzen die beiden, wie bei der 5x2-Kreuzvalidierung (siehe Dietterich (1998) für die Idee, obwohl ich glaube, dass es seitdem einige weitere Verbesserungen gegeben hat) oder durch Korrektur der Verzerrung (z. B. Nadeau und Bengio, 2003 ). .