Während ich die Website durchlese, schlagen die meisten Antworten vor, dass eine Kreuzvalidierung in Algorithmen für maschinelles Lernen durchgeführt werden sollte. Als ich jedoch das Buch "Maschinelles Lernen verstehen" las, sah ich, dass es eine Übung gibt, bei der es manchmal besser ist, keine Kreuzvalidierung zu verwenden. Ich bin wirklich verwirrt. Wann ist ein Trainingsalgorithmus für die gesamten Daten besser als eine Kreuzvalidierung? Kommt es in realen Datensätzen vor?
Sei k Hypothesenklassen. Angenommen , Sie gegeben werden iid Trainingsbeispiele und Sie möchten , um die Klasse lernen . Betrachten Sie zwei alternative Ansätze:
Lernen Sie anhand der Beispiele anhand der ERM-Regel
Teilen Sie die m Beispiele in einen Trainingssatz der Größe und einen Validierungssatz der Größe für einige . Wenden Sie dann den Ansatz der Modellauswahl mithilfe der Validierung an. Das heißt, trainieren Sie zuerst jede Klasse anhand der Trainingsbeispiele unter Verwendung der ERM-Regel in Bezug auf und lassen Sie die resultierenden Hypothesen sein . Zweitens wenden Sie die ERM-Regel in Bezug auf die endliche Klasse { } auf die Validierungsbeispiele an.
Beschreiben Sie Szenarien, in denen die erste Methode besser ist als die zweite und umgekehrt.