Nicht alle statistischen Verfahren sind in Trainings- / Testdaten unterteilt, die auch als "Kreuzvalidierung" bezeichnet werden (obwohl das gesamte Verfahren etwas mehr beinhaltet).
Dies ist vielmehr eine Technik, die speziell verwendet wird, um Fehler außerhalb der Stichprobe zu schätzen . dh wie gut wird Ihr Modell neue Ergebnisse mithilfe eines neuen Datensatzes vorhersagen? Dies wird zu einem sehr wichtigen Problem, wenn Sie beispielsweise eine sehr große Anzahl von Prädiktoren im Verhältnis zur Anzahl der Stichproben in Ihrem Datensatz haben. In solchen Fällen ist es wirklich einfach, ein Modell mit einem großen Fehler in der Stichprobe zu erstellen, das jedoch aus einem Fehler in der Stichprobe schrecklich ist (als "Überanpassung" bezeichnet). In den Fällen, in denen Sie sowohl eine große Anzahl von Prädiktoren als auch eine große Anzahl von Stichproben haben, ist die Kreuzvalidierung ein notwendiges Instrument, um zu beurteilen, wie gut sich das Modell bei der Vorhersage neuer Daten verhält. Es ist auch ein wichtiges Werkzeug bei der Auswahl zwischen konkurrierenden Vorhersagemodellen.
Außerdem wird die Kreuzvalidierung fast immer nur verwendet, wenn versucht wird, ein Vorhersagemodell zu erstellen . Im Allgemeinen ist es für Modelle nicht sehr hilfreich, wenn Sie versuchen, die Wirkung einer Behandlung abzuschätzen. Wenn Sie beispielsweise die Verteilung der Zugfestigkeit zwischen den Materialien A und B vergleichen ("Behandlung" ist Materialtyp), ist keine Kreuzvalidierung erforderlich. während wir die Hoffnung machen , dass unsere Schätzung der Behandlungseffekt verallgemeinert der Probe aus, für die meisten Probleme klassische Theorie statistische diese (zB „Standardfehler“ von Schätzungen) beantworten kann mehr genau als Kreuzvalidierung. Leider klassische statistische Methodik 1Denn Standardfehler halten bei Überanpassung nicht stand. Eine Kreuzvalidierung ist in diesem Fall oft viel besser.
Wenn Sie jedoch anhand von 10.000 Messgrößen, die Sie in ein Modell für maschinelles Lernen basierend auf 100.000 Beobachtungen einfügen, vorhersagen möchten, wann ein Material brechen wird, haben Sie große Probleme, ein großartiges Modell ohne Kreuzvalidierung zu erstellen!
Ich vermute, dass Sie bei vielen durchgeführten physikalischen Experimenten im Allgemeinen an der Abschätzung von Effekten interessiert sind. In diesen Fällen besteht nur ein sehr geringer Bedarf an Kreuzvalidierung.
1 Man könnte argumentieren, dass Bayes'sche Methoden mit informativen Prioritäten eine klassische statistische Methode sind, die sich mit Überanpassung befasst. Aber das ist eine andere Diskussion.
Randnotiz: Während die Kreuzvalidierung zum ersten Mal in der Statistikliteratur erschien und definitiv von Personen verwendet wird, die sich selbst als Statistiker bezeichnen, ist sie zu einem grundlegend erforderlichen Werkzeug in der Community des maschinellen Lernens geworden. Viele Statistikmodelle funktionieren ohne Kreuzvalidierung gut, aber fast alle Modelle, die als "Vorhersagemodelle für maschinelles Lernen" gelten, müssen kreuzvalidiert werden, da sie häufig die Auswahl von Optimierungsparametern erfordern, was ohne Kreuz fast unmöglich ist -Validierung.