Eine produktivere Frage könnte sein: "Warum wurde es nicht in der klassischen Statistik verwendet, die ich gelernt habe?"
Abhängig von den Niveaus, auf denen es unterrichtet wurde, kann der Kursinhalt (und die verfügbare Zeit) dieser Wahl auf einer Kombination verschiedener Faktoren beruhen. Oft werden wichtige Themen außer Acht gelassen, weil aus dem einen oder anderen Grund anderes Material vermittelt werden muss, in der Hoffnung, dass sie in späteren Fächern behandelt werden.
Zumindest in gewisser Hinsicht wird der Begriff seit langem von einer Vielzahl von Menschen verwendet. Es war in einigen Bereichen häufiger als in anderen. Viele statistische Verwendungen haben keine Vorhersage oder Modellauswahl als Hauptkomponente (oder in einigen Fällen sogar überhaupt), und in diesem Fall ist die Verwendung von Holdout-Stichproben möglicherweise weniger kritisch als wenn Vorhersage der Hauptpunkt ist. Möglicherweise hätte es früher in einigen relevanten Anwendungen eine größere Verbreitung finden müssen, als dies der Fall war, aber das ist nicht dasselbe wie Unbekannt.
Wenn Sie sich Bereiche ansehen, die sich auf Vorhersagen konzentrieren, war der Begriff der Modellbewertung durch Vorhersagen von Daten, die Sie nicht für die Schätzung Ihres Modells verwendet haben, sicherlich weit verbreitet (wenn auch nicht universell). Ich habe es sicherlich mit der Zeitreihenmodellierung gemacht, die ich zum Beispiel in den 1980er Jahren gemacht habe, als die prädiktive Leistung der neuesten Daten außerhalb der Stichprobe von besonderer Bedeutung war.
Der Gedanke, zumindest einige Daten auszulassen, wurde beispielsweise in der Regression (gelöschte Residuen, PRESS, das Jacknife usw.) und in der Ausreißeranalyse verwendet.
Einige dieser Ideen stammen noch viel früher. Stone (1974) [1] verweist auf Arbeiten zur Kreuzvalidierung (mit dem Wort im Titel) aus den 1950er und 60er Jahren. Vielleicht noch näher an Ihrer Absicht erwähnt er die Verwendung der Begriffe "Konstruktionsmuster" und "Validierungsmuster" durch Simon (1971) - weist jedoch auch darauf hin, dass "Larson (1931) eine zufällige Aufteilung des Musters in ein pädagogisches Vielfaches verwendet hat -Regressionsstudie ".
Themen wie Kreuzvalidierung und die Verwendung von Statistiken auf der Grundlage von Vorhersagen usw. wurden in der Statistikliteratur zum Beispiel in den 70er und 80er Jahren immer häufiger, aber viele der grundlegenden Ideen gab es schon seit geraumer Zeit dann.
[1]: Stone, M. (1974),
"Cross-Validatory Choice and Assessment of Statistical Predictions",
Zeitschrift der Royal Statistical Society. Series B (Methodological) , Vol. 36, Nr. 2, S. 111-147