"Diese Frage kann erweitert werden ..." - das ist absolut richtig. Aber natürlich, wenn Sie den ganzen Weg zurücktreten möchten, ist dies für jedes Phänomen der Fall . Jedes Mal, wenn Sie eine Münze werfen, wird sie ein wenig verbeult und ändert die Wahrscheinlichkeit, dass Köpfe auftauchen. Jedes Mal, wenn Sie auf einen Korb schießen, sind Ihre Arme etwas müder (oder etwas ausgeruhter) und Ihre Chance, dass der Ball hineingeht, ist etwas anders.
Als angewandter Statistiker versucht ein enormer Teil Ihrer Arbeit festzustellen, welche Ereignisse ähnlich genug sind , um als gleich gewertet zu werden. Sie werden niemals eine Gruppe von Menschen haben, die Drogen nehmen, oder eine Gruppe von Studenten, die getestet werden, oder eine Gruppe von Städten, die genau dieselben Richtlinien umsetzen . Ein Großteil Ihrer Arbeit besteht darin, herauszufinden, worauf Sie achten müssen, damit sie, wenn Sie fertig sind, ähnlich genug sind , um Ihnen eine aussagekräftige Antwort zu geben.
Wenn es um Vorhersagen geht, können Sie am besten versuchen, Dinge zu trainieren und dann zu testen, die Ihrer Meinung nach ausreichend ähnlich sind. Bei der Kreuzvalidierung geht es darum zu untersuchen, wie intern Ihre Daten und Ihr Modell konsistent sind. Wenn Sie einige trainieren und den Rest genau vorhersagen können, ist eine solide Interpretation, dass die beiden Datensätze "ähnlich genug" sind. (Wenn Sie den anderen enormen Teil davon ausgehen, dass Ihr Modell korrekt ist.) Für beobachtete Daten können Sie also die Vorhersagegenauigkeit durch Kreuzvalidierung bewerten.
Für die unsichtbare Zukunft lautet die beste Antwort auf Ihre Frage jedoch nur: "Damit die Vorhersagen korrekt sind, müssen Sie davon ausgehen, dass das Wetter von morgen aus derselben Verteilung stammt wie das gesamte Wetter, für das das Vorhersagemodell geeignet war." Und jede Frage, wie nahe sie kommt, hängt von einem bestimmten Modell und einer bestimmten Präferenz ab.