Ich habe einige Daten und möchte aus diesen Daten ein Modell (z. B. ein lineares Regressionsmodell) erstellen. In einem nächsten Schritt möchte ich die Leave-One-Out Cross-Validation (LOOCV) auf das Modell anwenden, um zu sehen, wie gut es funktioniert.
Wenn ich LOOCV richtig verstanden habe, erstelle ich für jede meiner Stichproben (den Testsatz) ein neues Modell, wobei ich jede Stichprobe mit Ausnahme dieser Stichprobe (den Trainingssatz) verwende. Dann benutze ich das Modell, um den Testsatz vorherzusagen und die Fehler zu berechnen .
In einem nächsten Schritt aggregiere ich alle mit einer gewählten Funktion erzeugten Fehler, zum Beispiel den mittleren quadratischen Fehler. Anhand dieser Werte kann ich die Qualität (oder die Passgenauigkeit) des Modells beurteilen.
Frage: Für welches Modell gelten diese Qualitätswerte? Für welches Modell sollte ich mich entscheiden, wenn ich die aus LOOCV generierten Metriken für meinen Fall als geeignet erachte? LOOCV untersuchte verschiedene Modelle (wobei die Stichprobengröße ist); Welches Modell soll ich wählen?
- Verwendet das Modell alle Stichproben? Dieses Modell wurde während des LOOCV-Prozesses nie berechnet!
- Ist es das Modell mit dem geringsten Fehler?