Ich habe ein lineares Regressionsproblem. Kurz gesagt, ich habe einen Datensatz, den ich in zwei Teilmengen unterteilt habe. Eine Teilmenge wird verwendet, um die lineare Regression zu finden (Trainingsuntermenge), eine andere wird verwendet, um sie zu bewerten (Bewertungsuntermenge). Meine Frage ist, wie das Ergebnis dieser linearen Regression bewertet werden kann, nachdem es auf die Bewertungsuntermenge von Daten angewendet wurde.
Hier sind die Details:
In der Trainingsuntermenge mache ich eine lineare Regression: , wobei die Grundwahrheit ist (auch als Ziel bekannt), eine unabhängige Variable ist. Dann fand ich und . ( und sind in der Trainingsuntermenge angegeben).
Wenden Sie nun und die oben aus der Trainingsuntermenge gefunden wurden, auf die Bewertungsuntermenge an. Ich fand . Mit anderen Worten, diese y ' werden aus der linearen Regression mit x ' gefunden . Jetzt habe ich zusätzlich zu y ' auch y aus dem Bewertungssatz. Wie bewerte ich mein Ergebnis (wie sehr unterscheidet sich y ' von y?b y ' = a x ' + b)? Gibt es ein allgemeines mathematisches Modell dafür? Es muss eine Art mathematisches Modell / Formel sein. Ich kann mir verschiedene Möglichkeiten vorstellen, aber sie sind alle irgendwie ad-hoc oder einfach, aber dies ist für eine wissenschaftliche Arbeit, so dass Dinge, die ad-hoc klingen, hier leider nicht verwendet werden können.
Irgendeine Idee?