Ich verstehe das Konzept der Skalierung der Datenmatrix zur Verwendung in einem linearen Regressionsmodell. In R könnten Sie beispielsweise Folgendes verwenden:
scaled.data <- scale(data, scale=TRUE)
Meine einzige Frage ist, für neue Beobachtungen, für die ich die Ausgabewerte vorhersagen möchte, wie sie richtig skaliert werden. Wäre es scaled.new <- (new - mean(data)) / std(data)
?
y = y_esc * sd(y) + mean(y)
, aber das würde die Modelleigenschaften durcheinander bringen, also warte ich auch auf eine technischere Antwort!