Hallo Leute, ich habe ein oder zwei Papiere gefunden, die die Ridge-Regression verwenden (für Basketballdaten). Mir wurde immer befohlen, meine Variablen zu standardisieren, wenn ich eine Gratregression durchführte, aber ich wurde einfach dazu aufgefordert, weil es sich bei dem Grat um eine Skalierungsvariante handelte (die Gratregression war nicht wirklich Teil unseres Kurses, daher überflog unser Dozent sie).
Diese von mir gelesenen Artikel haben ihre Variablen nicht standardisiert, was mich ein wenig überrascht hat. Sie erreichten auch große Lambda-Werte (um das Niveau von 2000-4000) durch Kreuzvalidierung, und mir wurde gesagt, dass dies darauf zurückzuführen ist, dass die Variablen nicht standardisiert wurden.
Wie genau führt das Nichtstandardisieren der Variablen zu hohen Lambda-Werten und welche Konsequenzen hat das Nichtstandardisieren der Variablen im Allgemeinen? Ist es wirklich so eine große Sache?
Jede Hilfe wird sehr geschätzt.