Die LASSO-Regression verringert die Koeffizienten auf Null und bietet so eine effektive Modellauswahl. Ich glaube, dass es in meinen Daten bedeutsame Wechselwirkungen zwischen nominalen und kontinuierlichen Kovariaten gibt. Nicht unbedingt sind jedoch die "Haupteffekte" des wahren Modells aussagekräftig (nicht Null). Natürlich weiß ich das nicht, da das wahre Modell unbekannt ist. Mein Ziel ist es, das wahre Modell zu finden und das Ergebnis so genau wie möglich vorherzusagen.
Ich habe gelernt, dass der klassische Ansatz des Modellbaus immer einen Haupteffekt beinhaltet, bevor eine Interaktion einbezogen wird. Somit kann es nicht ein Modell ohne Haupteffekt von zwei Kovarianten sein , und Z , wenn es eine Wechselwirkung des Kovarianten ist X * Z in dem gleichen Modell. Die Funktion wählt folglich sorgfältig Modellbegriffe (z. B. basierend auf Rückwärts- oder Vorwärts-AIC) aus, die dieser Regel entsprechen.step
R
LASSO scheint anders zu arbeiten. Da alle Parameter benachteiligt sind, kann es ohne Zweifel vorkommen, dass ein Haupteffekt auf Null geschrumpft ist, während die Interaktion des besten (z. B. kreuzvalidierten) Modells ungleich Null ist. Dies finde ich insbesondere für meine Daten bei der Nutzung R
des glmnet
Pakets.
Ich habe Kritik aufgrund der oben genannten ersten Regel erhalten, dh mein endgültiges kreuzvalidiertes Lasso-Modell enthält nicht die entsprechenden Haupteffektterme einer Nicht-Null-Wechselwirkung. Diese Regel erscheint in diesem Zusammenhang jedoch etwas seltsam. Worauf es ankommt, ist die Frage, ob der Parameter im wahren Modell Null ist. Nehmen wir an, es ist eine Wechselwirkung ungleich Null, dann wird LASSO dies möglicherweise identifizieren und auf diese Weise das richtige Modell finden. Tatsächlich scheinen Vorhersagen aus diesem Modell präziser zu sein, da das Modell nicht den Haupteffekt wahr-null enthält, der effektiv eine Rauschvariable ist.
Darf ich die Kritik aus diesem Grund zurückweisen oder sollte ich irgendwie vorsorgen, dass LASSO den Haupteffekt vor dem Interaktionsbegriff beinhaltet?