Ein paar Dinge, die mir sofort einfallen.
Ich denke, spdrnl hat recht, aufgrund der Standardisierung sollten die Effektgrößen vergleichbar sein. Es sieht so aus, als ob es der Fall sein könnte, dass der Plot auf der Skala der ursprünglichen Variablen liegt. Ich würde jedoch prüfen, welcher wahr ist, und mit einem Plot der Koeffizienten der standardisierten Prädiktoren arbeiten.
Erste Beobachtung. Ich denke, Sie sollten mit Ihrer Integrationsregion vorsichtig sein. Angenommen, das prädiktivste Modell ist mit einem irgendwo in der Mitte des Diagramms verknüpft . Dann sind die Modelle, die der linken Seite des Diagramms entsprechen, überangepasst und erfassen nur Rauschen in den Daten. Sie möchten wahrscheinlich nicht über diesen Bereich berichten. In Bezug auf Lambda würde ich die Integration empfehlen:log(λ)
∫λopt0|βi(t)|
Zweite Beobachtung. Mit nicht monotonen Koeffizientenpfaden verlieren Sie etwas Subtilität. Ich denke an dein Lasso-Beispiel von gestern
Hier würde die Flächenmethode eine bestimmte Bedeutung für angeben cyl
. Was wirklich stimmt, ist, dass dies cyl
für kleine Modelle wichtig ist, dann fällt der Effekt für große Modelle aus. Der Gebietsansatz erfasst dies nicht. Möglicherweise möchten Sie Ihre Flächenmessungen mit Kommentaren oder Bildern ergänzen, die sich auf diese interessanten Fälle konzentrieren.
Schließlich müssen Sie auswählen, was auf Ihrer x-Achse gemessen werden soll. Die Auswahlmöglichkeiten sind , und. Ich würde mich zu Letzterem neigen, da dies misst, wie viel des gesamten zugewiesenen Koeffizientenbudgets an jeden Prädiktor geht. Die anderen sind nur durch Lagrange-Multiplikatoren interpretierbar, was es schwierig macht, wirklich sicher zu sein, was gemessen wird.λlog(λ)∑i|βi|