Variablenauswahl vs Modellauswahl


12

Ich verstehe also, dass die Variablenauswahl Teil der Modellauswahl ist. Woraus besteht die Modellauswahl genau? Ist es mehr als das Folgende:

1) Wählen Sie eine Distribution für Ihr Modell

2) erklärende Variablen wählen,?

Ich frage dies, weil ich einen Artikel von Burnham & Anderson lese : AIC vs BIC, in dem sie über AIC und BIC bei der Modellauswahl sprechen. Beim Lesen dieses Artikels wurde mir klar, dass ich "Modellauswahl" als "Variablenauswahl" angesehen habe (siehe Anmerkungen. Versucht BIC, ein echtes Modell zu finden? )

Ein Auszug aus dem Artikel, in dem es um 12 Modelle mit zunehmendem Grad an "Allgemeingültigkeit" geht. Diese Modelle zeigen "Konizitätseffekte" (Abbildung 1), wenn KL-Informationen gegen die 12 Modelle aufgetragen werden:

VERSCHIEDENE PHILOSOPHIEN UND ZIELMODELLE ... Obwohl das Ziel von BIC ein allgemeineres Modell als das Zielmodell für AIC ist, ist das von BIC am häufigsten ausgewählte Modell weniger allgemein als Modell 7, es sei denn, n ist sehr groß. Es könnte Modell 5 oder 6 sein. Aus zahlreichen Veröffentlichungen und Simulationen in der Literatur ist bekannt, dass AIC im Zusammenhang mit Tapering-Effekten (Abbildung 1) besser abschneidet als BIC. Wenn dies der Kontext der Echtdatenanalyse ist, sollte AIC verwendet werden.

Wie kann BIC jemals ein Modell auswählen, das bei der Modellauswahl komplexer ist als AIC? Ich verstehe das nicht! Was ist konkret "Modellauswahl" und wann wählt BIC konkret ein "allgemeineres" Modell als AIC?

Wenn es sich um die Variablenauswahl handelt, muss der BIC mit Sicherheit immer das Modell mit der geringsten Anzahl von Variablen auswählen, richtig? Der Term in der BIC benachteiligt hinzugefügte Variablen immer stärker als der Term in der AIC. Aber ist das nicht unvernünftig, wenn " das Ziel von BIC ein allgemeineres Modell als das Zielmodell für AIC ist "?2ln(N)k2k

EDIT :

Aus einer Diskussion in den Kommentaren unter Gibt es einen Grund, den AIC oder den BIC dem anderen vorzuziehen? Wir sehen eine kleine Diskussion zwischen @Michael Chernick und @ user13273 in den Kommentaren, die mich zu der Annahme veranlasst, dass dies etwas ist, das nicht so trivial ist:

Ich halte es für angemessener, diese Diskussion als "Merkmalsauswahl" oder "Kovariatenauswahl" zu bezeichnen. Für mich ist die Modellauswahl viel umfassender und beinhaltet die Spezifikation der Fehlerverteilung, der Form der Verknüpfungsfunktion und der Form der Kovariaten. Wenn wir über AIC / BIC sprechen, befinden wir uns normalerweise in einer Situation, in der alle Aspekte der Modellbildung außer der Auswahl der Kovariaten festgelegt sind. - user13273 13. August 12 um 21:17 Uhr

Die Entscheidung, welche spezifischen Kovariaten in ein Modell einbezogen werden sollen, erfolgt in der Regel nach dem Begriff Modellauswahl, und es gibt eine Reihe von Büchern mit Modellauswahl im Titel, die in erster Linie darüber entscheiden, welche Modellkovariaten / -parameter in das Modell einbezogen werden sollen. - Michael Chernick 24. August 12 um 14:44 Uhr


3
Gute Frage! Zumindest ein Teil der Auflösung besteht darin, in der Terminologie dieses Dokuments zwischen dem "Ziel" des BIC zu unterscheiden - dem wahren Modell, das mit einer sehr großen Stichprobengröße ausgewählt wird - und dem Modell, das mit einer bestimmten Stichprobe ausgewählt wird Größe. Es gibt also keinen Widerspruch, wenn man eine verschachtelte Folge von Modellen mit einem zunehmenden Nein betrachtet. Parameter, wobei das Ziel des BIC das Modell mit 9 Parametern ist, obwohl der BIC bei einer moderaten Stichprobengröße das Modell mit 4 Parametern
auswählt

1
@Scortchi: Gutes Beispiel ist aber nicht das Konzept eines Zielmodells nicht vollständig redundante , wenn wir über verschachtelte Modelle im Gespräch sind? Handelt es sich bei dem Kontext um eine Reihe verschachtelter Modelle (hier geht es um die Variablenauswahl): BIC verfügt möglicherweise über ein komplexeres Zielmodell , wählt jedoch niemals ein komplexeres Modell als AIC. In jedem anderen Kontext (wir sprechen über die Modellauswahl) (mit großem Stichprobenumfang) wird in der Arbeit behauptet, dass BIC ein komplexeres ("allgemeines") Zielmodell als AIC auswählen wird. Wie das konkret passiert, ist mir noch nicht klar.
Erosennin

@Erosennin hast du jemals eine Antwort auf deine allgemeine Frage gefunden?
Zipzapboing

Antworten:


3

Manchmal trennen Modellierer die Variablenauswahl in einen bestimmten Schritt in der Modellentwicklung. Zum Beispiel führten sie zuerst explorative Analysen durch, recherchierten die akademische Literatur und die Industriepraktiken und stellten dann eine Liste der Kandidatenvariablen auf. Sie würden diesen Schritt nennen variable Auswahl .

yich=jmXichjmβjm+εich,
jmjmm

Dies ist ähnlich wie beim maschinellen Lernen über Feature-Engineering gesprochen wird , wenn Variablen erstellt werden. Sie fügen die Features in LASSO oder ähnliche Frameworks ein, in denen Sie mit diesen Features (Variablen) ein Modell erstellen. In diesem Zusammenhang ist es sinnvoll, die Variablenauswahl in einen bestimmten Schritt aufzuteilen, da Sie dem Algorithmus überlassen, die richtigen Koeffizienten für Variablen auszuwählen und keine Variablen zu entfernen. Ihre Beurteilung (in Bezug darauf, welche Variable in ein Modell einfließt) wird im Variablenauswahlschritt isoliert, der Rest hängt vom Anpassungsalgorithmus ab.

m

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.