Ich verstehe also, dass die Variablenauswahl Teil der Modellauswahl ist. Woraus besteht die Modellauswahl genau? Ist es mehr als das Folgende:
1) Wählen Sie eine Distribution für Ihr Modell
2) erklärende Variablen wählen,?
Ich frage dies, weil ich einen Artikel von Burnham & Anderson lese : AIC vs BIC, in dem sie über AIC und BIC bei der Modellauswahl sprechen. Beim Lesen dieses Artikels wurde mir klar, dass ich "Modellauswahl" als "Variablenauswahl" angesehen habe (siehe Anmerkungen. Versucht BIC, ein echtes Modell zu finden? )
Ein Auszug aus dem Artikel, in dem es um 12 Modelle mit zunehmendem Grad an "Allgemeingültigkeit" geht. Diese Modelle zeigen "Konizitätseffekte" (Abbildung 1), wenn KL-Informationen gegen die 12 Modelle aufgetragen werden:
VERSCHIEDENE PHILOSOPHIEN UND ZIELMODELLE ... Obwohl das Ziel von BIC ein allgemeineres Modell als das Zielmodell für AIC ist, ist das von BIC am häufigsten ausgewählte Modell weniger allgemein als Modell 7, es sei denn, n ist sehr groß. Es könnte Modell 5 oder 6 sein. Aus zahlreichen Veröffentlichungen und Simulationen in der Literatur ist bekannt, dass AIC im Zusammenhang mit Tapering-Effekten (Abbildung 1) besser abschneidet als BIC. Wenn dies der Kontext der Echtdatenanalyse ist, sollte AIC verwendet werden.
Wie kann BIC jemals ein Modell auswählen, das bei der Modellauswahl komplexer ist als AIC? Ich verstehe das nicht! Was ist konkret "Modellauswahl" und wann wählt BIC konkret ein "allgemeineres" Modell als AIC?
Wenn es sich um die Variablenauswahl handelt, muss der BIC mit Sicherheit immer das Modell mit der geringsten Anzahl von Variablen auswählen, richtig? Der Term in der BIC benachteiligt hinzugefügte Variablen immer stärker als der Term in der AIC. Aber ist das nicht unvernünftig, wenn " das Ziel von BIC ein allgemeineres Modell als das Zielmodell für AIC ist "?
EDIT :
Aus einer Diskussion in den Kommentaren unter Gibt es einen Grund, den AIC oder den BIC dem anderen vorzuziehen? Wir sehen eine kleine Diskussion zwischen @Michael Chernick und @ user13273 in den Kommentaren, die mich zu der Annahme veranlasst, dass dies etwas ist, das nicht so trivial ist:
Ich halte es für angemessener, diese Diskussion als "Merkmalsauswahl" oder "Kovariatenauswahl" zu bezeichnen. Für mich ist die Modellauswahl viel umfassender und beinhaltet die Spezifikation der Fehlerverteilung, der Form der Verknüpfungsfunktion und der Form der Kovariaten. Wenn wir über AIC / BIC sprechen, befinden wir uns normalerweise in einer Situation, in der alle Aspekte der Modellbildung außer der Auswahl der Kovariaten festgelegt sind. - user13273 13. August 12 um 21:17 Uhr
Die Entscheidung, welche spezifischen Kovariaten in ein Modell einbezogen werden sollen, erfolgt in der Regel nach dem Begriff Modellauswahl, und es gibt eine Reihe von Büchern mit Modellauswahl im Titel, die in erster Linie darüber entscheiden, welche Modellkovariaten / -parameter in das Modell einbezogen werden sollen. - Michael Chernick 24. August 12 um 14:44 Uhr