Als «model-selection» getaggte Fragen

Die Modellauswahl ist ein Problem bei der Beurteilung, welches Modell aus einem Satz am besten funktioniert. Beliebte Methoden sindR.2, AIC- und BIC-Kriterien, Testsätze und Kreuzvalidierung. In gewissem Maße ist die Merkmalsauswahl ein Teilproblem der Modellauswahl.

2
Ist es möglich, dass der AIC und der BIC eine völlig unterschiedliche Modellauswahl bieten?
Ich führe ein Poisson-Regressionsmodell mit 1 Antwortvariablen und 6 Kovariaten durch. Die Modellauswahl mit AIC ergibt ein Modell mit allen Kovariaten sowie 6 Interaktionstermen. Der BIC führt jedoch zu einem Modell mit nur 2 Kovariaten und keinen Interaktionstermen. Ist es möglich, dass die beiden Kriterien, die sehr ähnlich aussehen, völlig …

2
Wie vergleiche ich Modelle auf Basis von AIC?
Wir haben zwei Modelle, die dieselbe Methode zur Berechnung der Log-Wahrscheinlichkeit verwenden, und der AIC für eines ist niedriger als das andere. Das mit dem niedrigeren AIC ist jedoch weitaus schwieriger zu interpretieren. Wir haben Schwierigkeiten zu entscheiden, ob es sich lohnt, die Schwierigkeit einzuführen, und wir haben dies anhand …

1
Variablenauswahl vs Modellauswahl
Ich verstehe also, dass die Variablenauswahl Teil der Modellauswahl ist. Woraus besteht die Modellauswahl genau? Ist es mehr als das Folgende: 1) Wählen Sie eine Distribution für Ihr Modell 2) erklärende Variablen wählen,? Ich frage dies, weil ich einen Artikel von Burnham & Anderson lese : AIC vs BIC, in …

1
Wann sollte ich mir Sorgen um das Jeffreys-Lindley-Paradoxon bei der Wahl des Bayes'schen Modells machen?
Ich betrachte einen großen (aber begrenzten) Raum von Modellen unterschiedlicher Komplexität, die ich mit RJMCMC erforsche . Das Voranstellen des Parametervektors für jedes Modell ist ziemlich informativ. In welchen Fällen (wenn überhaupt) sollte ich mir Sorgen machen, dass das Jeffreys-Lindley-Paradoxon einfachere Modelle bevorzugt, wenn eines der komplexeren Modelle besser geeignet …

1
Was ist der Unterschied zwischen 'Hypothesentest' und 'Modellauswahl'?
In der Literatur werden beide Begriffe oft synonym verwendet oder miteinander verwoben. Ich versuche jetzt, eine klare Unterscheidung zwischen beiden Begriffen zu finden. Aus meiner Sicht wird eine Hypothese normalerweise über ein Modell ausgedrückt. Selbst wenn wir eine Null-gegen-Alternativ-Hypothese testen, machen wir aus meiner Sicht eine Modellauswahl. Kann mir jemand …

3
Bayesian vs MLE, Überanpassungsproblem
In Bishops PRML-Buch sagt er, dass Überanpassung ein Problem bei der Maximum Likelihood Estimation (MLE) ist und Bayesian dies vermeiden kann. Aber ich denke, Überanpassung ist eher ein Problem bei der Modellauswahl als bei der Methode zur Parameterschätzung. Angenommen, ich habe einen Datensatz , der über f ( x ) …

1
Erklären Sie die Schritte des LLE-Algorithmus (Local Linear Embedding).
Ich verstehe, dass das Grundprinzip des Algorithmus für LLE aus drei Schritten besteht. Ermitteln der Nachbarschaft jedes Datenpunkts anhand einer Metrik wie k-nn. Suchen Sie für jeden Nachbarn Gewichte, die die Auswirkung des Nachbarn auf den Datenpunkt angeben. Konstruieren Sie die niedrig dimensionale Einbettung der Daten basierend auf den berechneten …

1
Logarithmisch verknüpftes Gamma-GLM vs. logarithmisch verknüpftes Gaußsches GLM vs. logarithmisch transformiertes LM
Aus meinen Ergebnissen geht hervor, dass GLM Gamma die meisten Annahmen erfüllt, aber ist es eine lohnende Verbesserung gegenüber dem logarithmisch transformierten LM? Die meiste Literatur, die ich gefunden habe, befasst sich mit Poisson- oder Binomial-GLMs. Ich fand den Artikel EVALUIERUNG VON GENERALISIERTEN LINEAREN MODELLANNAHMEN MIT RANDOMISIERUNG sehr nützlich, aber …

1
AIC für nicht verschachtelte Modelle: Normalisierungskonstante
Der AIC ist definiert als , wobei der Maximum-Likelihood-Schätzer und die Dimension des Parameterraums ist. Bei der Schätzung von vernachlässigt man normalerweise den konstanten Faktor der Dichte. Dies ist der Faktor, der nicht von den Parametern abhängt, um die Wahrscheinlichkeit zu vereinfachen. Andererseits ist dieser Faktor für die Berechnung des …

4
PCA-Modellauswahl mit AIC (oder BIC)
Ich möchte das Akaike Information Criterion (AIC) verwenden, um die entsprechende Anzahl von Faktoren auszuwählen, die in einem PCA extrahiert werden sollen. Das einzige Problem ist, dass ich nicht sicher bin, wie ich die Anzahl der Parameter bestimmen soll. Man betrachte eine T×NT×NT\times N Matrix XXX , wobei NNN die …

1
Unterschiede zwischen PROC Mixed und lme / lmer in R - Freiheitsgraden
Hinweis: Diese Frage ist ein Repost, da meine vorherige Frage aus rechtlichen Gründen gelöscht werden musste. Beim Vergleich von PROC MIXED von SAS mit der Funktion lmeaus dem nlmePaket in R bin ich auf einige verwirrende Unterschiede gestoßen. Insbesondere unterscheiden sich die Freiheitsgrade in den verschiedenen Tests zwischen PROC MIXEDund …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 



2
GLM nach Modellauswahl oder Regularisierung
Ich möchte diese Frage in zwei Teile teilen. Beide befassen sich mit einem verallgemeinerten linearen Modell, aber das erste befasst sich mit der Modellauswahl und das andere mit der Regularisierung. Hintergrund: Ich benutze GLMs (lineare, logistische, Gamma-Regressions-) Modelle sowohl zur Vorhersage als auch zur Beschreibung. Wenn ich mich auf die …

2
Wie soll ich mit kategorialen Variablen mit mehreren Ebenen umgehen, wenn ich eine Rückwärtseliminierung durchführe?
Ich mache ein einfaches AIC-basiertes Rückwärtseliminierungsmodell, bei dem einige Variablen kategoriale Variablen mit mehreren Ebenen sind. Diese Variablen werden als Satz von Dummy-Variablen modelliert. Sollte ich bei der Rückwärtseliminierung alle Ebenen einer Variablen zusammen entfernen? Oder sollte ich jede Dummy-Variable separat behandeln? Und warum? Als verwandte Frage behandelt Schritt in …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.