Als «generalized-linear-model» getaggte Fragen

Eine Verallgemeinerung der linearen Regression, die nichtlineare Beziehungen über eine "Verknüpfungsfunktion" ermöglicht und die Varianz der Antwort vom vorhergesagten Wert abhängt. (Nicht zu verwechseln mit dem "allgemeinen linearen Modell", das das gewöhnliche lineare Modell auf die allgemeine Kovarianzstruktur und die multivariate Antwort erweitert.)

2
Warum unterscheidet sich GLM von einem LM mit transformierter Variable?
Wie in diesem Kurshandbuch (Seite 1) erläutert , kann ein lineares Modell in folgender Form geschrieben werden: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, Dabei ist die Antwortvariable und die erklärende Variable .yyyxixix_{i}ithithi^{th} Mit dem Ziel, Testannahmen zu erfüllen, kann man häufig die Antwortvariable transformieren. …

1
Hat die Protokollwahrscheinlichkeit in GLM die Konvergenz zu globalen Maxima garantiert?
Meine Fragen sind: Werden generalisierte lineare Modelle (GLMs) garantiert zu einem globalen Maximum konvergieren? Wenn ja warum? Welche Einschränkungen gibt es für die Verbindungsfunktion, um die Konvexität sicherzustellen? Mein Verständnis von GLMs ist, dass sie eine hochgradig nichtlineare Wahrscheinlichkeitsfunktion maximieren. Daher würde ich mir vorstellen, dass es mehrere lokale Maxima …

3
Wie würden Sie verallgemeinerten linearen Modellen Menschen ohne statistischen Hintergrund erklären?
Es fällt mir immer schwer, dem Publikum statistische Techniken ohne statistischen Hintergrund zu erklären. Wenn ich erklären wollte, was GLM für ein solches Publikum ist (ohne statistische Fachsprache auszusprechen), welcher Weg wäre der beste oder effektivste? Ich erkläre GLM normalerweise mit drei Teilen - (1) der Zufallskomponente, die eine Antwortvariable …

2
Sind Überdispersionstests in GLMs tatsächlich * nützlich *?
Das Phänomen der "Überdispersion" in einem GLM tritt immer dann auf, wenn wir ein Modell verwenden, das die Varianz der Antwortvariablen einschränkt, und die Daten eine größere Varianz aufweisen, als es die Modellbeschränkung zulässt. Dies tritt häufig bei der Modellierung von Zähldaten mit einem Poisson-GLM auf und kann durch bekannte …


4
Die Maschinengenauigkeit zur Steigerung des Gradienten nimmt mit zunehmender Anzahl von Iterationen ab
Ich experimentiere mit dem Algorithmus der Gradientenverstärkungsmaschine über das caretPaket in R. Unter Verwendung eines kleinen Datensatzes für Hochschulzulassungen habe ich den folgenden Code ausgeführt: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 


2
Angabe einer Kovarianzstruktur: Vor- und Nachteile
Was sind die Vorteile der Angabe einer Kovarianzstruktur in einer GLM (anstatt alle nicht diagonalen Einträge in der Kovarianzmatrix als Null zu behandeln)? Abgesehen davon, was man über die Daten weiß, macht man es auch Passform verbessern? Verbesserung der Vorhersagegenauigkeit für ausgelagerte Daten? Lassen Sie uns das Ausmaß der Kovarianz …

3
Kann ein Modell für nicht negative Daten mit Nullen (Tweedie-GLM, null-aufgeblähtes GLM usw.) genaue Nullen vorhersagen?
Eine Tweedie-Verteilung kann verzerrte Daten mit einer Punktmasse von Null modellieren, wenn der Parameter (Exponent in der Mittelwert-Varianz-Beziehung) zwischen 1 und 2 liegt.ppp In ähnlicher Weise kann ein Modell mit Null-Inflation (unabhängig davon, ob es sich um ein kontinuierliches oder ein diskretes Modell handelt) eine große Anzahl von Nullen aufweisen. …

2
Wie gehe ich mit einem Fehler wie „Koeffizienten: 14 wegen Singularitäten nicht definiert“ in R um?
Wie kann man diesem Fehler entgegenwirken, wenn Sie bei einem GLM den Fehler "Wegen Singularitäten nicht definiert" in der anova-Ausgabe erhalten? Einige haben vermutet, dass es an der Kollinearität zwischen den Kovariaten liegt oder dass eine der Ebenen im Datensatz nicht vorhanden ist (siehe: Interpretation "wegen Singularitäten nicht definiert" in …

2
Warum hat die lineare Regression Annahmen über das Residuum, aber das verallgemeinerte lineare Modell hat Annahmen über die Reaktion?
Warum haben lineare Regression und verallgemeinertes Modell inkonsistente Annahmen? Bei der linearen Regression nehmen wir an, dass der Rest von Gauß stammt Bei einer anderen Regression (logistische Regression, Gift-Regression) gehen wir davon aus, dass die Reaktion von einer gewissen Verteilung ausgeht (Binomial, Poission usw.). Warum nehmen Sie manchmal Rest- und …

1
Wie wirken sich zufällige Effekte mit nur einer Beobachtung auf ein verallgemeinertes lineares Mischmodell aus?
Ich habe einen Datensatz, in dem die Variable, die ich als Zufallseffekt verwenden möchte, für einige Ebenen nur eine einzige Beobachtung enthält. Aufgrund der Antworten auf vorherige Fragen habe ich festgestellt, dass dies im Prinzip in Ordnung sein kann. Kann ich ein gemischtes Modell mit Motiven kombinieren, bei denen nur …

2
GLM: Überprüfung der Verteilungs- und Link-Funktion
Ich habe ein verallgemeinertes lineares Modell, das eine Gaußsche Verteilungs- und Protokollverknüpfungsfunktion anwendet. Nach dem Anpassen des Modells überprüfe ich die Residuen: QQ-Diagramm, Residuen gegen vorhergesagte Werte, Histogramm der Residuen (unter Berücksichtigung der gebotenen Vorsicht). Alles sieht gut aus. Dies scheint mir nahezulegen, dass die Wahl einer Gaußschen Verteilung durchaus …


2
Verstößt die Verwendung von Zähldaten als unabhängige Variable gegen eine der GLM-Annahmen?
Ich möchte Zähldaten als Kovariaten verwenden, während ich ein logistisches Regressionsmodell anpasse. Meine Frage ist: Verstoße ich gegen eine Annahme der logistischen (und allgemeiner der verallgemeinerten linearen) Modelle, indem ich count, nicht negative ganzzahlige Variablen als unabhängige Variablen verwende? Ich fand in der Literatur viele Hinweise darauf, wie heiß es …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.