Als «generalized-linear-model» getaggte Fragen

Eine Verallgemeinerung der linearen Regression, die nichtlineare Beziehungen über eine "Verknüpfungsfunktion" ermöglicht und die Varianz der Antwort vom vorhergesagten Wert abhängt. (Nicht zu verwechseln mit dem "allgemeinen linearen Modell", das das gewöhnliche lineare Modell auf die allgemeine Kovarianzstruktur und die multivariate Antwort erweitert.)

1
Eingabeformat für Antwort in Binomial glm in R
In Rgibt es drei Methoden, um die Eingabedaten für eine logistische Regression mit der glmFunktion zu formatieren : Daten können für jede Beobachtung in einem "binären" Format vorliegen (z. B. y = 0 oder 1 für jede Beobachtung); Die Daten können im "Wilkinson-Rogers" -Format vorliegen (z. B. y = cbind(success, …


2
Grundlegendes zur Erstellung von Dummy-Variablen (manuell oder automatisiert) in GLM
Wenn in der glm-Formel eine Faktorvariable (z. B. Geschlecht mit den Ebenen M und F) verwendet wird, werden Dummy-Variablen erstellt, die zusammen mit den zugehörigen Koeffizienten (z. B. genderM) in der glm-Modellzusammenfassung aufgeführt sind. Wenn Sie sich nicht auf R verlassen, um den Faktor auf diese Weise aufzuteilen, wird der …

1
Mitteln wir für die Modellmittelung eines GLM die Vorhersagen auf der Link- oder Antwortskala?
Um die modellgemittelten Vorhersagen auf der Antwortskala eines GLM zu berechnen, welche ist "korrekt" und warum? Berechnen Sie die modellgemittelte Vorhersage auf der Verbindungsskala und transformieren Sie sie anschließend auf die Antwortskala zurück Transformieren Sie die Vorhersagen in die Antwortskala und berechnen Sie dann den Modelldurchschnitt Die Vorhersagen sind nahe …

2
Splines in GLM und GAM
Ist es falsch, dass Splines nur in GAM-Modellen und nicht in GLM-Modellen verfügbar sind? Ich habe das vor einiger Zeit gehört und mich gefragt, ob dies nur ein Missverständnis ist oder ob es eine Wahrheit ist. Hier ist eine Illustration:

1
Können Sie eine einfache intuitive Erklärung der IRLS-Methode zum Ermitteln der MLE eines GLM geben?
Hintergrund: Ich versuche, Princetons Überprüfung der MLE-Schätzung für GLM zu folgen . Verstehe ich die Grundlagen der MLE Schätzung: likelihood, score, beobachteten und erwarteten Fisher informationund die Fisher scoringTechnik. Und ich weiß, wie man eine einfache lineare Regression mit einer MLE-Schätzung rechtfertigt . Die Frage: Ich kann nicht einmal die …

2
Verwendung von lm für einen 2-Proben-Proportional-Test
Ich verwende seit einiger Zeit lineare Modelle, um 2-Stichproben-Proportionen-Tests durchzuführen, habe jedoch festgestellt, dass dies möglicherweise nicht vollständig korrekt ist. Es scheint, dass die Verwendung eines verallgemeinerten linearen Modells mit einer Binomialfamilie + Identitätsverknüpfung genau die ungepoolten 2-Stichproben-Proportionen-Testergebnisse liefert. Die Verwendung eines linearen Modells (oder Glm mit Gaußscher Familie) ergibt …


2
Ridge bestraft GLMs mit Row Augmentation?
Ich habe gelesen, dass eine Ridge-Regression durch einfaches Hinzufügen von Datenzeilen zur ursprünglichen Datenmatrix erzielt werden kann, wobei jede Zeile unter Verwendung von 0 für die abhängigen Variablen und der Quadratwurzel von kkk oder Null für die unabhängigen Variablen erstellt wird. Für jede unabhängige Variable wird dann eine zusätzliche Zeile …

1
Überdispersions- und Modellierungsalternativen in Poisson-Zufallseffektmodellen mit Offsets
Ich bin auf eine Reihe praktischer Fragen gestoßen, wenn ich Zähldaten aus experimenteller Forschung mithilfe eines subjektinternen Experiments modelliere. Ich beschreibe kurz das Experiment, die Daten und das, was ich bisher gemacht habe, gefolgt von meinen Fragen. Einer Stichprobe von Befragten wurden nacheinander vier verschiedene Filme gezeigt. Nach jedem Film …

1
Logistische Regression mit Regressionssplines in R
Ich habe ein logistisches Regressionsmodell entwickelt, das auf retrospektiven Daten aus einer nationalen Traumadatenbank für Kopfverletzungen in Großbritannien basiert. Das Hauptergebnis ist die 30-Tage-Mortalität (als "Überlebensmaß" bezeichnet). Andere Maßnahmen mit veröffentlichten Hinweisen auf signifikante Auswirkungen auf das Ergebnis in früheren Studien umfassen: Year - Year of procedure = 1994-2013 Age …

5
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Überprüfung der Normalität von Residuen in verallgemeinerten linearen Modellen
In diesem Artikel werden verallgemeinerte lineare Modelle (sowohl binomiale als auch negative binomiale Fehlerverteilungen) zur Analyse von Daten verwendet. Aber dann gibt es im statistischen Analyseteil der Methoden diese Aussage: ... und zweitens durch Modellierung der Anwesenheitsdaten mithilfe logistischer Regressionsmodelle und der Futtersuchzeitdaten mithilfe eines verallgemeinerten linearen Modells (GLM). Eine …

1
Logarithmisch verknüpftes Gamma-GLM vs. logarithmisch verknüpftes Gaußsches GLM vs. logarithmisch transformiertes LM
Aus meinen Ergebnissen geht hervor, dass GLM Gamma die meisten Annahmen erfüllt, aber ist es eine lohnende Verbesserung gegenüber dem logarithmisch transformierten LM? Die meiste Literatur, die ich gefunden habe, befasst sich mit Poisson- oder Binomial-GLMs. Ich fand den Artikel EVALUIERUNG VON GENERALISIERTEN LINEAREN MODELLANNAHMEN MIT RANDOMISIERUNG sehr nützlich, aber …

1
Gibt es ein Problem mit Multikollinearität und Splines-Regression?
Bei Verwendung natürlicher (dh eingeschränkter) kubischer Splines sind die erzeugten Basisfunktionen hochgradig kollinear, und bei Verwendung in einer Regression scheinen sich sehr hohe VIF-Statistiken (Varianzinflationsfaktor) zu ergeben, die Multikollinearität signalisieren. Wenn man den Fall eines Modells für Vorhersagezwecke in Betracht zieht, ist dies ein Problem? Es scheint, als ob dies …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.