Als «generalized-linear-model» getaggte Fragen

Eine Verallgemeinerung der linearen Regression, die nichtlineare Beziehungen über eine "Verknüpfungsfunktion" ermöglicht und die Varianz der Antwort vom vorhergesagten Wert abhängt. (Nicht zu verwechseln mit dem "allgemeinen linearen Modell", das das gewöhnliche lineare Modell auf die allgemeine Kovarianzstruktur und die multivariate Antwort erweitert.)


4
Diagnosediagramme für die Zählregression
Welche diagnostischen Diagramme (und möglicherweise formalen Tests) sind für Regressionen, bei denen das Ergebnis eine Zählvariable ist, am aussagekräftigsten? Ich interessiere mich besonders für Poisson- und negative Binomialmodelle sowie für Gegenstücke mit Null-Inflation und Hürden. Die meisten Quellen, die ich gefunden habe, zeichnen einfach die Residuen gegen angepasste Werte auf, …

4
Wann werden Gamma-GLMs verwendet?
Die Gammaverteilung kann eine große Bandbreite von Formen annehmen, und angesichts des Zusammenhangs zwischen Mittelwert und Varianz durch ihre beiden Parameter scheint sie geeignet zu sein, die Heteroskedastizität in nicht negativen Daten auf eine Art und Weise zu behandeln, wie dies bei logarithmisch transformiertem OLS der Fall ist Sie müssen …

3
Ein Beispiel: LASSO-Regression unter Verwendung von glmnet für binäre Ergebnisse
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

5
Was sind moderne, einfach zu verwendende Alternativen zur schrittweisen Regression?
Ich habe einen Datensatz mit ungefähr 30 unabhängigen Variablen und möchte ein verallgemeinertes lineares Modell (GLM) erstellen, um die Beziehung zwischen ihnen und der abhängigen Variablen zu untersuchen. Mir ist bewusst, dass die Methode, die mir für diese Situation beigebracht wurde, die schrittweise Regression, jetzt als statistische Sünde angesehen wird …

4
Was ist der Unterschied zwischen einer "Linkfunktion" und einer "kanonischen Linkfunktion" für GLM?
Was ist der Unterschied zwischen den Begriffen "Link-Funktion" und "Canonical Link-Funktion"? Gibt es auch irgendwelche (theoretischen) Vorteile, wenn man eins gegenüber dem anderen verwendet? Beispielsweise kann eine binäre Antwortvariable unter Verwendung vieler Verknüpfungsfunktionen wie logit , probit usw. modelliert werden. Logit wird hier jedoch als die "kanonische" Verknüpfungsfunktion betrachtet.

1
Wie interpretiere ich Koeffizienten in einer Poisson-Regression?
Wie kann ich die Haupteffekte (Koeffizienten für Dummy-codierten Faktor) in einer Poisson-Regression interpretieren? Nehmen wir das folgende Beispiel an: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), levels = c(1, …


1
Warum wird die Quadratwurzeltransformation für Zählungsdaten empfohlen?
Es wird oft empfohlen, die Quadratwurzel zu ziehen, wenn Sie Daten zählen. (Beispiele auf CV finden @ HarveyMotulsky Antwort hier oder @ whuber Antwort hier .) Auf der anderen Seite, wenn ein allgemeines lineares Modell mit einer Reaktionsvariable passend als Poisson verteilte, ist das Protokoll der kanonische Link . Dies …

4
Auswahl zwischen LM und GLM für eine log-transformierte Antwortvariable
Ich versuche die Philosophie zu verstehen, die hinter der Verwendung eines generalisierten linearen Modells (GLM) gegenüber einem linearen Modell (LM) steckt. Ich habe unten einen Beispieldatensatz erstellt: Log( y) = x + εLog⁡(y)=X+ε\log(y) = x + \varepsilon Das Beispiel hat nicht den Fehler als Funktion der Größe vonyεε\varepsilonyyy , daher …

9
Empfehlung für erweiterte Statistikbücher
Auf dieser Website gibt es mehrere Themen mit Buchempfehlungen zu Einführungsstatistiken und maschinellem Lernen. Ich suche jedoch nach einem Text zu erweiterten Statistiken, der nach Priorität geordnet ist: maximale Wahrscheinlichkeit, verallgemeinerte lineare Modelle, Hauptkomponentenanalyse, nichtlineare Modelle . Ich habe versucht, statistische Modelle von AC Davison, aber ehrlich gesagt musste ich …

1
Erhalten von vorhergesagten Werten (Y = 1 oder 0) aus einer logistischen Regressionsmodellanpassung
Nehmen wir an, ich habe ein Klassenobjekt glm(das einem logistischen Regressionsmodell entspricht) und möchte die predict.glmmit dem Argument angegebenen vorhergesagten Wahrscheinlichkeiten type="response"in binäre Antworten umwandeln, dh oder . Was ist der schnellste und kanonischste Weg, dies in R zu tun?Y.= 1Y=1Y=1Y.= 0Y=0Y=0 Auch predict.glmwenn mir bewusst ist , dass ich …



3
Lineares Modell mit logarithmisch transformierter Antwort vs. verallgemeinertes lineares Modell mit logarithmischer Verknüpfung
In diesem Artikel mit dem Titel "AUSWAHL VON GENERALISIERTEN LINEAREN MODELLEN FÜR MEDIZINISCHE DATEN" schreiben die Autoren: In einem verallgemeinerten linearen Modell wird der Mittelwert durch die Verknüpfungsfunktion transformiert, anstatt die Antwort selbst zu transformieren. Die beiden Transformationsmethoden können zu sehr unterschiedlichen Ergebnissen führen. Beispielsweise ist der Mittelwert der logarithmisch …

3
Interpretation des log transformierten Prädiktors und / oder der Antwort
Ich frage mich, ob es einen Unterschied in der Interpretation macht, ob nur die abhängigen, sowohl die abhängigen als auch die unabhängigen Variablen oder nur die unabhängigen Variablen log-transformiert werden. Betrachten Sie den Fall von log(DV) = Intercept + B1*IV + Error Ich kann die IV als prozentuale Erhöhung interpretieren, …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
Wie werden künstliche Daten für die logistische Regression simuliert?
Ich weiß, dass ich etwas in meinem Verständnis der logistischen Regression vermisse und würde mich über jede Hilfe sehr freuen. Nach meinem Verständnis geht die logistische Regression davon aus, dass die Wahrscheinlichkeit eines 1-Ergebnisses bei den Eingaben eine lineare Kombination der Eingaben ist, die durch eine inverse logistische Funktion geleitet …



2
Simulation logistischer Regressionskraftanalysen - entworfene Experimente
Diese Frage beantwortet @Greg Snow in Bezug auf eine Frage, die ich bezüglich der Leistungsanalyse mit logistischer Regression und SAS gestellt habe Proc GLMPOWER. Wenn ich ein Experiment entwerfe und die Ergebnisse in einer faktoriellen logistischen Regression auswerten möchte, wie kann ich mithilfe der Simulation (und hier ) eine Leistungsanalyse …

1
Warum unterscheiden sich meine p-Werte zwischen der logistischen Regressionsausgabe, dem Chi-Quadrat-Test und dem Konfidenzintervall für den OP?
Ich habe eine logistische Regression aufgebaut, bei der die Ergebnisvariable nach der Behandlung geheilt wird ( Curevs. No Cure). Alle Patienten in dieser Studie erhielten eine Behandlung. Ich bin daran interessiert zu sehen, ob Diabetes mit diesem Ergebnis zusammenhängt. In R sieht meine logistische Regressionsausgabe folgendermaßen aus: Call: glm(formula = …


1
Logistische Regression: Anova-Chi-Quadrat-Test vs. Signifikanz der Koeffizienten (anova () vs. summary () in R)
Ich habe ein logistisches GLM-Modell mit 8 Variablen. Ich habe einen Chi-Quadrat-Test in R durchgeführt, anova(glm.model,test='Chisq')und 2 der Variablen haben sich als vorhersagend erwiesen, wenn sie oben im Test bestellt wurden, und nicht so sehr, wenn sie unten bestellt wurden. Das summary(glm.model)deutet darauf hin, dass ihre Koeffizienten unbedeutend sind (hoher …

3
Unterschied zwischen verallgemeinerten linearen Modellen und verallgemeinerten linearen gemischten Modellen
Ich frage mich, was die Unterschiede zwischen gemischten und ungemischten GLMs sind. In SPSS können Benutzer beispielsweise über das Dropdown-Menü Folgendes anpassen: analyze-> generalized linear models-> generalized linear models & analyze-> mixed models-> generalized linear Gehen sie anders mit fehlenden Werten um? Meine abhängige Variable ist binär und ich habe …

3
Restdiagnoseplots für glm-Modelle interpretieren?
Ich suche nach Richtlinien zur Interpretation von Residuendiagrammen von glm-Modellen. Insbesondere Poisson-, Negativ-Binomial- und Binomial-Modelle. Was können wir von diesen Darstellungen erwarten, wenn die Modelle "korrekt" sind? (Wir erwarten beispielsweise, dass die Varianz mit zunehmendem prognostizierten Wert zunimmt, wenn es sich um ein Poisson-Modell handelt.) Ich weiß, dass die Antworten …

2
Wann wird die logistische Regression in geschlossener Form gelöst?
Nehmen wir x∈{0,1}dx∈{0,1}dx \in \{0,1\}^d und y∈{0,1}y∈{0,1}y \in \{0,1\} und nehmen wir an, wir modellieren die Aufgabe der Vorhersage von y mit gegebenem x unter Verwendung der logistischen Regression. Wann können logistische Regressionskoeffizienten in geschlossener Form geschrieben werden? Ein Beispiel ist, wenn wir ein gesättigtes Modell verwenden. Das heißt, definiert …

2
Was ist Quasi-Binomialverteilung (im Kontext von GLM)?
Ich hoffe, jemand kann einen intuitiven Überblick darüber geben, was Quasibinomialverteilung ist und was sie bewirkt. Diese Punkte interessieren mich besonders: Wie sich das Quasibinom von der Binomialverteilung unterscheidet. Wenn die Antwortvariable eine Proportion ist (Beispielwerte sind 0,23, 0,11, 0,78, 0,98), wird ein Quasibinomialmodell in R ausgeführt, ein Binomialmodell jedoch …

2
Was sind die Annahmen einer negativen binomischen Regression?
Ich arbeite mit einem großen Datensatz (vertraulich, daher kann ich nicht zu viel teilen) und bin zu dem Schluss gekommen, dass eine negative binomische Regression erforderlich wäre. Ich habe noch nie zuvor eine glm-Regression durchgeführt, und ich kann keine klaren Informationen über die Annahmen finden. Sind sie für MLR gleich? …

5
Wie kann der Least Square Estimator für die multiple lineare Regression abgeleitet werden?
Im einfachen linearen Regressionsfall können Sie den Schätzer für kleinste Quadrate , sodass Sie nicht kennen müssen, um \ hat \ beta_1 zu schätzeny=β0+β1xy=β0+β1xy=\beta_0+\beta_1xβ^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2\hat\beta_1=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}β^0β^0\hat\beta_0β^1β^1\hat\beta_1 Angenommen, ich habe y=β1x1+β2x2y=β1x1+β2x2y=\beta_1x_1+\beta_2x_2 . Wie kann ich \ hat \ beta_1 ableiten, β^1β^1\hat\beta_1ohne \ hat \ beta_2 zu schätzen β^2β^2\hat\beta_2? oder geht …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.