Als «zero-inflation» getaggte Fragen

Übermäßige Nullen in einer Variablen im Vergleich zu einer angegebenen Referenzverteilung. Regressionsansätze umfassen Modelle ohne Inflation und Hürdenmodelle (zweiteilig). Für Zähldaten sind Null-Inflations- und Hürdenmodelle basierend auf Poisson- oder negativen Binomialverteilungen üblich (ZIP / ZINB und HP / HNB).

4
Diagnosediagramme für die Zählregression
Welche diagnostischen Diagramme (und möglicherweise formalen Tests) sind für Regressionen, bei denen das Ergebnis eine Zählvariable ist, am aussagekräftigsten? Ich interessiere mich besonders für Poisson- und negative Binomialmodelle sowie für Gegenstücke mit Null-Inflation und Hürden. Die meisten Quellen, die ich gefunden habe, zeichnen einfach die Residuen gegen angepasste Werte auf, …

4
Was ist der Unterschied zwischen Null-Inflations- und Hürdenmodellen?
Ich frage mich, ob es einen deutlichen Unterschied zwischen den sogenannten Null-Inflations-Verteilungen (Modellen) und den sogenannten Hürden-bei-Null-Verteilungen (Modellen) gibt. Die Begriffe kommen in der Literatur häufig vor, und ich vermute, dass sie nicht gleich sind. Erklären Sie mir bitte den Unterschied in einfachen Begriffen.

3
Ein Beispiel: LASSO-Regression unter Verwendung von glmnet für binäre Ergebnisse
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


1
Wann werden Poisson-GLMs vs. geometrische GLMs vs. negative Binomial-GLMs für Zählungsdaten verwendet?
Ich versuche für mich selbst ein Layout zu erstellen, wenn es angebracht ist, welchen Regressionstyp (geometrisch, Poisson, negatives Binomial) mit Zähldaten innerhalb des GLM-Frameworks zu verwenden (nur 3 der 8 GLM-Verteilungen werden für Zähldaten verwendet, obwohl die meisten davon verwendet werden Ich habe Zentren über die negativen Binomial- und Poisson-Verteilungen …



2
Warum kann sich die Beta-Regression nicht genau mit Nullen und Einsen in der Antwortvariablen befassen?
Beta-Regression (dh GLM mit Beta-Verteilung und normalerweise der Logit-Link-Funktion) wird häufig empfohlen, um Antworten zu behandeln, die als abhängige Variablen mit Werten zwischen 0 und 1 bezeichnet werden, z. B. Brüche, Verhältnisse oder Wahrscheinlichkeiten. Regression für ein Ergebnis (Verhältnis oder Bruch) zwischen 0 und 1 . Es wird jedoch immer …



3
Kann ein Modell für nicht negative Daten mit Nullen (Tweedie-GLM, null-aufgeblähtes GLM usw.) genaue Nullen vorhersagen?
Eine Tweedie-Verteilung kann verzerrte Daten mit einer Punktmasse von Null modellieren, wenn der Parameter (Exponent in der Mittelwert-Varianz-Beziehung) zwischen 1 und 2 liegt.ppp In ähnlicher Weise kann ein Modell mit Null-Inflation (unabhängig davon, ob es sich um ein kontinuierliches oder ein diskretes Modell handelt) eine große Anzahl von Nullen aufweisen. …

3
Keine überhöhten Verteilungen, was sind sie wirklich?
Ich habe Mühe, keine überhöhten Verteilungen zu verstehen. Was sind Sie? Was ist der Sinn? Wenn ich Daten mit vielen Nullen habe, könnte ich eine logistische Regression anpassen, zuerst die Wahrscheinlichkeit von Nullen berechnen und dann alle Nullen entfernen und dann eine reguläre Regression mithilfe meiner Verteilungswahl anpassen (Poisson z. …

1
Null aufgeblasene Poisson-Regression
Angenommen, sind unabhängig undY=(Y1,…,Yn)′Y=(Y1,…,Yn)′ \textbf{Y} = (Y_1, \dots, Y_n)' Yi=0Yi=kwith probability pi+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!Yi=0with probability pi+(1−pi)e−λiYi=kwith probability (1−pi)e−λiλik/k!\eqalign{ Y_i = 0 & \text{with probability} \ p_i+(1-p_i)e^{-\lambda_i}\\ Y_i = k & \text{with probability} \ (1-p_i)e^{-\lambda_i} \lambda_{i}^{k}/k! } Angenommen, die Parameter und erfülltλ=(λ1,…,λn)′λ=(λ1,…,λn)′\mathbf{\lambda} = (\lambda_1, \dots, \lambda_n)'p=(p1,…,pn)p=(p1,…,pn)\textbf{p} = (p_1, \dots, p_n) log(λ)logit(p)=Bβ=log(p/(1−p))=Gλ.log⁡(λ)=Bβlogit(p)=log⁡(p/(1−p))=Gλ.\eqalign{ …

1
Probleme beim Finden eines guten Modells für Zähldaten mit gemischten Effekten - ZINB oder etwas anderes?
Ich habe einen sehr kleinen Datensatz zur Bienenfülle, den ich nur schwer analysieren kann. Es handelt sich um Zählungsdaten, und fast alle Zählungen erfolgen in einer Behandlung, wobei die meisten Nullen in der anderen Behandlung vorkommen. Es gibt auch einige sehr hohe Werte (jeweils einer an zwei der sechs Stellen), …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.