Als «logistic» getaggte Fragen

Bezieht sich allgemein auf statistische Verfahren, die die logistische Funktion nutzen, am häufigsten verschiedene Formen der logistischen Regression


1
Enorme Koeffizienten in der logistischen Regression - was bedeutet das und was ist zu tun?
Während der logistischen Regression erhalte ich enorme Koeffizienten, siehe Koeffizienten mit krajULKV: > summary(m5) Call: glm(formula = cbind(ml, ad) ~ rok + obdobi + kraj + resid_usili2 + rok:obdobi + rok:kraj + obdobi:kraj + kraj:resid_usili2 + rok:obdobi:kraj, family = "quasibinomial") Deviance Residuals: Min 1Q Median 3Q Max -2.7796 -1.0958 -0.3101 …


1
Fehlerverteilung für lineare und logistische Regression
Bei kontinuierlichen Daten nimmt eine lineare Regression an, dass der Fehlerterm N (0, ) verteilt ist.σ 2Y.= β1+ β2X.2+ uY=β1+β2X2+uY=\beta_1+\beta_2X_2+uσ2σ2\sigma^2 1) Nehmen wir an, dass Var (Y | x) ebenfalls ~ N (0, ) ist?σ2σ2\sigma^2 2) Wie ist diese Fehlerverteilung bei der logistischen Regression? Wenn die Daten in Form von …

1
Wie kann man beobachtete mit erwarteten Ereignissen vergleichen?
Angenommen, ich habe eine Stichprobe von Häufigkeiten von 4 möglichen Ereignissen: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 und ich habe die erwarteten Wahrscheinlichkeiten, dass meine Ereignisse eintreten: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Mit der Summe der beobachteten …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 



2
Parametrisches, semiparametrisches und nichtparametrisches Bootstrapping für gemischte Modelle
Die folgenden Transplantate stammen aus diesem Artikel . Ich bin ein Neuling im Bootstrap und versuche, das parametrische, semiparametrische und nichtparametrische Bootstrapping-Bootstrapping für ein lineares gemischtes Modell mit R bootPaket zu implementieren. R-Code Hier ist mein RCode: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 


1
Wie passt das Bradley-Terry-Luce-Modell ohne komplizierte Formel in R?
Das Bradley-Terry-Luce (BTL) -Modell besagt, dass , wobei die Wahrscheinlichkeit ist, dass das Objekt als "besser" beurteilt wird. schwerer usw. als Objekt und und sind Parameter.pj i= l o gi t- 1( δj- δich)pjich=lÖGicht- -1(δj- -δich)p_{ji} = logit^{-1}(\delta_j - \delta_i)pi jpichjp_{ij}jjjichichiδichδich\delta_iδjδj\delta_j Dies scheint ein Kandidat für die glm-Funktion mit family …

2
AUC in der ordinalen logistischen Regression
Ich verwende zwei Arten der logistischen Regression - eine ist die einfache Art für die binäre Klassifizierung und die andere ist die ordinale logistische Regression. Zur Berechnung der Genauigkeit der ersten habe ich eine Kreuzvalidierung verwendet, bei der ich die AUC für jede Falte berechnet und dann die mittlere AUC …

2
Entfernen Sie Duplikate aus dem Trainingssatz zur Klassifizierung
Nehmen wir an, ich habe eine Reihe von Zeilen für ein Klassifizierungsproblem: X1,...XN,YX1,...XN,YX_1, ... X_N, Y Wobei die Merkmale / Prädiktoren sind und die Klasse ist, zu der die Merkmalskombination der Zeile gehört.X1,...,XNX1,...,XNX_1, ..., X_NYYY Viele Feature-Kombinationen und ihre Klassen werden im Datensatz wiederholt, den ich zum Anpassen eines Klassifikators …

2
Fallgewichtete logistische Regression
Ich betrachte einige logistische Regressionsprobleme. ("regulär" und "bedingt"). Im Idealfall möchte ich jeden der Eingabefälle gewichten, damit sich der glm mehr darauf konzentriert, die höher gewichteten Fälle korrekt vorherzusagen, auf Kosten einer möglichen Fehlklassifizierung der niedriger gewichteten Fälle. Sicher wurde dies schon einmal gemacht. Kann mich jemand auf relevante Literatur …
9 logistic 


3
Behandlung der Ebenen "Weiß nicht / Abgelehnt" von kategorialen Variablen
Ich modelliere die Diabetes-Vorhersage mithilfe der logistischen Regression. Der verwendete Datensatz ist das Behavioral Risk Factor Surveillance System (BRFSS) des Center for Disease Control (CDC). Eine der unabhängigen Variablen ist Bluthochdruck. Es ist kategorisch mit den folgenden Ebenen "Ja", "Nein", "Weiß nicht / Abgelehnt". Sollte ich diese Zeilen beim Erstellen …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.