Als «logistic» getaggte Fragen

Bezieht sich allgemein auf statistische Verfahren, die die logistische Funktion nutzen, am häufigsten verschiedene Formen der logistischen Regression

1
Bei der Optimierung eines logistischen Regressionsmodells führen manchmal mehr Daten dazu, dass die Dinge * schneller * laufen. Irgendeine Idee warum?
Ich habe mit logistischer Regression mit verschiedenen Batch-Optimierungsalgorithmen (konjugierter Gradient, Newton-Raphson und verschiedene Quasinewton-Methoden) herumgespielt. Eine Sache, die mir aufgefallen ist, ist, dass das Hinzufügen von mehr Daten zu einem Modell manchmal dazu führen kann, dass das Training des Modells viel weniger Zeit in Anspruch nimmt. Für jede Iteration müssen …

1
Polynomterm in der logistischen Regression
Ich habe ein logistisches Regressionsmodell erstellt, das einen Polynomterm bis Grad 2 enthält. Mir ist bekannt, dass die logistische Regression die Antwortvariable als nichtlineare Funktion der Prädiktoren modelliert. Ist es sinnvoll, einen Polynombegriff in die logistische Regression einzubeziehen?

1
Testen auf Überdispersion in der logistischen Regression
R in Action (Kabacoff, 2011) schlägt die folgende Routine vor, um die Überdispersion in einer logistischen Regression zu testen: Passen Sie die logistische Regression mithilfe der Binomialverteilung an: model_binom <- glm(Species=="versicolor" ~ Sepal.Width, family=binomial(), data=iris) Anpassung der logistischen Regression mithilfe der Quasibinomverteilung: model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width, family=quasibinomial(), data=iris) Verwenden …


2
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 



2
Verwenden einer Reihe von binären logistischen Regressionen mit einer kategorialen Multiple-Choice-Antwortvariablen
Ich habe kategorische Umfragedaten zur Einstellung der Menschen zu einem bestimmten Politikbereich aus 13 Ländern. Die Antwortvariable ist kategorisch und enthält 4 verschiedene Antworten, die nicht geordnet werden können. Ich möchte ein mehrstufiges Multinomialmodell mit zufälligem Schnittpunkt und zufälliger Steigung erstellen. Das Problem ist, dass die Anzahl der Fälle der …

3
Auswahl zwischen Transformationen in der logistischen Regression
Bei der linearen Regression werden die Transformationen erklärender Variablen so durchgeführt, dass eine maximale Korrelation mit der abhängigen Variablen besteht. Was ist das beste Maß für die Wahl zwischen mehreren Transformationen in der logistischen Regression, da die abhängige Variable binär und nicht kontinuierlich ist? Das Endziel besteht darin, den Auftrieb …

2
Ist es technisch „gültig“, eine logistische Regression mit einer abhängigen Variablen anzupassen, die ein Anteil ist?
Mehrere Beiträge ( hier und hier ) legen nahe, dass die Beta-Regression besser geeignet ist, wenn die abhängige Variable natürlich zwischen 0 und 1 liegt. Meine Frage ist, ob es technisch falsch ist, eine logistische Regression an die proportionale Antwortvariable anzupassen, wenn man die Angemessenheit beiseite lässt. R gibt eine …

2
Große Cox-Regression mit R (Big Data)
Ich versuche, eine Cox-Regression für einen Beispieldatensatz von 2.000.000 Zeilen wie folgt mit nur R auszuführen. Dies ist eine direkte Übersetzung eines PHREG in SAS. Die Stichprobe ist repräsentativ für die Struktur des Originaldatensatzes. ## library(survival) ### Replace 100000 by 2,000,000 test <- data.frame(start=runif(100000,1,100), stop=runif(100000,101,300), censor=round(runif(100000,0,1)), testfactor=round(runif(100000,1,11))) test$testfactorf <- as.factor(test$testfactor) …

1
Anwenden von Aktualität in der logistischen Regression
Gibt es statistische Konzepte oder Theorien, wie die Aktualität effektiv gemessen werden kann, wenn jüngsten Ereignissen mehr Gewicht beigemessen wird als älteren. Ich erstelle ein logistisches Regressionsmodell und möchte verschiedene Faktoren basierend auf der Aktualität der Ereignisse anpassen. ... oder liegt es nur an mir, eine willkürliche Formel zu finden? …

1
Hat jedes logarithmische lineare Modell eine vollkommen äquivalente logistische Regression?
Ich versuche, ein logarithmisch lineares Modell an eine große Anzahl von Variablen aus Umfragedaten anzupassen. Es gibt einige Gründe, warum es möglicherweise vorzuziehen ist, stattdessen logistische Regressionen an diese Daten anzupassen. Mehrere Behörden schlagen vor, dass diese gleichwertig sind. Ich habe jedoch einige Gründe, dies zu bezweifeln. Log-lineare Modelle behandeln …

2
Post-hoc-Test nach 2-Faktor-Wiederholungsmessungen ANOVA in R?
Ich habe Probleme, eine Lösung für die Durchführung eines Post-hoc-Tests (Tukey HSD) nach einer ANOVA mit 2 Faktoren (beide innerhalb der Probanden) mit wiederholten Messungen in R zu finden. Für die ANOVA habe ich die aov-Funktion verwendet: summary(aov(dv ~ x1 * x2 + Error(subject/(x1*x2)), data=df1)) Nachdem ich Antworten auf andere …

3
Post-hoc-Test in einer 2x3-ANOVA mit gemischtem Design unter Verwendung von SPSS?
Ich habe zwei Gruppen von 10 Teilnehmern, die während eines Experiments dreimal bewertet wurden. Um die Unterschiede zwischen den Gruppen und zwischen den drei Bewertungen zu testen, führte ich eine 2 × 3-ANOVA mit gemischtem Design mit group(Kontrolle, experimentell), time(erste, zweite, drei) und group x time. Beides timeund groupErgebnis signifikant, …
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.