Ich habe mit logistischer Regression mit verschiedenen Batch-Optimierungsalgorithmen (konjugierter Gradient, Newton-Raphson und verschiedene Quasinewton-Methoden) herumgespielt. Eine Sache, die mir aufgefallen ist, ist, dass das Hinzufügen von mehr Daten zu einem Modell manchmal dazu führen kann, dass das Training des Modells viel weniger Zeit in Anspruch nimmt. Für jede Iteration müssen …
Ich habe ein logistisches Regressionsmodell erstellt, das einen Polynomterm bis Grad 2 enthält. Mir ist bekannt, dass die logistische Regression die Antwortvariable als nichtlineare Funktion der Prädiktoren modelliert. Ist es sinnvoll, einen Polynombegriff in die logistische Regression einzubeziehen?
R in Action (Kabacoff, 2011) schlägt die folgende Routine vor, um die Überdispersion in einer logistischen Regression zu testen: Passen Sie die logistische Regression mithilfe der Binomialverteilung an: model_binom <- glm(Species=="versicolor" ~ Sepal.Width, family=binomial(), data=iris) Anpassung der logistischen Regression mithilfe der Quasibinomverteilung: model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width, family=quasibinomial(), data=iris) Verwenden …
Leute, die mit logistischer Regression arbeiten, sind mit dem Problem der perfekten Trennung vertraut: Wenn Sie eine Variable haben, deren spezifische Werte nur einem der beiden Ergebnisse zugeordnet sind (sagen wir ein binäres so dass alle Beobachtungen mit Ergebnis = 1 haben ), die Wahrscheinlichkeit explodiert und die Schätzungen der …
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
Ich habe ein logistisches Regressionsmodell in R erstellt, und obwohl das Ergebnis bis zu einem gewissen Grad zufriedenstellend zu sein scheint, gibt es eine Frage, die ich nicht beantworten kann. Ich bin mir nicht sicher, ob mein Ansatz überhaupt richtig ist. Ich weiß, dass der allgemeine Zweck des logistischen Modells …
Ich habe kategorische Umfragedaten zur Einstellung der Menschen zu einem bestimmten Politikbereich aus 13 Ländern. Die Antwortvariable ist kategorisch und enthält 4 verschiedene Antworten, die nicht geordnet werden können. Ich möchte ein mehrstufiges Multinomialmodell mit zufälligem Schnittpunkt und zufälliger Steigung erstellen. Das Problem ist, dass die Anzahl der Fälle der …
Bei der linearen Regression werden die Transformationen erklärender Variablen so durchgeführt, dass eine maximale Korrelation mit der abhängigen Variablen besteht. Was ist das beste Maß für die Wahl zwischen mehreren Transformationen in der logistischen Regression, da die abhängige Variable binär und nicht kontinuierlich ist? Das Endziel besteht darin, den Auftrieb …
Mehrere Beiträge ( hier und hier ) legen nahe, dass die Beta-Regression besser geeignet ist, wenn die abhängige Variable natürlich zwischen 0 und 1 liegt. Meine Frage ist, ob es technisch falsch ist, eine logistische Regression an die proportionale Antwortvariable anzupassen, wenn man die Angemessenheit beiseite lässt. R gibt eine …
Ich versuche, eine Cox-Regression für einen Beispieldatensatz von 2.000.000 Zeilen wie folgt mit nur R auszuführen. Dies ist eine direkte Übersetzung eines PHREG in SAS. Die Stichprobe ist repräsentativ für die Struktur des Originaldatensatzes. ## library(survival) ### Replace 100000 by 2,000,000 test <- data.frame(start=runif(100000,1,100), stop=runif(100000,101,300), censor=round(runif(100000,0,1)), testfactor=round(runif(100000,1,11))) test$testfactorf <- as.factor(test$testfactor) …
Gibt es statistische Konzepte oder Theorien, wie die Aktualität effektiv gemessen werden kann, wenn jüngsten Ereignissen mehr Gewicht beigemessen wird als älteren. Ich erstelle ein logistisches Regressionsmodell und möchte verschiedene Faktoren basierend auf der Aktualität der Ereignisse anpassen. ... oder liegt es nur an mir, eine willkürliche Formel zu finden? …
Ich versuche, ein logarithmisch lineares Modell an eine große Anzahl von Variablen aus Umfragedaten anzupassen. Es gibt einige Gründe, warum es möglicherweise vorzuziehen ist, stattdessen logistische Regressionen an diese Daten anzupassen. Mehrere Behörden schlagen vor, dass diese gleichwertig sind. Ich habe jedoch einige Gründe, dies zu bezweifeln. Log-lineare Modelle behandeln …
Ich habe Probleme, eine Lösung für die Durchführung eines Post-hoc-Tests (Tukey HSD) nach einer ANOVA mit 2 Faktoren (beide innerhalb der Probanden) mit wiederholten Messungen in R zu finden. Für die ANOVA habe ich die aov-Funktion verwendet: summary(aov(dv ~ x1 * x2 + Error(subject/(x1*x2)), data=df1)) Nachdem ich Antworten auf andere …
Ich habe zwei Gruppen von 10 Teilnehmern, die während eines Experiments dreimal bewertet wurden. Um die Unterschiede zwischen den Gruppen und zwischen den drei Bewertungen zu testen, führte ich eine 2 × 3-ANOVA mit gemischtem Design mit group(Kontrolle, experimentell), time(erste, zweite, drei) und group x time. Beides timeund groupErgebnis signifikant, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.