Als «predictive-models» getaggte Fragen

Vorhersagemodelle sind statistische Modelle, deren Hauptzweck darin besteht, andere Beobachtungen eines Systems optimal vorherzusagen, im Gegensatz zu Modellen, deren Zweck darin besteht, eine bestimmte Hypothese zu testen oder ein Phänomen mechanistisch zu erklären. Vorhersagemodelle legen daher weniger Wert auf Interpretierbarkeit als vielmehr auf Leistung.


3
So reduzieren Sie Prädiktoren auf die richtige Weise für ein logistisches Regressionsmodell
Daher habe ich einige Bücher (oder Teile davon) über Modellierung gelesen (unter anderem F. Harrells "Regressionsmodellierungsstrategien"), da ich derzeit ein logistisches Modell erstellen muss, das auf binären Antwortdaten basiert. Ich habe sowohl kontinuierliche, kategoriale als auch binäre Daten (Prädiktoren) in meinem Datensatz. Grundsätzlich habe ich momentan ungefähr 100 Prädiktoren, was …

1
Wie fair ist es, das Wort „Vorhersagen“ für (logistische) Regression zu verwenden?
Mein Verständnis ist, dass selbst Regression keine Kausalität gibt. Es kann nur eine Assoziation zwischen y-Variablen und x-Variablen und möglicherweise eine Richtung geben. Hab ich recht? Ich habe oft Sätze gefunden, die "x sagt y voraus" ähneln, selbst in den meisten Lehrbüchern und auf verschiedenen Kursseiten online. Und Sie nennen …

2
Kopplung von Zeitreiheninformationen aus Quellen mit mehreren räumlichen Auflösungen / Skalen
Ich habe viele Satelliten-Rasterbilder von verschiedenen Sensoren zur Verfügung. Von diesen haben die gröberen eine sehr reichliche zeitliche Auflösung. Die Raster mit mittlerer Auflösung haben tendenziell weniger Erwerbsdaten, es sind jedoch noch einige Informationen verfügbar. Die feineren Auflösungen haben eine sehr niedrige zeitliche Auflösung und umfassen 2 bis 6 beobachtete …

1
Verstecktes Markov-Modell zur Ereignisvorhersage
Frage : Ist der Aufbau unten eine sinnvolle Implementierung eines Hidden Markov-Modells? Ich habe einen Datensatz von 108,000Beobachtungen (über einen Zeitraum von 100 Tagen) und ungefähr 2000Ereignisse während der gesamten Beobachtungszeitspanne. Die Daten sehen wie in der folgenden Abbildung aus, in der die beobachtete Variable 3 diskrete Werte annehmen kann …

1
Einzigartige (?) Idee zur Umsatzprognose
Ich arbeite an der Entwicklung eines Modells zur Vorhersage des Gesamtumsatzes eines Produkts. Ich habe ungefähr anderthalb Jahre Buchungsdaten, sodass ich eine Standard-Zeitreihenanalyse durchführen kann. Ich habe jedoch auch viele Daten über jede "Gelegenheit" (potenzieller Verkauf), die entweder geschlossen wurde oder verloren ging. "Opportunities" werden in Phasen einer Pipeline weiterentwickelt, …




2
Ein Beispiel für die Verwendung der Genauigkeit als Ergebnismaß führt zu einer falschen Schlussfolgerung
Ich untersuche verschiedene Leistungsmessungen für Vorhersagemodelle. Es wurde viel über Probleme bei der Verwendung von Genauigkeit geschrieben, anstatt über etwas Kontinuierlicheres, um die Modellleistung zu bewerten. Frank Harrell http://www.fharrell.com/post/class-damage/ liefert ein Beispiel, wenn das Hinzufügen einer informativen Variablen zu einem Modell zu einem Rückgang der Genauigkeit, einer eindeutig eingängigen und …


2
Funktionsbedeutung / Auswirkung für individuelle Vorhersagen
Auf Modellebene können wir zur Bewertung des Beitrags / der Bedeutung von Prädiktoren Folgendes verwenden: Modellspezifische Techniken - z. B. Reinheit (Gini-Index) für ein baumbasiertes Modell, gegebenenfalls Modellkoeffizienten usw. Modellunabhängige Techniken - z. B. Bedeutung von Permutationsmerkmalen, partielle Abhängigkeit usw. Was dies nicht vermittelt, ist für eine bestimmte Vorhersage (z. …

2
Erhöhen schrittweise Regressionstechniken die Vorhersagekraft eines Modells?
Ich verstehe einige der vielen Probleme der schrittweisen Regression. Als akademisches Unterfangen gehe ich jedoch davon aus, dass ich die schrittweise Regression für ein Vorhersagemodell verwenden und die möglichen Auswirkungen auf die Leistung besser verstehen möchte. Erhöht oder verringert die schrittweise Regression des Modells bei einem linearen Modell tendenziell die …

1
Was bringt es, Daten in Trainings- und Testteile zu unterteilen, um die Vorhersageeigenschaften bei AIC zu bewerten?
Asymptotisch entspricht die Minimierung des AIC der Minimierung der ausgelassenen Kreuzvalidierungs-MSE für Querschnittsdaten [ 1 ]. Wenn wir also AIC haben, warum verwendet man überhaupt die Methode der Aufteilung der Daten in Trainings-, Validierungs- und Testsätze, um die Vorhersageeigenschaften von Modellen zu messen? Was genau sind die Vorteile dieser Praxis? …

3
Ein konkretes Beispiel ist die Durchführung einer SVD, um fehlende Werte zu unterstellen
Ich habe die großartigen Kommentare zum Umgang mit fehlenden Werten vor dem Anwenden von SVD gelesen, möchte aber anhand eines einfachen Beispiels wissen, wie dies funktioniert: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Wenn ich in der …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.