Als «predictive-models» getaggte Fragen

Vorhersagemodelle sind statistische Modelle, deren Hauptzweck darin besteht, andere Beobachtungen eines Systems optimal vorherzusagen, im Gegensatz zu Modellen, deren Zweck darin besteht, eine bestimmte Hypothese zu testen oder ein Phänomen mechanistisch zu erklären. Vorhersagemodelle legen daher weniger Wert auf Interpretierbarkeit als vielmehr auf Leistung.

3
Statistisches Modell zur Vorhersage der nächsten Bewegung im Netzwerk nur anhand des Bewegungsverlaufs
Ist es möglich, ein statistisches Modell zu erstellen, das die nächste Bewegung in einem Diagramm ausschließlich auf der Grundlage vergangener Bewegungen und der Struktur des Diagramms vorhersagt? Ich habe ein Beispiel gemacht, um das Problem zu veranschaulichen: Die Zeit ist diskret . In jeder Runde bleiben Sie entweder an Ihrem …

3
Finden Sie die Verteilung und transformieren Sie sie in die Normalverteilung
Ich habe Daten, die beschreiben, wie oft ein Ereignis während einer Stunde stattfindet ("Anzahl pro Stunde", nph) und wie lange die Ereignisse dauern ("Dauer in Sekunden pro Stunde", dph). Dies sind die Originaldaten: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

1
Wie können Epidemiologen / Mitarbeiter des öffentlichen Gesundheitswesens sanft in die fortschrittliche Vorhersagemodellierung eingeführt werden?
Aus sozialwissenschaftlichen und epidemiologischen Gründen wurden meine Mitarbeiter in Regression der kleinsten Quadrate, logistischer Regression und Überlebensanalyse geschult. Sie möchten 95% -Konfidenzintervalle und p-Werte mit den Parameterkoeffizienten sehen und misstrauen aktuelleren Vorhersagewerkzeugen wie neuronalen Netzen, CART, Bagging & Boosting sowie bestraften Regressionstechniken.

2
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 

1
Fehler bei der linearen Regression / Vorhersage eines realen Datensatzes
Ich habe einen Datensatz, für den ich versuche, eine Regression durchzuführen, und der fehlschlägt. Die Situation: Tausende von Kampfroboterbetreibern kämpfen mit Kampfrobotern untereinander. Einige Kampfroboter sind stark und mächtig, andere sind schwach; Die Starken gewinnen öfter und verursachen mehr Schaden. Die Fähigkeiten der Roboterbediener variieren, wobei die erfahreneren häufiger gewinnen …


1
Vorhersage des Gewinners eines Fußballspiels nur anhand des Ergebnisses früherer Spiele zwischen den beiden Teams
Ich bin ein großer Fußballfan und auch an maschinellem Lernen interessiert. Als Projekt für meinen ML-Kurs versuche ich, ein Modell zu entwickeln, das die Gewinnchance für die Heimmannschaft unter Berücksichtigung der Namen der Heimmannschaft und der Auswärtsmannschaft vorhersagt. (Ich frage meinen Datensatz ab und erstelle dementsprechend Datenpunkte basierend auf früheren …

5
Klassifikation vs. Regression zur Vorhersage des Vorzeichens einer kontinuierlichen Antwortvariablen
Angenommen, ich möchte vorhersagen, ob ein Projekt rentabel ist oder nicht. In meinen Beispieldaten ist die Antwortvariable tatsächlich eine kontinuierliche Variable: der $ Gewinn / Verlust des Projekts. Sollte ich eine Klassifizierungstechnik verwenden, da mein letztendliches Ziel nur eine binäre Klassifizierung ist (profitables Projekt oder unrentables Projekt)? Oder sollte ich …

2
Imputation mit zufälligen Wäldern
Ich habe zwei Fragen zur Verwendung einer zufälligen Gesamtstruktur (insbesondere randomForest in R) für die Imputation fehlender Werte (im Prädiktorraum). 1) Wie funktioniert der Imputationsalgorithmus - insbesondere wie und warum wird die Klassenbezeichnung für die Imputation benötigt? Ist die Näherungsmatrix, die dazu dient, den Durchschnittswert zu gewichten, um einen fehlenden …

3
Analoga der Sensitivität und Spezifität für kontinuierliche Ergebnisse
Wie kann ich die Sensitivität und Spezifität (oder analoge Maßnahmen) eines kontinuierlichen diagnostischen Tests zur Vorhersage eines kontinuierlichen Ergebnisses (z. B. Blutdruck) berechnen, ohne das Ergebnis zu dichotomisieren? Irgendwelche Ideen? Es scheint, dass Forscher dies mithilfe der Modellierung gemischter Effekte getan haben (siehe Link unten), aber ich bin mit ihrer …

3
Post-hoc-Test in einer 2x3-ANOVA mit gemischtem Design unter Verwendung von SPSS?
Ich habe zwei Gruppen von 10 Teilnehmern, die während eines Experiments dreimal bewertet wurden. Um die Unterschiede zwischen den Gruppen und zwischen den drei Bewertungen zu testen, führte ich eine 2 × 3-ANOVA mit gemischtem Design mit group(Kontrolle, experimentell), time(erste, zweite, drei) und group x time. Beides timeund groupErgebnis signifikant, …
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 


3
Unterstützung der Vektorregression bei Daten mit verzerrter / hoher Kurtosis
Ich verwende die Support-Vektor-Regression, um einige ziemlich verzerrte Daten (mit hoher Kurtosis) zu modellieren. Ich habe versucht, die Daten direkt zu modellieren, aber ich erhalte falsche Vorhersagen, die meiner Meinung nach hauptsächlich auf die Verteilung der Daten zurückzuführen sind, die mit sehr fetten Schwänzen verzerrt ist. Ich bin mir ziemlich …

1
Stichprobengröße und Kreuzvalidierungsmethoden für Cox-Regressionsvorhersagemodelle
Ich habe eine Frage, die ich der Community stellen möchte. Ich wurde kürzlich gebeten, statistische Analysen für eine Tumormarker-Prognosestudie bereitzustellen . Ich habe hauptsächlich diese beiden Referenzen verwendet, um meine Analyse zu leiten: McShane LM et al. Berichtsempfehlungen für prognostische Tumormarker-Studien (BEMERKUNG). J Natl Cancer Inst. 2005 Aug 17; 97 …

5
Warum sagt ein lineares Regressionsmodell mit null Abschnitten besser voraus als ein Modell mit einem Abschnitt?
Viele Lehrbücher und Papiere sagten, dass das Abfangen nicht unterdrückt werden sollte. Kürzlich habe ich einen Trainingsdatensatz verwendet, um ein lineares Regressionsmodell mit oder ohne Achsenabschnitt zu erstellen. Ich war überrascht festzustellen, dass das Modell ohne Achsenabschnitt in einem unabhängigen Validierungsdatensatz eine bessere Vorhersage als das mit einem Achsenabschnitt in …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.