Als «bootstrap» getaggte Fragen

Der Bootstrap ist eine Resampling-Methode zum Schätzen der Sampling-Verteilung einer Statistik.

1
Richtige Bootstrapping-Technik für Cluster-Daten?
Ich habe eine Frage zur richtigen Bootstrapping-Technik für Daten, bei denen eine starke Clusterbildung vorliegt. Ich wurde beauftragt, ein Vorhersagemodell mit multivariaten gemischten Effekten für Versicherungsfalldaten zu evaluieren, indem ich das aktuelle Basismodell für neuere Schadensfalldaten ausgewertet habe, um zu bestimmen, wie gut das Modell vorhersagt, welche Behandlungsepisoden die höchste …

1
Was ist die Intuition hinter austauschbaren Proben unter der Nullhypothese?
Permutationstests (auch Randomisierungstest, Re-Randomisierungstest oder exakter Test genannt) sind sehr nützlich und nützlich, wenn die zum Beispiel erforderliche Annahme einer Normalverteilung t-testnicht erfüllt ist und wenn die Transformation der Werte durch Rangfolge der Werte erfolgt Ein nicht parametrischer Test Mann-Whitney-U-testwürde dazu führen, dass mehr Informationen verloren gehen. Eine einzige Annahme, …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 



2
Warum tastet die scikit-learn-Bootstrap-Funktion den Testsatz erneut ab?
Bei der Verwendung von Bootstrapping für die Modellbewertung dachte ich immer, dass die Out-of-Bag-Proben direkt als Testsatz verwendet wurden. Dies scheint jedoch nicht der Fall zu sein für den veralteten Scikit-Lernansatz,Bootstrap bei dem der Testsatz aus dem Zeichnen mit Ersetzen aus der Out-of-Bag- Datenuntermenge aufgebaut zu werden scheint. Was ist …


3
Bootstrap: das Problem der Überanpassung
Angenommen, man führt den sogenannten nichtparametrischen Bootstrap durch, indem man aus den ursprünglichen Beobachtungen jeweils Stichproben der Größe mit Ersetzung zieht . Ich glaube, dieses Verfahren entspricht der Schätzung der kumulativen Verteilungsfunktion durch das empirische cdf:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function und dann Erhalten der Bootstrap-Abtastwerte durch Simulieren von Beobachtungen aus den geschätzten cdf …

3
Fragen zum parametrischen und nicht parametrischen Bootstrap
Ich lese gerade das Kapitel über Häufige Statistiken aus Kevin Murphys Buch " Maschinelles Lernen - Eine probabilistische Perspektive ". Der Abschnitt über Bootstrap lautet: Der Bootstrap ist eine einfache Monte-Carlo-Technik zur Annäherung an die Stichprobenverteilung. Dies ist besonders in Fällen nützlich, in denen der Schätzer eine komplexe Funktion der …

2
Gewusst wie: Vorhersageintervalle für lineare Regression über Bootstrapping
Ich habe Probleme zu verstehen, wie Bootstrapping verwendet wird , um Vorhersageintervalle für ein lineares Regressionsmodell zu berechnen . Kann jemand eine schrittweise Vorgehensweise skizzieren? Ich habe über Google gesucht, aber für mich macht nichts wirklich Sinn. Ich verstehe, wie Bootstrapping zum Berechnen von Konfidenzintervallen für die Modellparameter verwendet wird.

1
Ist diese Methode zur Neuabtastung von Zeitreihen in der Literatur bekannt? Hat es einen Namen?
Ich habe kürzlich nach Möglichkeiten gesucht, Zeitreihen auf diese Weise neu abzutasten Erhalten Sie ungefähr die Autokorrelation langer Speicherprozesse. Behalten Sie den Bereich der Beobachtungen bei (zum Beispiel ist eine neu abgetastete Zeitserie von ganzen Zahlen immer noch eine Zeitserie von ganzen Zahlen). Kann bei Bedarf nur einige Skalen betreffen. …

1
Warum wird der Fehler "geschätzte Anpassung 'a' ist NA" aus dem R-Boot-Paket generiert, wenn Konfidenzintervalle mit der bca-Methode berechnet werden?
Ich habe einen Vektor von Zahlen, den ich hier mit dput hochgeladen habe (... / code / MyData.Rdata). Ich möchte das bca ci bekommen, also habe ich diesen Code geschrieben: my.mean <- function(dat, idx){ return (mean(dat[idx], na.rm = TRUE)) } boot.out<-boot(data=my.data, statistic = my.mean, R=1000) Aber wenn ich Folgendes ausführe, …
14 r  bootstrap 


4
Vorhersageintervalle für Algorithmen für maschinelles Lernen
Ich möchte wissen, ob der unten beschriebene Prozess gültig / akzeptabel ist und ob eine Begründung vorliegt. Die Idee: Überwachte Lernalgorithmen setzen keine zugrunde liegenden Strukturen / Verteilungen der Daten voraus. Am Ende des Tages geben sie Punktschätzungen aus. Ich hoffe, die Unsicherheit der Schätzungen irgendwie zu quantifizieren. Der Prozess …


1
Sind Bootstrapping-Standardfehler und Konfidenzintervalle in Regressionen angemessen, in denen die Annahme der Homoskedastizität verletzt wird?
Wenn in Standard-OLS-Regressionen zwei Annahmen verletzt werden (Normalverteilung von Fehlern, Homoskedastizität), sind Bootstrapping-Standardfehler und Konfidenzintervalle eine geeignete Alternative, um zu aussagekräftigen Ergebnissen hinsichtlich der Signifikanz von Regressorkoeffizienten zu gelangen? Funktionieren Signifikanztests mit Bootstrap-Standardfehlern und Konfidenzintervallen immer noch mit Heteroskedastizität? Wenn ja, welche Konfidenzintervalle können in diesem Szenario verwendet werden (Perzentil, …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.