Als «bootstrap» getaggte Fragen

Der Bootstrap ist eine Resampling-Methode zum Schätzen der Sampling-Verteilung einer Statistik.

1
Ist eine Zentrierung beim Bootstrapping des Sample-Mittels erforderlich?
Beim Lesen, wie man die Verteilung des Stichprobenmittelwerts approximiert, bin ich auf die nichtparametrische Bootstrap-Methode gestoßen. Anscheinend kann man die Verteilung von durch die Verteilung von , wobei den Stichprobenmittelwert von bezeichnet das Bootstrap-Beispiel.X¯n−μX¯n−μ\bar{X}_n-\muX¯∗n−X¯nX¯n∗−X¯n\bar{X}_n^*-\bar{X}_nX¯∗nX¯n∗\bar{X}_n^* Meine Frage ist dann: Brauche ich die Zentrierung? Wozu? Konnte ich nicht einfach durch approximieren ?P(X¯n≤x)P(X¯n≤x)\mathbb{P}\left(\bar{X}_n …



2
Grundlegendes zum Bootstrapping für die Validierung und Modellauswahl
Ich denke, ich verstehe, wie die Grundlagen des Bootstrapping funktionieren, bin mir aber nicht sicher, wie ich das Bootstrapping zur Modellauswahl oder zur Vermeidung von Überanpassungen einsetzen kann. Würden Sie beispielsweise für die Modellauswahl nur das Modell auswählen, das den geringsten Fehler (möglicherweise die geringste Varianz?) In den Bootstrap-Beispielen ergibt? …


1
Testen von zwei unabhängigen Stichproben auf Null mit gleichem Versatz?
Welche Tests stehen zur Verfügung, um zwei unabhängige Stichproben auf die Nullhypothese hin zu testen, dass sie aus Populationen mit demselben Versatz stammen? Es gibt einen klassischen 1-Stichproben-Test, um festzustellen, ob der Versatz einer festen Zahl entspricht (der Test bezieht sich auf den 6. Stichprobenmoment!). Gibt es eine einfache Übersetzung …


1
Gibt es eine zeitgemäße Verwendung von Jackknifing?
Die Frage: Bootstrapping ist Jackknifing überlegen ; Ich frage mich jedoch, ob es Fälle gibt, in denen das Jackknifing die einzige oder zumindest eine praktikable Option zur Charakterisierung der Unsicherheit aus Parameterschätzungen ist. Auch in praktischen Situationen, wie voreingenommen / ungenau ist Jackknifing im Vergleich zu Bootstrapping, und können Jackknife-Ergebnisse …


5
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Wie führt man einen Bootstrap-Test durch, um die Mittelwerte zweier Stichproben zu vergleichen?
Ich habe zwei stark verzerrte Stichproben und versuche, mithilfe von Bootstrapping ihre Mittelwerte mithilfe der t-Statistik zu vergleichen. Wie ist die richtige Vorgehensweise dafür? Der Prozess, den ich benutze Ich bin besorgt über die Angemessenheit der Verwendung des Standardfehlers der ursprünglichen / beobachteten Daten im letzten Schritt, wenn ich weiß, …

2
Wie kann ich Bootstrap-p-Werte über mehrfach kalkulierte Datensätze zusammenfassen?
Ich befasse mich mit dem Problem, dass ich den p-Wert für eine Schätzung von aus multipliziert unterstellten (MI) Daten bootstrappen möchte , aber mir unklar ist, wie ich die p-Werte über MI-Mengen kombinieren soll.θθ\theta Für MI-Datensätze verwendet der Standardansatz zur Ermittlung der Gesamtvarianz von Schätzungen Rubins Regeln. Sehen Sie hier …

2
Wann sollte man Bootstrap vs. Bayes'sche Technik anwenden?
Ich habe ein ziemlich kompliziertes Problem mit der Entscheidungsanalyse, das Zuverlässigkeitstests beinhaltet, und der logische Ansatz (für mich) scheint die Verwendung von MCMC zur Unterstützung einer Bayes'schen Analyse zu beinhalten. Es wurde jedoch vorgeschlagen, einen Bootstrapping-Ansatz zu verwenden. Könnte jemand eine Referenz (oder drei) vorschlagen, die die Verwendung einer der …

1
Berechnung der Konfidenzintervalle mittels Bootstrap anhand abhängiger Beobachtungen
Der Bootstrap in seiner Standardform kann verwendet werden, um Konfidenzintervalle der geschätzten Statistiken zu berechnen, vorausgesetzt, die Beobachtungen sind korrekt. I. Visser et al. In " Konfidenzintervalle für versteckte Markov-Modellparameter " wurde ein parametrischer Bootstrap verwendet, um CIs für HMM-Parameter zu berechnen. Wenn wir jedoch ein HMM an eine Beobachtungssequenz …

2
Können wir Bootstrap-Beispiele verwenden, die kleiner als das Originalmuster sind?
Ich möchte Bootstrapping verwenden, um Konfidenzintervalle für geschätzte Parameter aus einem Panel-Datensatz mit N = 250 Unternehmen und T = 50 Monaten zu schätzen. Die Schätzung von Parametern ist aufgrund der Verwendung der Kalman-Filterung und der komplexen nichtlinearen Schätzung rechenintensiv (wenige Tage Berechnung). Daher ist es rechnerisch nicht möglich, (mit …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.