Als «resampling» getaggte Fragen

Beim Resampling wird eine Probe aus einer Probe entnommen. Häufige Verwendungszwecke sind Jackknifing (Entnahme einer Teilstichprobe, z. B. alle Werte außer 1) und Bootstrapping (Abtastung mit Ersatz). Diese Techniken können eine robuste Schätzung einer Stichprobenverteilung liefern, wenn es schwierig oder unmöglich wäre, sie analytisch abzuleiten.


1
Ist Bootstrapping für diese fortlaufenden Daten geeignet?
Ich bin ein absoluter Neuling :) Ich mache eine Studie mit einer Stichprobengröße von 10.000 aus einer Bevölkerung von etwa 745.000. Jede Stichprobe repräsentiert eine "prozentuale Ähnlichkeit". Die große Mehrheit der Proben liegt zwischen 97% und 98%, einige jedoch zwischen 60% und 90%, dh die Verteilung ist stark negativ verzerrt. …


1
Gini-Koeffizient und Fehlergrenzen
Ich habe zu jedem Zeitpunkt eine Zeitreihe von Daten mit N = 14 Zählungen und möchte den Gini-Koeffizienten und einen Standardfehler für diese Schätzung zu jedem Zeitpunkt berechnen. Da ich zu jedem Zeitpunkt nur N = 14 Zählungen habe, berechnete ich die Jackknife-Varianz, dh aus Gleichung 7 von Tomson Ogwang …


2
Sollte ich auf Clusterebene oder auf Einzelebene booten?
Ich habe ein Überlebensmodell mit Patienten, die in Krankenhäusern verschachtelt sind, das einen Zufallseffekt für die Krankenhäuser beinhaltet. Der zufällige Effekt ist gammaverteilt, und ich versuche, die „Relevanz“ dieses Begriffs auf einer leicht verständlichen Skala darzustellen. Ich habe die folgenden Referenzen gefunden, die das Median Hazard Ratio verwenden (ein bisschen …

2
Guter Text zum Resampling?
Kann die Gruppe einen guten Einführungstext / eine gute Ressource für angewandte Resampling-Techniken empfehlen? Insbesondere interessiere ich mich für Alternativen zu klassischen parametrischen Tests (z. B. t-Tests, ANOVA, ANCOVA) zum Vergleichen von Gruppen, wenn Annahmen wie die Normalität eindeutig verletzt werden. Ein Beispiel für einen Problemtyp, den ich gerne über …

1
Welches Deep-Learning-Modell kann Kategorien klassifizieren, die sich nicht gegenseitig ausschließen?
Beispiele: Ich habe einen Satz in der Stellenbeschreibung: "Java Senior Engineer in UK". Ich möchte ein Deep-Learning-Modell verwenden, um es als zwei Kategorien vorherzusagen: English und IT jobs. Wenn ich ein traditionelles Klassifizierungsmodell verwende, kann es nur 1 Etikett mit softmaxFunktion auf der letzten Ebene vorhersagen . Somit kann ich …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Größe der Bootstrap-Beispiele
Ich lerne Bootstrapping als Mittel zur Schätzung der Varianz einer Stichprobenstatistik. Ich habe einen grundsätzlichen Zweifel. Zitat aus http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Wie viele Beobachtungen sollten wir erneut abtasten? Ein guter Vorschlag ist die ursprüngliche Stichprobengröße. Wie können wir so viele Beobachtungen wie in der Originalprobe erneut abtasten? Wenn ich eine …

1
Überabtastung mit kategorialen Variablen
Ich möchte eine Kombination aus Über- und Unterabtastung durchführen, um meinen Datensatz mit ungefähr 4000 Kunden in zwei Gruppen auszugleichen, wobei eine der Gruppen einen Anteil von ungefähr 15% hat. Ich habe mir SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) und ROSE ( http://cran.r-project.org/web/packages/ROSE/) angesehen. ROSE.pdf ), aber beide erzeugen neue synthetische Proben …

1
Kann Bootstrap-Resampling verwendet werden, um ein Konfidenzintervall für die Varianz eines Datensatzes zu berechnen?
Ich weiß, dass, wenn Sie mehrmals aus einem Datensatz eine neue Stichprobe erstellen und jedes Mal den Mittelwert berechnen, diese Mittelwerte einer Normalverteilung (durch die CLT) folgen. Auf diese Weise können Sie ein Konfidenzintervall für den Mittelwert des Datensatzes berechnen, ohne Annahmen über die Wahrscheinlichkeitsverteilung des Datensatzes zu treffen. Ich …


1
Erforderliche Anzahl von Permutationen für einen permutationsbasierten p-Wert
Wie viele Permutationen benötige ich, wenn ich einen permutationsbasierten ppp Wert mit dem Signifikanzniveau berechnen αα\alphamuss? Aus dem Artikel "Permutationstests zur Untersuchung der Klassifikatorleistung" , Seite 5: In der Praxis ist die Obergrenze 1 / ( 2 k- -- -√)1/.(2k)1/(2\sqrt{k})wird typischerweise verwendet, um die Anzahl von Proben zu bestimmen, die …

1
Welche Methode simuliert p-Werte aus der erneuten Abtastung aus den Daten?
Vor einiger Zeit stellte ich eine Frage zu Korrelationszeiten zwischen Zeitstempeln und erhielt eine Antwort von Peter Ellis, dass ich mittlere Entfernungen zwischen Codes berechnen könnte ... Dies gibt Ihnen bereits einen Eindruck davon, welche Verhaltensweisen zusammengefasst sind, aber Sie sollten auch überprüfen, ob dies nicht nur zufällig plausibel ist. …

2
Teilstichprobe einer Zufallsstichprobe: Zufallsstichprobe?
Nehmen wir an, Sie haben eine große Zufallsstichprobe von Fußballspielern in Europa, aber Sie interessieren sich nur für das, was in Spanien passiert. Könnten Sie Ihre Stichprobe auf Spieler in Spanien reduzieren und sie dennoch als Zufallsstichprobe (aber einer anderen Bevölkerung) bezeichnen? Wenn nicht, wie würden Sie diese Teilstichprobe nennen …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.