Als «sampling» getaggte Fragen

Erstellen von Stichproben aus einer genau festgelegten Population mithilfe einer probabilistischen Methode und / oder Erstellen von Zufallszahlen aus einer bestimmten Verteilung. Da dieses Tag nicht eindeutig ist, berücksichtigen Sie bitte [Umfrage-Stichprobe] für das erstere und [Monte-Carlo] oder [Simulation] für das letztere. Bei Fragen zum Erstellen von Zufallsstichproben aus bekannten Verteilungen verwenden Sie bitte das Tag [Zufallsgenerierung].

3
Cluster Big Data in R und ist Stichproben relevant?
Ich bin neu in der Datenwissenschaft und habe ein Problem beim Finden von Clustern in einem Datensatz mit 200.000 Zeilen und 50 Spalten in R. Da die Daten sowohl numerische als auch nominale Variablen enthalten, erscheinen Methoden wie K-means, die das euklidische Distanzmaß verwenden, nicht als geeignete Wahl. Ich wende …


1
Halton-Sequenz gegen Sobol-Sequenz?
Aus einer Antwort in einer früheren Frage ging ich auf die Halton-Sequenz ein, um eine Reihe von Vektoren zu erstellen, die einen einheitlichen Probenraum ziemlich gleichmäßig abdecken. Auf der Wikipedia-Seite wird jedoch erwähnt, dass besonders höhere Primzahlen zu Beginn der Serie häufig stark korrelieren. Dies scheint für jedes Paar hoher …


3
Warum setzen mehrere (wenn nicht alle) parametrische Hypothesentests eine Zufallsstichprobe voraus?
Tests wie Z, t und einige andere gehen davon aus, dass die Daten auf einer Zufallsstichprobe basieren. Warum? Angenommen, ich mache experimentelle Forschungen, bei denen mir die interne Gültigkeit viel mehr am Herzen liegt als die externe. Also, wenn meine Stichprobe ein bisschen voreingenommen sein könnte, okay, da ich zugestimmt …


3
Stellen Sie fest, ob sich ein verteilter Prozess mit starkem Schwanz erheblich verbessert hat
Ich beobachte die Bearbeitungszeiten eines Prozesses vor und nach einer Änderung, um festzustellen, ob sich der Prozess durch die Änderung verbessert hat. Der Prozess hat sich verbessert, wenn die Bearbeitungszeit reduziert wird. Die Verteilung der Verarbeitungszeit ist fett begrenzt, daher ist ein Vergleich anhand des Durchschnitts nicht sinnvoll. Stattdessen möchte …

1
Unterschiede zwischen PROC Mixed und lme / lmer in R - Freiheitsgraden
Hinweis: Diese Frage ist ein Repost, da meine vorherige Frage aus rechtlichen Gründen gelöscht werden musste. Beim Vergleich von PROC MIXED von SAS mit der Funktion lmeaus dem nlmePaket in R bin ich auf einige verwirrende Unterschiede gestoßen. Insbesondere unterscheiden sich die Freiheitsgrade in den verschiedenen Tests zwischen PROC MIXEDund …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
Wie kann man schnell X abtasten, wenn exp (X) ~ Gamma?
Ich habe ein einfaches Stichprobenproblem, bei dem meine innere Schleife wie folgt aussieht: v = sample_gamma(k, a) wobei sample_gammaProben aus der Gamma-Verteilung eine Dirichlet-Probe bilden. Es funktioniert gut, aber für einige Werte von k / a läuft ein Teil der nachgeschalteten Berechnung unter. Ich habe es angepasst, um Log Space-Variablen …


2
MCMC-Methoden - Proben brennen?
Bei MCMC- Methoden lese ich immer wieder über die burn-inZeit oder die Anzahl der Proben "burn". Was ist das genau und warum wird es benötigt? Aktualisieren: Bleibt MCMC stabil, sobald es sich stabilisiert hat? Wie hängt der Zeitbegriff burn-inmit dem der Mischzeit zusammen?
12 sampling  mcmc 

1
Intuitive Beispiele für wichtige Stichproben
Mein Hintergrund ist Informatik. Ich bin ziemlich neu in Monte-Carlo-Stichprobenverfahren, und obwohl ich die Mathematik verstehe, fällt es mir schwer, intuitive Beispiele für wichtige Stichproben zu finden. Genauer gesagt, könnte jemand Beispiele nennen für: Eine ursprüngliche Verteilung, aus der man keine Stichprobe ziehen kann, die man aber schätzen kann eine …



1
Stichprobe aus der Randverteilung unter Verwendung der bedingten Verteilung?
Ich möchte aus einer univariaten Dichte , aber nur die Beziehung:fXfXf_X fX(x)=∫fX|Y(x|y)fY(y)dy.fX(x)=∫fX|Y(x|y)fY(y)dy.f_X(x) = \int f_{X\vert Y}(x\vert y)f_Y(y) dy. Ich möchte die Verwendung von MCMC (direkt auf der Integraldarstellung) vermeiden, und da und leicht sind, habe ich mir überlegt, den folgenden Sampler zu verwenden ::fX|Y(x|y)fX|Y(x|y)f_{X\vert Y}(x\vert y)fY(y)fY(y)f_Y(y) Für .j=1,…,Nj=1,…,Nj=1,\dots, N Beispiel …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.