Als «sample-size» getaggte Fragen

Dieses Tag ist sehr vieldeutig. Verwenden Sie diese Option, wenn es um die Stichprobengröße geht und KEINE der folgenden Fragen besser geeignet ist: [kleine Stichprobe], [große Daten], [Leistungsanalyse], [Leistung], [unterbestimmt] oder [unausgeglichene Klassen].

1
Warum ist die Stichprobenverteilung der Varianz eine Chi-Quadrat-Verteilung?
Die Aussage Die Stichprobenverteilung der Stichprobenvarianz ist eine Chi-Quadrat-Verteilung mit einem Freiheitsgrad von , wobei n die Stichprobengröße ist (vorausgesetzt, die interessierende Zufallsvariable ist normalverteilt).n−1n−1n-1nnn Quelle Meine Intuition Es ist für mich intuitiv sinnvoll, 1) weil ein Chi-Quadrat-Test wie eine Summe aus Quadrat und 2) weil eine Chi-Quadrat-Verteilung nur eine …

1
Dies zeigt, dass 100 Messungen für 5 Probanden weniger Informationen liefern als 5 Messungen für 100 Probanden
Auf einer Konferenz habe ich die folgende Aussage gehört: 100 Messungen für 5 Probanden liefern viel weniger Informationen als 5 Messungen für 100 Probanden. Es ist ein bisschen offensichtlich, dass dies wahr ist, aber ich habe mich gefragt, wie man es mathematisch beweisen könnte ... Ich denke, ein lineares gemischtes …

4
Wie projiziert man einen neuen Vektor auf den PCA-Raum?
Nach der Durchführung der Hauptkomponentenanalyse (PCA) möchte ich einen neuen Vektor auf den PCA-Raum projizieren (dh seine Koordinaten im PCA-Koordinatensystem finden). Ich habe PCA in R-Sprache mit berechnet prcomp. Jetzt sollte ich meinen Vektor mit der PCA-Rotationsmatrix multiplizieren können. Sollen die Hauptkomponenten in dieser Matrix in Zeilen oder Spalten angeordnet …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
Beispiel einer Verteilung, bei der ein großer Stichprobenumfang für den zentralen Grenzwertsatz erforderlich ist
Einige Bücher geben an, dass eine Stichprobengröße von 30 oder höher erforderlich ist, damit der zentrale Grenzwertsatz eine gute Näherung für ergibt . X¯X¯\bar{X} Ich weiß, dass dies nicht für alle Distributionen ausreicht. Ich möchte einige Beispiele für Verteilungen sehen, bei denen selbst bei einer großen Stichprobengröße (möglicherweise 100 oder …


1
Was bedeutet es, die Stichprobengröße als Zufallsvariable zu definieren?
Frank Harrell hat einen Blog gestartet ( Statistical Thinking) . In seinem ersten Beitrag listet er einige Schlüsselmerkmale seiner statistischen Philosophie auf. Es umfasst unter anderem: Machen Sie die Stichprobengröße nach Möglichkeit zu einer Zufallsvariablen Was bedeutet es, "die Stichprobengröße zu einer Zufallsvariablen zu machen"? Was sind die Vorteile davon? …



4
Berechnung der erforderlichen Stichprobengröße, Genauigkeit der Varianzschätzung?
Hintergrund Ich habe eine Variable mit einer unbekannten Verteilung. Ich habe 500 Stichproben, möchte aber die Genauigkeit demonstrieren, mit der ich die Varianz berechnen kann, um beispielsweise zu argumentieren, dass eine Stichprobengröße von 500 ausreichend ist. Ich bin auch daran interessiert, die minimale Stichprobengröße zu kennen, die erforderlich wäre, um …




3
Bootstrap: das Problem der Überanpassung
Angenommen, man führt den sogenannten nichtparametrischen Bootstrap durch, indem man aus den ursprünglichen Beobachtungen jeweils Stichproben der Größe mit Ersetzung zieht . Ich glaube, dieses Verfahren entspricht der Schätzung der kumulativen Verteilungsfunktion durch das empirische cdf:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function und dann Erhalten der Bootstrap-Abtastwerte durch Simulieren von Beobachtungen aus den geschätzten cdf …


7
Sind kurze Zeitreihen eine Modellierung wert?
Hier ist ein Zusammenhang. Ich möchte herausfinden, wie sich zwei Umgebungsvariablen (Temperatur, Nährstoffgehalt) über einen Zeitraum von 11 Jahren auf den Mittelwert einer Antwortvariablen auswirken. Innerhalb eines Jahres gibt es Daten von über 100.000 Standorten. Ziel ist es zu bestimmen, ob der Mittelwert der Antwortvariablen über den Zeitraum von 11 …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.