Eine Stichprobe ist eine Teilmenge einer Population. Die Statistik befasst sich im Allgemeinen mit der Verwendung von Stichproben, um Rückschlüsse auf die Parameter einer größeren (möglicherweise unendlichen) Population zu ziehen.
Ich habe an einer neuen Methode zum Analysieren und Analysieren von Datensätzen gearbeitet, um Untergruppen einer Population zu identifizieren und zu isolieren, ohne vorher die Merkmale einer Untergruppe zu kennen. Während die Methode mit Stichproben künstlicher Daten (dh Datensätzen, die speziell zum Identifizieren und Trennen von Teilmengen der Bevölkerung erstellt …
Was ist der Unterschied zwischen einer Population und einer Stichprobe? Welche gemeinsamen Variablen und Statistiken werden für jede verwendet und in welcher Beziehung stehen diese zueinander?
Ich verwende Caret, um eine kreuzvalidierte zufällige Gesamtstruktur über ein Dataset auszuführen. Die Y-Variable ist ein Faktor. In meinem Datensatz befinden sich keine NaNs, Infs oder NAs. Allerdings bekomme ich, wenn ich den zufälligen Wald laufen lasse Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) …
Was ist, wenn Sie eine Zufallsstichprobe entnehmen und feststellen, dass diese eindeutig nicht repräsentativ ist, wie in einer aktuellen Frage . Was ist zum Beispiel, wenn die Populationsverteilung bei 0 symmetrisch sein soll und die Stichprobe, die Sie zufällig ziehen, ungleiche positive und negative Beobachtungen aufweist und die Ungleichheit statistisch …
Ich bin gerade auf diese Arbeit gestoßen , in der beschrieben wird, wie die Wiederholbarkeit (auch bekannt als Zuverlässigkeit, auch bekannt als Intraclass-Korrelation) einer Messung über Mixed-Effects-Modellierung berechnet wird. Der R-Code wäre: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = …
Wenn ich GAM verwende, erhalte ich einen DF-Rest von (letzte Zeile im Code). Was bedeutet das? Über das GAM-Beispiel hinausgehend: Kann die Anzahl der Freiheitsgrade im Allgemeinen eine nicht ganzzahlige Zahl sein?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …
Ich habe einen realen Prozess abgetastet, Netzwerk-Ping-Zeiten. Die "Umlaufzeit" wird in Millisekunden gemessen. Die Ergebnisse werden in einem Histogramm aufgezeichnet: Ping-Zeiten haben einen Mindestwert, aber einen langen oberen Schwanz. Ich möchte wissen, um welche statistische Verteilung es sich handelt und wie man die Parameter abschätzt. Auch wenn es sich bei …
Angenommen, man führt den sogenannten nichtparametrischen Bootstrap durch, indem man aus den ursprünglichen Beobachtungen jeweils Stichproben der Größe mit Ersetzung zieht . Ich glaube, dieses Verfahren entspricht der Schätzung der kumulativen Verteilungsfunktion durch das empirische cdf:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function und dann Erhalten der Bootstrap-Abtastwerte durch Simulieren von Beobachtungen aus den geschätzten cdf …
Ist es gültig, die mittlere Länge ( ) und das mittlere Gewicht ( )) einer bestimmten Population zu verwenden, um den mittleren Body-Mass-Index ( ) für diese Population zu berechnen ?hhhwwwBMI=wh2BMI=wh2BMI = \frac{w}{h^2}
Ich bin relativ vertraut mit der Unterscheidung zwischen den Begriffen Statistik und Parameter. Ich sehe eine Statistik als den Wert, der durch Anwenden einer Funktion auf die Beispieldaten erhalten wird. Die meisten Beispiele für Parameter beziehen sich jedoch auf die Definition einer parametrischen Verteilung. Ein übliches Beispiel ist der Mittelwert …
Ich hoffe, dass diese Frage nicht als "zu allgemein" markiert wird, und hoffe, dass eine Diskussion in Gang kommt, von der alle profitieren. In der Statistik verbringen wir viel Zeit mit dem Erlernen großer Stichprobentheorien. Wir sind sehr daran interessiert, die asymptotischen Eigenschaften unserer Schätzer zu bewerten, einschließlich der Frage, …
Welche Vor- und Nachteile hat die Verwendung von LARS [1] im Vergleich zur Verwendung der Koordinatenabsenkung für die Anpassung der L1-regulierten linearen Regression? Ich interessiere mich hauptsächlich für Leistungsaspekte (meine Probleme sind Nin der Regel Hunderttausende und p<20). Es sind jedoch auch andere Erkenntnisse erwünscht. edit: Seitdem ich die Frage …
Kaggle-Wettbewerbe bestimmen die endgültigen Platzierungen auf der Grundlage eines durchgehaltenen Testsatzes. Ein durchgehaltener Testsatz ist eine Stichprobe; Es kann sein, dass es nicht repräsentativ für die zu modellierende Population ist. Da jede Einsendung wie eine Hypothese ist, hat der Algorithmus, der den Wettbewerb gewonnen hat, möglicherweise den Testsatz besser als …
Diese beiden Ausdrücke verwirrten mich sehr, als ich Statistik lernte. Es scheint mir, dass es völlig andere Dinge sind. Eine Zufallsstichprobe besteht darin, eine Stichprobe zufällig aus einer Population zu entnehmen, während eine Zufallsvariable einer Funktion gleicht, die die Menge aller möglichen Ergebnisse eines Experiments einer reellen Zahl zuordnet. Sagen …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.