Eine Stichprobe ist eine Teilmenge einer Population. Die Statistik befasst sich im Allgemeinen mit der Verwendung von Stichproben, um Rückschlüsse auf die Parameter einer größeren (möglicherweise unendlichen) Population zu ziehen.
Ich habe an einer neuen Methode zum Analysieren und Analysieren von Datensätzen gearbeitet, um Untergruppen einer Population zu identifizieren und zu isolieren, ohne vorher die Merkmale einer Untergruppe zu kennen. Während die Methode mit Stichproben künstlicher Daten (dh Datensätzen, die speziell zum Identifizieren und Trennen von Teilmengen der Bevölkerung erstellt …
Was ist der Unterschied zwischen einer Population und einer Stichprobe? Welche gemeinsamen Variablen und Statistiken werden für jede verwendet und in welcher Beziehung stehen diese zueinander?
Ich verwende Caret, um eine kreuzvalidierte zufällige Gesamtstruktur über ein Dataset auszuführen. Die Y-Variable ist ein Faktor. In meinem Datensatz befinden sich keine NaNs, Infs oder NAs. Allerdings bekomme ich, wenn ich den zufälligen Wald laufen lasse Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) …
Was ist, wenn Sie eine Zufallsstichprobe entnehmen und feststellen, dass diese eindeutig nicht repräsentativ ist, wie in einer aktuellen Frage . Was ist zum Beispiel, wenn die Populationsverteilung bei 0 symmetrisch sein soll und die Stichprobe, die Sie zufällig ziehen, ungleiche positive und negative Beobachtungen aufweist und die Ungleichheit statistisch …
Ich bin gerade auf diese Arbeit gestoßen , in der beschrieben wird, wie die Wiederholbarkeit (auch bekannt als Zuverlässigkeit, auch bekannt als Intraclass-Korrelation) einer Messung über Mixed-Effects-Modellierung berechnet wird. Der R-Code wäre: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = …
Wenn ich GAM verwende, erhalte ich einen DF-Rest von (letzte Zeile im Code). Was bedeutet das? Über das GAM-Beispiel hinausgehend: Kann die Anzahl der Freiheitsgrade im Allgemeinen eine nicht ganzzahlige Zahl sein?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …
Ich habe einen realen Prozess abgetastet, Netzwerk-Ping-Zeiten. Die "Umlaufzeit" wird in Millisekunden gemessen. Die Ergebnisse werden in einem Histogramm aufgezeichnet: Ping-Zeiten haben einen Mindestwert, aber einen langen oberen Schwanz. Ich möchte wissen, um welche statistische Verteilung es sich handelt und wie man die Parameter abschätzt. Auch wenn es sich bei …
Angenommen, man führt den sogenannten nichtparametrischen Bootstrap durch, indem man aus den ursprünglichen Beobachtungen jeweils Stichproben der Größe mit Ersetzung zieht . Ich glaube, dieses Verfahren entspricht der Schätzung der kumulativen Verteilungsfunktion durch das empirische cdf:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function und dann Erhalten der Bootstrap-Abtastwerte durch Simulieren von Beobachtungen aus den geschätzten cdf …
Ist es gültig, die mittlere Länge ( ) und das mittlere Gewicht ( )) einer bestimmten Population zu verwenden, um den mittleren Body-Mass-Index ( ) für diese Population zu berechnen ?hhhwwwBMI=wh2BMI=wh2BMI = \frac{w}{h^2}
Ich bin relativ vertraut mit der Unterscheidung zwischen den Begriffen Statistik und Parameter. Ich sehe eine Statistik als den Wert, der durch Anwenden einer Funktion auf die Beispieldaten erhalten wird. Die meisten Beispiele für Parameter beziehen sich jedoch auf die Definition einer parametrischen Verteilung. Ein übliches Beispiel ist der Mittelwert …
Ich hoffe, dass diese Frage nicht als "zu allgemein" markiert wird, und hoffe, dass eine Diskussion in Gang kommt, von der alle profitieren. In der Statistik verbringen wir viel Zeit mit dem Erlernen großer Stichprobentheorien. Wir sind sehr daran interessiert, die asymptotischen Eigenschaften unserer Schätzer zu bewerten, einschließlich der Frage, …
Welche Vor- und Nachteile hat die Verwendung von LARS [1] im Vergleich zur Verwendung der Koordinatenabsenkung für die Anpassung der L1-regulierten linearen Regression? Ich interessiere mich hauptsächlich für Leistungsaspekte (meine Probleme sind Nin der Regel Hunderttausende und p<20). Es sind jedoch auch andere Erkenntnisse erwünscht. edit: Seitdem ich die Frage …
Kaggle-Wettbewerbe bestimmen die endgültigen Platzierungen auf der Grundlage eines durchgehaltenen Testsatzes. Ein durchgehaltener Testsatz ist eine Stichprobe; Es kann sein, dass es nicht repräsentativ für die zu modellierende Population ist. Da jede Einsendung wie eine Hypothese ist, hat der Algorithmus, der den Wettbewerb gewonnen hat, möglicherweise den Testsatz besser als …
Diese beiden Ausdrücke verwirrten mich sehr, als ich Statistik lernte. Es scheint mir, dass es völlig andere Dinge sind. Eine Zufallsstichprobe besteht darin, eine Stichprobe zufällig aus einer Population zu entnehmen, während eine Zufallsvariable einer Funktion gleicht, die die Menge aller möglichen Ergebnisse eines Experiments einer reellen Zahl zuordnet. Sagen …
Ich habe einen großen Datensatz (20.000 Datenpunkte), aus dem ich wiederholt Stichproben von 10 Datenpunkten entnehmen möchte. Sobald ich diese 10 Datenpunkte ausgewählt habe, möchte ich, dass sie nicht erneut ausgewählt werden. Ich habe versucht, die sampleFunktion zu verwenden, aber es scheint keine Option zu geben, über mehrere Aufrufe der …
1n - 1∑ich( xich- x¯)21n- -1∑ich(xich- -x¯)2\frac1{n-1}\sum\limits_i(x_i - \bar{x})^2xich- x¯xich- -x¯x_i - \bar{x}n - 1n- -1n-1nnnμμ\mux¯x¯\bar{x} . Also würde ich schätzen1n∑i(xi−μ)21n∑i(xi−μ)2\frac1{n}\sum\limits_i(x_i - \mu)^2 But I can't find it anymore. Is it true? Can someone give me a pointer?
Ich habe einen Datensatz, der die Anzahl der Aktionen enthält, die von Einzelpersonen innerhalb von 7 Tagen ausgeführt wurden. Die spezifische Aktion sollte für diese Frage nicht relevant sein. Hier einige beschreibende Statistiken für den Datensatz: AngebotBedeutenVarianzAnzahl der Beobachtungen0 - 77218.22791696Angebot0- -772Bedeuten18.2Varianz2791Anzahl der Beobachtungen696 \begin{array}{|c|c|} \hline \text{Range} & 0 - …
SurveyMonkey verfügt über Schritte und ein Diagramm, mit denen Sie anhand Ihrer Bevölkerungsgröße herausfinden können, welche Stichprobengröße Sie für eine bestimmte Fehlerquote oder ein bestimmtes Konfidenzintervall benötigen. SurveyMonkey-Stichprobengröße Ignoriert diese Tabelle einfach die Tatsache, dass Sie keine Zufallsstichprobe erhalten, da Sie nur die Personen erhalten, die sich die Mühe machen, …
In einer Binomialeinstellung ist die Zufallsvariable X, die die Anzahl der Erfolge angibt, binomial verteilt. Der Stichprobenanteil kann dann als X berechnet werden wobeinIhre Stichprobengröße ist. Mein Lehrbuch besagt dasX.nXn\frac{X}{n}nnn Dieser Anteil hat keine Binomialverteilung jedoch seit ist einfach eine skalierte Version einer binomial verteilten ZufallsvariablenX, sollte sie nicht auch …
Ich arbeite an einem Algorithmus, der die Größe einer Menge berechnen muss, die durch die Schnittpunkte von mindestens 2 Mengen erzeugt wird. Genauer: z= | EIN0∩ … ∩ A.n|z=|A0∩…∩An| z = \left |A_0 \cap \ldots \cap A_n \right | Die Mengen, die sich überschneiden, werden von SQL-Abfragen generiert. Um die …
Dies ist nur ein Beispiel, auf das ich mehrmals gestoßen bin, daher habe ich keine Beispieldaten. Ausführen eines linearen Regressionsmodells in R: a.lm = lm(Y ~ x1 + x2) x1ist eine stetige Variable. x2ist kategorisch und hat drei Werte, z. B. "Niedrig", "Mittel" und "Hoch". Die von R gegebene Ausgabe …
Ich habe mich immer mit der Frage auseinandergesetzt und nie eine gute Antwort erhalten, wie es möglich ist, dass der zentrale Grenzwertsatz - die klassische Version, bei der sich die Verteilung der Stichprobenmittelwerte der Normalität nähert - auf eine Poisson- oder Gamma-Verteilung angewendet werden kann, bei der . Oder für …
Wenn ich Ihnen drei Zahlen gebe, die unabhängig und identisch aus einer Standardnormalverteilung stammen, habe ich Ihnen dann drei oder eine Stichprobe gegeben? Wenn die Antwort ein Beispiel ist, gibt es dann einen kurzen Namen für das, wovon ich Ihnen drei gegeben habe?
Ich habe also 16 Studien, in denen ich versuche, eine Person anhand eines biometrischen Merkmals mithilfe von Hamming Distance zu authentifizieren. Mein Schwellenwert ist auf 3,5 eingestellt. Meine Daten sind unten und nur Versuch 1 ist ein wahres Positiv: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 …
Bereitstellung einer Stichprobengröße "N", die ich zur Vorhersage von Daten verwenden möchte. Wie kann ich die Daten so unterteilen, dass ich einige davon zum Erstellen eines Modells und die restlichen Daten zum Validieren des Modells verwende? Ich weiß, dass es keine Schwarz-Weiß-Antwort darauf gibt, aber es wäre interessant, einige "Faustregeln" …
Herausforderung In unserem Büro war ich an einer Diskussion über die Stichprobengröße und ihren Einfluss auf die Effektgröße beteiligt. Können Sie mir weiterhelfen und erklären? Base Bei der Durchführung einer Leistungsanalyse kann die Stichprobengröße für eine bestimmte Effektgröße in einem bestimmten Design bestimmt werden. Problem / Diskussion Was passiert, wenn …
Ich berechne einige bedingte Wahrscheinlichkeiten und zugehörige 95% -Konfidenzintervalle. In vielen meiner Fälle habe ich eine einfache Anzahl von xErfolgen aus nVersuchen (aus einer Kontingenztabelle), sodass ich ein Binomial-Konfidenzintervall verwenden kann, wie es binom.confint(x, n, method='exact')in in angegeben ist R. In anderen Fällen habe ich solche Daten jedoch nicht, daher …
Nehmen wir an, Sie haben eine große Zufallsstichprobe von Fußballspielern in Europa, aber Sie interessieren sich nur für das, was in Spanien passiert. Könnten Sie Ihre Stichprobe auf Spieler in Spanien reduzieren und sie dennoch als Zufallsstichprobe (aber einer anderen Bevölkerung) bezeichnen? Wenn nicht, wie würden Sie diese Teilstichprobe nennen …
In unserem Projekt haben wir eine Bevölkerung von mehr als 1000 Personen. Wir haben eine Zufallsstichprobe von 107 Personen ausgewählt, aber dann haben wir festgestellt, dass wir mehr Präzision benötigen. Deshalb möchten wir jetzt eine größere Stichprobe haben. Das Problem ist, dass die Stichprobe in unserem Fall teuer ist. Daher …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.