Als «weighted-mean» getaggte Fragen

Ein gewichteter Mittelwert (oder gewichteter Durchschnitt) ist wie ein gewöhnlicher Mittelwert, aber die Beobachtungen tragen nicht gleichermaßen dazu bei - einige Datenwerte werden stärker betont als andere; Sie werden mit einem größeren oder kleineren Betrag als 1 / n gewichtet.

8
Generieren Sie eine Zufallsvariable mit einer definierten Korrelation zu einer oder mehreren vorhandenen Variablen.
Für eine Simulationsstudie muss ich Zufallsvariablen generieren, die eine vorab festgelegte (Populations-) Korrelation zu einer vorhandenen Variablen .Y.YY Ich sah in die RPakete copulaund CDVineder Zufall multivariate Verteilungen mit einer bestimmten Abhängigkeitsstruktur erzeugen kann. Es ist jedoch nicht möglich, eine der resultierenden Variablen an eine vorhandene Variable zu binden. Anregungen …


2
Vorspannungskorrektur in der gewichteten Varianz
Für die ungewichtete Varianz existiert die vorspannungskorrigierte Stichprobenvarianz, wenn der Mittelwert aus denselben Daten geschätzt wurde: Var(X):=1Var ( X) : = 1n∑ich( xich- μ )2Var(X): =1n∑ich(xich-μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Var ( X) : = 1n - 1∑ich( xich- E[ X] )2Var(X): =1n-1∑ich(xich-E[X])2\text{Var}(X):=\frac{1}{n-1}\sum_i(x_i - E[X])^2 Ich beschäftige mich mit dem gewichteten Mittelwert und …

1
Gewichtete Varianz, noch einmal
Unvoreingenommene gewichtete Varianz wurde hier und anderswo bereits angesprochen , aber es scheint immer noch eine überraschende Menge an Verwirrung zu geben. Es scheint einen Konsens über die Formel zu geben, die sowohl im ersten Link als auch im Wikipedia-Artikel vorgestellt wird . Dies sieht auch aus wie die von …

2
Wie berechnet man die durchschnittliche Dauer der Vegetarismus-Mitgliedschaft, wenn nur Umfragedaten zu aktuellen Vegetariern vorliegen?
Eine zufällige Bevölkerungsstichprobe wurde erhoben. Sie wurden gefragt, ob sie vegetarisch essen. Wenn sie mit Ja geantwortet haben, wurden sie auch gebeten, anzugeben, wie lange sie ohne Unterbrechung vegetarisch ernährt haben. Ich möchte diese Daten verwenden, um die durchschnittliche Dauer der Einhaltung des Vegetarismus zu berechnen. Mit anderen Worten, wenn …


1
Ermittlung des wahren Mittels aus verrauschten Beobachtungen
Ich habe eine große Menge von Datenpunkten der Form (Mittelwert, stdev). Ich möchte dies auf einen einzigen (besseren) Mittelwert und eine (hoffentlich) kleinere Standardabweichung reduzieren. Offensichtlich konnte ich einfach berechnen berücksichtigt jedoch nicht die Tatsache, dass einige der Datenpunkte wesentlich genauer sind als andere.∑datameanN∑datameanN\frac{\sum data_{mean}}{N} Vereinfacht ausgedrückt möchte ich einen …


4
Wird der Mittelwert eines Satzes von Mitteln immer der gleiche sein wie der Mittelwert, der aus dem gesamten Satz von Rohdaten erhalten wird?
Wenn ich den Mittelwert für 4 Datensätze (die unterschiedliche Stichprobengrößen haben) berechnet habe, kann ich dann einen "Gesamtmittelwert" erhalten, indem ich den "Mittelwert der Mittelwerte" berechne? Wenn ja, ist dieser "Mittelwert der Mittelwerte" derselbe, als hätte ich die Daten aus allen 4 Sätzen kombiniert und dann den Mittelwert berechnet?


2
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 

1
Eine einfachere Methode zur Berechnung des exponentiell gewichteten gleitenden Durchschnitts?
Vorgeschlagene Methode: Bei einer Zeitreihe möchte ich einen gewichteten gleitenden Durchschnitt mit einem Mittelungsfenster von Punkten berechnen , wobei die Gewichtungen neuere Werte gegenüber älteren Werten bevorzugen. N.xichxix_iN.NN Bei der Auswahl der Gewichte verwende ich die bekannte Tatsache, dass eine geometrische Reihe gegen 1 konvergiert, dh , vorausgesetzt, es werden …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.