Statistiken und Big Data average

2

Unterschied zwischen Mittelwertbildung, Datenanpassung und Anpassung der Daten und Mittelwertbildung

Falls vorhanden, zwischen dem Anpassen einer Linie an mehrere separate "Experimente", dem Mitteln der Anpassungen oder dem Mitteln der Daten aus den separaten Experimenten und dem Anpassen der gemittelten Daten. Lassen Sie mich näher darauf eingehen: Ich führe Computersimulationen durch, die eine Kurve erzeugen (siehe unten). Wir extrahieren eine Menge …

10 error fitting average

1

Abweichungen „mitteln“

Ich muss eine Art "Durchschnitt" aus einer Liste von Abweichungen ermitteln, habe aber Probleme, eine vernünftige Lösung zu finden. Es gibt eine interessante Diskussion über die Unterschiede zwischen den drei pythagoreischen Mitteln (arithmetisch, geometrisch und harmonisch) in diesem Thread ; Ich glaube jedoch immer noch nicht, dass einer von ihnen …

10 variance average

1

Wie kann man beobachtete mit erwarteten Ereignissen vergleichen?

Angenommen, ich habe eine Stichprobe von Häufigkeiten von 4 möglichen Ereignissen: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 und ich habe die erwarteten Wahrscheinlichkeiten, dass meine Ereignisse eintreten: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Mit der Summe der beobachteten …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

2

Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?

Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

1

Durchschnittswerte von Durchschnittswerten (von Durchschnittswerten, von Durchschnittswerten…)

Betrachten Sie das folgende zellbiologische Experiment. Wir vergleichen verschiedene Behandlungen von kultivierten Zellen. Jede Behandlung t wird in mehreren (Mikrotiter-) Vertiefungen wiederholt , die durch die Variable w ∈ { 1 , 2 , ⋯ , W } indiziert sind . Um das Ansprechen auf die Behandlung in Vertiefung w …

8 mean multilevel-analysis average weighted-mean

1

Der beste Weg, um einen durchschnittlichen F-Score mit unausgeglichenen Klassen zu erzielen

Ich habe einen Datensatz mit unausgeglichenen Klassen. Drei Klassen machen etwa 60% der Daten aus. Außerdem habe ich verschiedene Testaufteilungen, die ein Ungleichgewicht verursachen. Zum Beispiel: Zugset: label_1 ... label_n Testsatz: label_1, label_3, label_9 Dies bedeutet, dass obwohl ich nur 3 Etiketten in meinem Testsatz habe, diese möglicherweise als 1 …

7 machine-learning scikit-learn average unbalanced-classes

2

Protokoll des Durchschnitts v. Durchschnitt des Protokolls

Ich erstelle einen Datensatz mit monatlichen Durchschnittswerten basierend auf täglichen Daten. Dieser Datensatz wird für die Standardregressionsanalyse verwendet. Ich gehe davon aus, dass ich die abhängige Variable transformieren möchte, die eine ungefähr logarithmische Normalverteilung aufweist. Meine Frage ist, ob es angemessener ist, die Daten vor oder nach dem monatlichen Durchschnitt …

7 regression data-transformation lognormal average

Als «average» getaggte Fragen