Statistiken und Big Data definition

3

Ich weiß sehr wenig über Wahrscheinlichkeit und Statistik und möchte lernen. Ich sehe das Wort "Verteilung", das überall in verschiedenen Zusammenhängen verwendet wird. Beispielsweise hat eine diskrete Zufallsvariable eine "Wahrscheinlichkeitsverteilung". Ich weiß was das ist. Eine stetige Zufallsvariable hat eine Wahrscheinlichkeitsdichtefunktion. Für ist das Integral von bis der Wahrscheinlichkeitsdichtefunktion die …

16 distributions definition

4

Die Maschinengenauigkeit zur Steigerung des Gradienten nimmt mit zunehmender Anzahl von Iterationen ab

Ich experimentiere mit dem Algorithmus der Gradientenverstärkungsmaschine über das caretPaket in R. Unter Verwendung eines kleinen Datensatzes für Hochschulzulassungen habe ich den folgenden Code ausgeführt: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

5

Unterschied zwischen den Begriffen "gemeinsame Verteilung" und "multivariate Verteilung"?

Ich schreibe über die Verwendung einer "gemeinsamen Wahrscheinlichkeitsverteilung" für ein Publikum, das mit größerer Wahrscheinlichkeit die "multivariate Verteilung" verstehen würde, und überlege daher, die spätere zu verwenden. Dabei möchte ich aber nicht den Sinn verlieren. Wikipedia scheint darauf hinzuweisen, dass es sich um Synonyme handelt. Sind sie? Wenn nein, warum …

15 probability terminology joint-distribution definition

1

Was ist die genaue Definition eines „Heywood-Falls“?

Ich habe den Begriff "Heywood-Fall" informell verwendet, um Situationen zu bezeichnen, in denen eine online durchgeführte, "endliche Antwort" iterativ aktualisierte Schätzung der Varianz aufgrund von numerischen Genauigkeitsproblemen negativ wurde. (Ich verwende eine Variante der Welford-Methode, um Daten hinzuzufügen und ältere Daten zu entfernen.) Ich hatte den Eindruck, dass sie auf …

15 variance factor-analysis definition online

2

Beispiele für eine Statistik, die nicht unabhängig von der Verteilung der Stichprobe ist?

Dies ist die Definition für Statistik auf Wikipedia Genauer gesagt definiert die statistische Theorie eine Statistik als Funktion einer Stichprobe, wobei die Funktion selbst unabhängig von der Verteilung der Stichprobe ist. Das heißt, die Funktion kann vor der Realisierung der Daten angegeben werden. Der Begriff Statistik wird sowohl für die …

14 mathematical-statistics definition

1

Wie ist der „Fundamentalsatz der Faktoranalyse“ auf PCA anwendbar, oder wie sind PCA-Ladungen definiert?

Ich bin gerade dabei, ein Dia-Set für die "Faktoranalyse" zu durchlaufen (PCA, soweit ich das beurteilen kann). Darin wird der "Fundamentalsatz der Faktoranalyse" abgeleitet, der besagt, dass die Korrelationsmatrix der in die Analyse Daten ( ) unter Verwendung der Matrix der Faktorladungen ( ) wiederhergestellt werden kann :RR\bf RAA\bf A …

14 pca factor-analysis terminology definition

1

Confounder - Definition

Laut M. Katz in seinem Buch Multivariable Analysis (Abschnitt 1.2, Seite 6) ist „ ein Confounder mit dem Risikofaktor verbunden und steht in ursächlichem Zusammenhang mit dem Ergebnis. “ Warum muss der Confounder in ursächlichem Zusammenhang mit dem Ergebnis stehen? Wäre es genug sein für die confounder werden im Zusammenhang …

14 causality definition confounding

2

Lehnen Sie die Nullhypothese ab, wenn

Dies ist eindeutig nur eine Frage der Definition oder Konvention und hat praktisch kaum Bedeutung. Wenn αα\alpha auf seinen traditionellen Wert von 0,05 eingestellt ist, wird ein Wert von 0,0500000000000 als statistisch signifikant angesehen oder nicht? Wird die Regel zur Definition der statistischen Signifikanz normalerweise als oder ?p < α …

14 hypothesis-testing statistical-significance definition

6

Was ist der Unterschied zwischen Wirksamkeit und Wirksamkeit bei der Bestimmung des Nutzens der Therapie "A" unter der Bedingung "B"?

Der Kontext dieser Frage befindet sich in einem Gesundheitsrahmen, dh es werden eine oder mehrere Therapien bei der Behandlung einer Erkrankung untersucht. Es scheint, dass selbst angesehene Forscher die Begriffe Wirksamkeit und Wirksamkeit verwechseln , indem sie sie austauschbar verwenden. Wie kann man Wirksamkeit gegen Wirksamkeit auf eine Weise denken, …

14 epidemiology causality clinical-trials definition instrumental-variables

2

bedeutet (x) Operator?

Ich habe das gesehen Betreiber überall in einiger Literatur ich auf Kausalitäts tue (siehe zum Beispiel des Wikipedia - Eintrag ). Ich kann jedoch keine formale und allgemeine Definition dieses Operators finden.do(x)do(x)do(x) Kann mir jemand einen guten Hinweis dazu geben? Ich interessiere mich eher für eine allgemeine Definition als für …

14 references causality definition

2

Was ist Thompson Sampling für Laien?

Ich kann Thompson Sampling und seine Funktionsweise nicht verstehen . Ich las über Multi Arm Bandit und nachdem ich den Upper Confidence Bound Algorithmus gelesen hatte, schlugen viele Texte vor, dass Thompson Sampling eine bessere Leistung als UCB erbringt. Was ist Thompson Sampling? Zögern Sie nicht, Referenzartikel zum besseren Verständnis …

14 machine-learning definition multiarmed-bandit

2

Was bedeutet "Permutationsinvariante" im Kontext neuronaler Netze, die Bilderkennung durchführen?

Ich habe eine "permutationsinvariante" Version der MNIST-Ziffernerkennungsaufgabe gesehen. Was bedeutet es?

14 machine-learning neural-networks terminology conv-neural-network definition

3

Definition und Abgrenzung des Regressionsmodells

Eine peinlich einfache Frage - aber es scheint, dass sie bei Cross Validated noch nicht gestellt wurde: Was ist die Definition eines Regressionsmodells? Auch eine Support-Frage, Was ist kein Regressionsmodell? In Bezug auf Letzteres interessieren mich knifflige Beispiele, bei denen die Antwort nicht sofort offensichtlich ist. Beispielsweise, Was ist mit …

13 regression linear-model model terminology definition

2

Was sind Regularitäten und Regularisierung?

Ich höre diese Wörter immer mehr, während ich maschinelles Lernen studiere. Tatsächlich haben einige Leute die Fields-Medaille gewonnen, indem sie an Gleichungssystemen gearbeitet haben. Ich denke, dies ist ein Begriff, der sich von statistischer Physik / Mathematik zum maschinellen Lernen hinzieht. Natürlich konnten einige Leute, die ich gefragt habe, dies …

12 machine-learning self-study terminology regularization definition

5

Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?

Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

Als «definition» getaggte Fragen