Statistiken und Big Data

3

Warum werden in neuronalen Netzen Bias-Knoten verwendet?

Warum werden in neuronalen Netzen Bias-Knoten verwendet? Wie viele solltest du verwenden? In welchen Ebenen sollten Sie sie verwenden: Alle ausgeblendeten Ebenen und die Ausgabeebene?

29 machine-learning neural-networks bias-node

2

Wie gut nähert sich Bootstrapping der Stichprobenverteilung eines Schätzers an?

Nachdem ich kürzlich Bootstrap studiert hatte, stellte ich mir eine konzeptionelle Frage, die mich immer noch verwirrt: Sie haben eine Population und möchten ein Populationsattribut kennen, dh , wobei ich P verwende, um die Population darzustellen. Dies θ könnte beispielsweise ein Populationsmittelwert sein. Normalerweise können Sie nicht alle Daten aus …

29 bootstrap simulation resampling

3

Kann eine Metaanalyse von Studien, die alle „nicht statistisch signifikant“ sind, zu einer „signifikanten“ Schlussfolgerung führen?

Eine Metaanalyse umfasst eine Reihe von Studien, von denen alle einen P-Wert von mehr als 0,05 berichteten. Kann die gesamte Metaanalyse einen P-Wert von weniger als 0,05 ausweisen? Unter welchen Umständen? (Ich bin mir ziemlich sicher, dass die Antwort ja lautet, aber ich hätte gerne eine Referenz oder Erklärung.)

29 statistical-significance meta-analysis combining-p-values

3

Welche Informationen sind Fisher-Informationen?

Angenommen, wir haben eine Zufallsvariable . Wenn der wahre Parameter wäre, sollte die Wahrscheinlichkeitsfunktion maximiert und die Ableitung gleich Null sein. Dies ist das Grundprinzip des Maximum-Likelihood-Schätzers.X∼f(x|θ)X∼f(x|θ)X \sim f(x|\theta)θ0θ0\theta_0 Wie ich es verstehe, ist Fisher Information definiert als I(θ)=E[(∂∂θf(X|θ))2]I(θ)=E[(∂∂θf(X|θ))2]I(\theta) = \Bbb E \Bigg[\left(\frac{\partial}{\partial \theta}f(X|\theta)\right)^2\Bigg ] Wenn also der wahre Parameter …

29 bayesian maximum-likelihood likelihood intuition fisher-information

2

Gamma vs. Lognormalverteilungen

Ich habe eine experimentell beobachtete Verteilung, die einer Gamma- oder Lognormalverteilung sehr ähnlich sieht. Ich habe gelesen, dass die Lognormalverteilung die maximale Entropiewahrscheinlichkeitsverteilung für eine Zufallsvariable für die der Mittelwert und die Varianz von ln ( X ) festgelegt sind. Hat die Gamma-Verteilung ähnliche Eigenschaften?XXXln(X)ln⁡(X)\ln(X)

29 pdf gamma-distribution lognormal

10

Regression zum Mittelwert gegen den Irrtum des Spielers

Einerseits habe ich die Regression zum Mittelwert und andererseits habe ich den Trugschluss des Spielers . Der Irrtum von Gambler wird von Miller und Sanjurjo (2019) definiert als "die irrtümliche Annahme, dass zufällige Sequenzen eine systematische Tendenz zur Umkehrung aufweisen, dh dass Streifen mit ähnlichen Ergebnissen eher enden als andauern". …

29 regression mean fallacy gambling

3

Warum nicht den Mittelwert einer Bootstrap-Verteilung melden?

Wenn ein Parameter gebootet wird, um den Standardfehler zu erhalten, erhalten wir eine Verteilung des Parameters. Warum verwenden wir nicht den Mittelwert dieser Verteilung als Ergebnis oder Schätzung für den Parameter, den wir erhalten möchten? Sollte sich die Verteilung nicht der tatsächlichen annähern? Daher würden wir eine gute Schätzung des …

29 distributions bootstrap standard-error expected-value

1

Beweis, dass die Koeffizienten in einem OLS-Modell einer t-Verteilung mit (nk) Freiheitsgraden folgen

Hintergrund Angenommen, wir haben ein gewöhnliches Modell der kleinsten Quadrate, in dem wir kkk Koeffizienten in unserem Regressionsmodell haben, y=Xβ+ϵy=Xβ+ϵ\mathbf{y}=\mathbf{X}\mathbf{\beta} + \mathbf{\epsilon} wobei ββ\mathbf{\beta} ein (k×1)(k×1)(k\times1) Koeffizientenvektor ist, ist XX\mathbf{X} die Entwurfsmatrix durch definierte X=⎛⎝⎜⎜⎜⎜⎜⎜11⋮1x11x21xn1x12…⋱………x1(k−1)⋮⋮xn(k−1)⎞⎠⎟⎟⎟⎟⎟⎟X=(1x11x12…x1(k−1)1x21…⋮⋮⋱⋮1xn1……xn(k−1))\mathbf{X} = \begin{pmatrix} 1 & x_{11} & x_{12} & \dots & x_{1\;(k-1)} \\ 1 & x_{21} …

29 regression linear-model least-squares t-distribution

1

Wie werden die Standardfehler für die angepassten Werte aus einer logistischen Regression berechnet?

Wie werden Standardfehler berechnet, wenn Sie einen angepassten Wert aus einem logistischen Regressionsmodell vorhersagen? Ich meine für die angepassten Werte , nicht für die Koeffizienten (die Fishers Informationsmatrix beinhaltet). Ich habe nur herausgefunden, wie ich die Zahlen erhalten kann R(z. B. hier in r-help oder hier in Stack Overflow), aber …

29 r regression logistic mathematical-statistics references

1

Merkmalsauswahl & Modell mit GLMnet auf Methylierungsdaten (p >> N)

Ich möchte GLM und Elastic Net verwenden, um die relevanten Features auszuwählen und ein lineares Regressionsmodell zu erstellen (dh sowohl Vorhersage als auch Verständnis, daher ist es besser, relativ wenige Parameter zu haben). Die Ausgabe erfolgt kontinuierlich. Es sind Gene pro Fälle. Ich habe über das Paket gelesen , bin …

29 r regularization glmnet elastic-net underdetermined

5

Warum hat mein Bootstrap-Intervall eine schreckliche Abdeckung?

Ich wollte eine Klassendemonstration durchführen, bei der ich ein t-Intervall mit einem Bootstrap-Intervall vergleiche und die Überdeckungswahrscheinlichkeit für beide berechne. Ich wollte, dass die Daten aus einer verzerrten Verteilung stammen, also habe ich mich dafür entschieden, die Daten als exp(rnorm(10, 0, 2)) + 1eine Stichprobe der Größe 10 aus einem …

29 bootstrap diagnostic

3

Kann eine ANOVA signifikant sein, wenn keiner der paarweisen t-Tests signifikant ist?

Kann eine Einweg- ANOVA (mit Gruppen oder "Niveaus") einen signifikanten Unterschied melden, wenn keiner der paarweisen N ( N - 1 ) / 2 t-Tests dies tut?N>2N>2N>2N(N−1)/2N(N−1)/2N(N-1)/2 In dieser Antwort schrieb @whuber: Es ist allgemein bekannt, dass ein globaler ANOVA-F-Test eine Mittelwertdifferenz erkennen kann, selbst wenn kein individueller [unangepasster paarweiser] …

29 statistical-significance anova t-test post-hoc

2

Ist es wichtig, eine Normalisierung für SVM und Random Forest durchzuführen?

Jede Dimension meiner Features hat einen anderen Wertebereich. Ich möchte wissen, ob es wichtig ist, diesen Datensatz zu normalisieren.

29 machine-learning svm random-forest normalization

4

Fläche unter der Kurve des ROC im Verhältnis zur Gesamtgenauigkeit

Ich bin etwas verwirrt über die Area Under Curve (AUC) von ROC und die allgemeine Genauigkeit. Wird die AUC proportional zur Gesamtgenauigkeit sein? Mit anderen Worten, wenn wir eine größere Gesamtgenauigkeit haben, werden wir definitiv eine größere AUC bekommen? Oder sind sie per definitionem positiv korreliert? Wenn sie positiv korreliert …

29 classification roc

3

Unterschied zwischen einem SVM und einem Perceptron

Ich bin ein bisschen verwirrt mit dem Unterschied zwischen einem SVM und einem Perzeptron. Lassen Sie mich hier versuchen, mein Verständnis zusammenzufassen, und bitte korrigieren Sie, wo ich falsch liege, und füllen Sie das aus, was ich verpasst habe. Das Perceptron versucht nicht, den Abstand zu optimieren. Solange eine Hyperebene …

29 machine-learning svm kernel-trick