Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren



3
Kann eine Metaanalyse von Studien, die alle „nicht statistisch signifikant“ sind, zu einer „signifikanten“ Schlussfolgerung führen?
Eine Metaanalyse umfasst eine Reihe von Studien, von denen alle einen P-Wert von mehr als 0,05 berichteten. Kann die gesamte Metaanalyse einen P-Wert von weniger als 0,05 ausweisen? Unter welchen Umständen? (Ich bin mir ziemlich sicher, dass die Antwort ja lautet, aber ich hätte gerne eine Referenz oder Erklärung.)

3
Welche Informationen sind Fisher-Informationen?
Angenommen, wir haben eine Zufallsvariable . Wenn der wahre Parameter wäre, sollte die Wahrscheinlichkeitsfunktion maximiert und die Ableitung gleich Null sein. Dies ist das Grundprinzip des Maximum-Likelihood-Schätzers.X∼f(x|θ)X∼f(x|θ)X \sim f(x|\theta)θ0θ0\theta_0 Wie ich es verstehe, ist Fisher Information definiert als I(θ)=E[(∂∂θf(X|θ))2]I(θ)=E[(∂∂θf(X|θ))2]I(\theta) = \Bbb E \Bigg[\left(\frac{\partial}{\partial \theta}f(X|\theta)\right)^2\Bigg ] Wenn also der wahre Parameter …

2
Gamma vs. Lognormalverteilungen
Ich habe eine experimentell beobachtete Verteilung, die einer Gamma- oder Lognormalverteilung sehr ähnlich sieht. Ich habe gelesen, dass die Lognormalverteilung die maximale Entropiewahrscheinlichkeitsverteilung für eine Zufallsvariable für die der Mittelwert und die Varianz von ln ( X ) festgelegt sind. Hat die Gamma-Verteilung ähnliche Eigenschaften?XXXln(X)ln⁡(X)\ln(X)

10
Regression zum Mittelwert gegen den Irrtum des Spielers
Einerseits habe ich die Regression zum Mittelwert und andererseits habe ich den Trugschluss des Spielers . Der Irrtum von Gambler wird von Miller und Sanjurjo (2019) definiert als "die irrtümliche Annahme, dass zufällige Sequenzen eine systematische Tendenz zur Umkehrung aufweisen, dh dass Streifen mit ähnlichen Ergebnissen eher enden als andauern". …


1
Beweis, dass die Koeffizienten in einem OLS-Modell einer t-Verteilung mit (nk) Freiheitsgraden folgen
Hintergrund Angenommen, wir haben ein gewöhnliches Modell der kleinsten Quadrate, in dem wir kkk Koeffizienten in unserem Regressionsmodell haben, y=Xβ+ϵy=Xβ+ϵ\mathbf{y}=\mathbf{X}\mathbf{\beta} + \mathbf{\epsilon} wobei ββ\mathbf{\beta} ein (k×1)(k×1)(k\times1) Koeffizientenvektor ist, ist XX\mathbf{X} die Entwurfsmatrix durch definierte X=⎛⎝⎜⎜⎜⎜⎜⎜11⋮1x11x21xn1x12…⋱………x1(k−1)⋮⋮xn(k−1)⎞⎠⎟⎟⎟⎟⎟⎟X=(1x11x12…x1(k−1)1x21…⋮⋮⋱⋮1xn1……xn(k−1))\mathbf{X} = \begin{pmatrix} 1 & x_{11} & x_{12} & \dots & x_{1\;(k-1)} \\ 1 & x_{21} …

1
Wie werden die Standardfehler für die angepassten Werte aus einer logistischen Regression berechnet?
Wie werden Standardfehler berechnet, wenn Sie einen angepassten Wert aus einem logistischen Regressionsmodell vorhersagen? Ich meine für die angepassten Werte , nicht für die Koeffizienten (die Fishers Informationsmatrix beinhaltet). Ich habe nur herausgefunden, wie ich die Zahlen erhalten kann R(z. B. hier in r-help oder hier in Stack Overflow), aber …


5
Warum hat mein Bootstrap-Intervall eine schreckliche Abdeckung?
Ich wollte eine Klassendemonstration durchführen, bei der ich ein t-Intervall mit einem Bootstrap-Intervall vergleiche und die Überdeckungswahrscheinlichkeit für beide berechne. Ich wollte, dass die Daten aus einer verzerrten Verteilung stammen, also habe ich mich dafür entschieden, die Daten als exp(rnorm(10, 0, 2)) + 1eine Stichprobe der Größe 10 aus einem …

3
Kann eine ANOVA signifikant sein, wenn keiner der paarweisen t-Tests signifikant ist?
Kann eine Einweg- ANOVA (mit Gruppen oder "Niveaus") einen signifikanten Unterschied melden, wenn keiner der paarweisen N ( N - 1 ) / 2 t-Tests dies tut?N>2N>2N>2N(N−1)/2N(N−1)/2N(N-1)/2 In dieser Antwort schrieb @whuber: Es ist allgemein bekannt, dass ein globaler ANOVA-F-Test eine Mittelwertdifferenz erkennen kann, selbst wenn kein individueller [unangepasster paarweiser] …


4
Fläche unter der Kurve des ROC im Verhältnis zur Gesamtgenauigkeit
Ich bin etwas verwirrt über die Area Under Curve (AUC) von ROC und die allgemeine Genauigkeit. Wird die AUC proportional zur Gesamtgenauigkeit sein? Mit anderen Worten, wenn wir eine größere Gesamtgenauigkeit haben, werden wir definitiv eine größere AUC bekommen? Oder sind sie per definitionem positiv korreliert? Wenn sie positiv korreliert …

3
Unterschied zwischen einem SVM und einem Perceptron
Ich bin ein bisschen verwirrt mit dem Unterschied zwischen einem SVM und einem Perzeptron. Lassen Sie mich hier versuchen, mein Verständnis zusammenzufassen, und bitte korrigieren Sie, wo ich falsch liege, und füllen Sie das aus, was ich verpasst habe. Das Perceptron versucht nicht, den Abstand zu optimieren. Solange eine Hyperebene …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.