Statistiken und Big Data intuition

1

Geometrisches Verständnis von PCA im Subjektraum

Ich versuche ein intuitives Verständnis dafür zu bekommen, wie die Hauptkomponentenanalyse (PCA) im Subjekt- (Doppel-) Raum funktioniert . Betrachten 2D - Datensatz mit zwei Variablen, x1x1x_1 und x2x2x_2 , und nnn Datenpunkte (Datenmatrix XX\mathbf X ist n×2n×2n\times 2 und wird angenommen, zentriert werden). Die übliche Darstellung von PCA ist, dass …

19 pca linear-algebra intuition geometry

5

Intuition (geometrische oder andere) von

Betrachten Sie die elementare Identität der Varianz: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} Es ist eine einfache algebraische Manipulation der Definition eines zentralen Moments in nicht-zentrale Momente. Es ermöglicht die bequeme Manipulation von Var(X)Var(X)Var(X) in anderen Zusammenhängen. Es ermöglicht auch die Berechnung …

18 variance descriptive-statistics intuition

2

Sinn machen für die Analyse unabhängiger Komponenten

Ich habe die Frage Sinn der Hauptkomponentenanalyse gesehen und genossen , und jetzt habe ich die gleiche Frage für die unabhängige Komponentenanalyse. Ich meine, ich möchte eine umfassende Frage zu den intuitiven Möglichkeiten zum Verstehen von ICA stellen. Ich möchte verstehen es. Ich möchte den Zweck verstehen. Ich möchte das …

18 intuition ica

2

Intuitive Erklärung der Funktionsweise von UMAP im Vergleich zu t-SNE

Ich habe einen Doktortitel in Molekularbiologie. Meine Studien haben vor kurzem begonnen, hochdimensionale Datenanalysen zu beinhalten. Ich hatte die Idee, wie t-SNE funktioniert (dank eines StatQuest-Videos auf YouTube ), kann mich aber nicht um UMAP kümmern (ich habe mir den Vortrag des UMAP-Erstellers online angehört, fand ihn aber nicht leicht …

18 dimensionality-reduction intuition tsne

2

Warum ist die CDF einer Probe gleichmäßig verteilt?

Ich lese hier gegeben , dass eine Probe aus einer stetigen Verteilung mit cdf folgt die zu korrespondierende Stichprobe einer einheitlichen Standardverteilung.X1, X2, . . . , XnX1,X2,...,Xn X_1,X_2,...,X_n U i = F X ( X i )FXFX F_X Uich= FX( Xich)Ui=FX(Xi) U_i = F_X(X_i) Ich habe dies mithilfe von …

17 pdf uniform cdf intuition

2

Clustering - Intuition hinter Kleinbergs Unmöglichkeitssatz

Ich habe darüber nachgedacht, einen Blogbeitrag zu dieser interessanten Analyse von Kleinberg (2002) zu schreiben , in dem die Schwierigkeit der Clusterbildung untersucht wird. Kleinberg skizziert drei scheinbar intuitive Desiderata für eine Clustering-Funktion und beweist dann, dass keine solche Funktion existiert. Es gibt viele Cluster-Algorithmen, die zwei der drei Kriterien …

17 mathematical-statistics clustering intuition hierarchical-clustering

2

Für welche (symmetrischen) Verteilungen ist der Stichprobenmittelwert ein effizienterer Schätzer als der Stichprobenmedian?

Ich habe unter der Annahme gearbeitet, dass der Stichprobenmedian ein robusteres Maß für die zentrale Tendenz ist als der Stichprobenmittelwert, da er Ausreißer ignoriert. Ich war daher überrascht zu erfahren (in der Antwort auf eine andere Frage ), dass für Stichproben, die aus einer Normalverteilung gezogen wurden, die Varianz des …

17 distributions median intuition mean efficiency

3

Idee und Intuition hinter Quasi Maximum Likelihood Estimation (QMLE)

Frage (n): Welche Idee und Intuition steckt hinter der Quasi-Maximum-Likelihood-Schätzung (QMLE; auch als Pseudo-Maximum-Likelihood-Schätzung (PMLE) bezeichnet)? Was bewirkt, dass der Schätzer funktioniert, wenn die tatsächliche Fehlerverteilung nicht mit der angenommenen Fehlerverteilung übereinstimmt? Die Wikipedia-Seite für QMLE ist in Ordnung (kurz, intuitiv, auf den Punkt gebracht), aber ich könnte etwas mehr …

17 maximum-likelihood references intuition quasi-likelihood

3

Intuition hinter der Hazard Rate

Ich bin verwirrt über die Gleichung, die als Definition der Gefährdungsrate dient. Ich habe eine Vorstellung davon, wie hoch die Gefährdungsrate ist, verstehe aber nicht, wie die Gleichung diese Intuition ausdrückt. Wenn xxx eine Zufallsvariable ist, die den Zeitpunkt des Todes einer Person in einem Zeitintervall darstellt [0,T][0,T][0,T] . Dann …

16 survival intuition hazard

2

Warum ist die Standardabweichung als Quadrat der Varianz und nicht als Quadrat der Quadratsumme über N definiert?

Heute unterrichtete ich eine Einführungsklasse für Statistik und ein Schüler kam auf mich zu und stellte mir die Frage, die ich hier umformuliere: "Warum wird die Standardabweichung als Abweichungsquadrat und nicht als Quadratsumme über N definiert?" Wir definieren die Populationsvarianz:σ2= 1N∑ ( xich- μ )2σ2=1N∑(xich-μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} Und Standardabweichung: .σ= σ2--√= 1N√∑ …

16 variance standard-deviation intuition teaching

1

EM, gibt es eine intuitive Erklärung?

Das EM-Verfahren erscheint dem Uneingeweihten als mehr oder weniger schwarze Magie. Schätzen Sie die Parameter eines HMM (zum Beispiel) mit überwachten Daten. Dekodieren Sie dann nicht getaggte Daten, indem Sie Ereignisse vorwärts und rückwärts zählen, als ob die Daten mehr oder weniger getaggt wären. Warum macht dies das Modell besser? …

16 expectation-maximization intuition

2

Intuition zur Parameterschätzung in gemischten Modellen (Varianzparameter vs. bedingte Modi)

Ich habe viele Male gelesen, dass zufällige Effekte (BLUPs / bedingte Modi für beispielsweise Probanden) keine Parameter eines linearen Mischeffektmodells sind, sondern aus den geschätzten Varianz- / Kovarianzparametern abgeleitet werden können. ZB Reinhold Kliegl et al. (2011) Zustand: Zufällige Effekte sind die Abweichungen der Probanden von der mittleren RT und …

15 mixed-model intuition blup

4

Wie entwickelt man Intuition für bedingte Wahrscheinlichkeit?

In den Videovorträgen von Harvards Statistikkurs 110: Wahrscheinlichkeitsrechnung , die auf iTunes und YouTube zu finden sind, bin ich auf dieses Problem gestoßen . Ich habe versucht, es hier zusammenzufassen: Angenommen, wir erhalten eine zufällige Zwei-Karten-Hand aus einem Standardstapel. Wie groß ist die Wahrscheinlichkeit, dass beide Karten Asse sind, vorausgesetzt, …

15 probability conditional-probability intuition

2

Grundlegendes zu Entfernungskorrelationsberechnungen

Nach meinem Verständnis ist die Entfernungskorrelation eine robuste und universelle Methode, um zu überprüfen, ob es eine Beziehung zwischen zwei numerischen Variablen gibt. Wenn wir zum Beispiel eine Reihe von Zahlenpaaren haben: (x1, y1) (x2, y2) ... (xn, yn) Wir können die Entfernungskorrelation verwenden, um zu überprüfen, ob eine (nicht …

15 correlation independence intuition distance-covariance

4

Die Operation des Zufalls in einer deterministischen Welt

In Steven Pinkers Buch " Bessere Engel unserer Natur" merkt er das an Wahrscheinlichkeit ist eine Frage der Perspektive. Einzelereignisse haben, aus ausreichender Nähe betrachtet, bestimmte Ursachen. Sogar ein Münzwurf kann aus den Startbedingungen und den Gesetzen der Physik vorhergesagt werden, und ein erfahrener Magier kann diese Gesetze jedes Mal …

15 probability central-limit-theorem intuition

Als «intuition» getaggte Fragen