Ich versuche ein intuitives Verständnis dafür zu bekommen, wie die Hauptkomponentenanalyse (PCA) im Subjekt- (Doppel-) Raum funktioniert . Betrachten 2D - Datensatz mit zwei Variablen, x1x1x_1 und x2x2x_2 , und nnn Datenpunkte (Datenmatrix XX\mathbf X ist n×2n×2n\times 2 und wird angenommen, zentriert werden). Die übliche Darstellung von PCA ist, dass …
Betrachten Sie die elementare Identität der Varianz: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} Es ist eine einfache algebraische Manipulation der Definition eines zentralen Moments in nicht-zentrale Momente. Es ermöglicht die bequeme Manipulation von Var(X)Var(X)Var(X) in anderen Zusammenhängen. Es ermöglicht auch die Berechnung …
Ich habe die Frage Sinn der Hauptkomponentenanalyse gesehen und genossen , und jetzt habe ich die gleiche Frage für die unabhängige Komponentenanalyse. Ich meine, ich möchte eine umfassende Frage zu den intuitiven Möglichkeiten zum Verstehen von ICA stellen. Ich möchte verstehen es. Ich möchte den Zweck verstehen. Ich möchte das …
Ich habe einen Doktortitel in Molekularbiologie. Meine Studien haben vor kurzem begonnen, hochdimensionale Datenanalysen zu beinhalten. Ich hatte die Idee, wie t-SNE funktioniert (dank eines StatQuest-Videos auf YouTube ), kann mich aber nicht um UMAP kümmern (ich habe mir den Vortrag des UMAP-Erstellers online angehört, fand ihn aber nicht leicht …
Ich lese hier gegeben , dass eine Probe aus einer stetigen Verteilung mit cdf folgt die zu korrespondierende Stichprobe einer einheitlichen Standardverteilung.X1, X2, . . . , XnX1,X2,...,Xn X_1,X_2,...,X_n U i = F X ( X i )FXFX F_X Uich= FX( Xich)Ui=FX(Xi) U_i = F_X(X_i) Ich habe dies mithilfe von …
Ich habe darüber nachgedacht, einen Blogbeitrag zu dieser interessanten Analyse von Kleinberg (2002) zu schreiben , in dem die Schwierigkeit der Clusterbildung untersucht wird. Kleinberg skizziert drei scheinbar intuitive Desiderata für eine Clustering-Funktion und beweist dann, dass keine solche Funktion existiert. Es gibt viele Cluster-Algorithmen, die zwei der drei Kriterien …
Ich habe unter der Annahme gearbeitet, dass der Stichprobenmedian ein robusteres Maß für die zentrale Tendenz ist als der Stichprobenmittelwert, da er Ausreißer ignoriert. Ich war daher überrascht zu erfahren (in der Antwort auf eine andere Frage ), dass für Stichproben, die aus einer Normalverteilung gezogen wurden, die Varianz des …
Frage (n): Welche Idee und Intuition steckt hinter der Quasi-Maximum-Likelihood-Schätzung (QMLE; auch als Pseudo-Maximum-Likelihood-Schätzung (PMLE) bezeichnet)? Was bewirkt, dass der Schätzer funktioniert, wenn die tatsächliche Fehlerverteilung nicht mit der angenommenen Fehlerverteilung übereinstimmt? Die Wikipedia-Seite für QMLE ist in Ordnung (kurz, intuitiv, auf den Punkt gebracht), aber ich könnte etwas mehr …
Ich bin verwirrt über die Gleichung, die als Definition der Gefährdungsrate dient. Ich habe eine Vorstellung davon, wie hoch die Gefährdungsrate ist, verstehe aber nicht, wie die Gleichung diese Intuition ausdrückt. Wenn xxx eine Zufallsvariable ist, die den Zeitpunkt des Todes einer Person in einem Zeitintervall darstellt [0,T][0,T][0,T] . Dann …
Heute unterrichtete ich eine Einführungsklasse für Statistik und ein Schüler kam auf mich zu und stellte mir die Frage, die ich hier umformuliere: "Warum wird die Standardabweichung als Abweichungsquadrat und nicht als Quadratsumme über N definiert?" Wir definieren die Populationsvarianz:σ2= 1N∑ ( xich- μ )2σ2=1N∑(xich-μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} Und Standardabweichung: .σ= σ2--√= 1N√∑ …
Das EM-Verfahren erscheint dem Uneingeweihten als mehr oder weniger schwarze Magie. Schätzen Sie die Parameter eines HMM (zum Beispiel) mit überwachten Daten. Dekodieren Sie dann nicht getaggte Daten, indem Sie Ereignisse vorwärts und rückwärts zählen, als ob die Daten mehr oder weniger getaggt wären. Warum macht dies das Modell besser? …
Ich habe viele Male gelesen, dass zufällige Effekte (BLUPs / bedingte Modi für beispielsweise Probanden) keine Parameter eines linearen Mischeffektmodells sind, sondern aus den geschätzten Varianz- / Kovarianzparametern abgeleitet werden können. ZB Reinhold Kliegl et al. (2011) Zustand: Zufällige Effekte sind die Abweichungen der Probanden von der mittleren RT und …
In den Videovorträgen von Harvards Statistikkurs 110: Wahrscheinlichkeitsrechnung , die auf iTunes und YouTube zu finden sind, bin ich auf dieses Problem gestoßen . Ich habe versucht, es hier zusammenzufassen: Angenommen, wir erhalten eine zufällige Zwei-Karten-Hand aus einem Standardstapel. Wie groß ist die Wahrscheinlichkeit, dass beide Karten Asse sind, vorausgesetzt, …
Nach meinem Verständnis ist die Entfernungskorrelation eine robuste und universelle Methode, um zu überprüfen, ob es eine Beziehung zwischen zwei numerischen Variablen gibt. Wenn wir zum Beispiel eine Reihe von Zahlenpaaren haben: (x1, y1) (x2, y2) ... (xn, yn) Wir können die Entfernungskorrelation verwenden, um zu überprüfen, ob eine (nicht …
In Steven Pinkers Buch " Bessere Engel unserer Natur" merkt er das an Wahrscheinlichkeit ist eine Frage der Perspektive. Einzelereignisse haben, aus ausreichender Nähe betrachtet, bestimmte Ursachen. Sogar ein Münzwurf kann aus den Startbedingungen und den Gesetzen der Physik vorhergesagt werden, und ein erfahrener Magier kann diese Gesetze jedes Mal …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.