Kann jemand eine Vorstellung davon geben, warum die höheren Momente einer Wahrscheinlichkeitsverteilung p(x)wie der dritte und vierte Moment Schiefe bzw. Kurtosis entsprechen? Warum führt die Abweichung vom Mittelwert zur 3. oder 4. Potenz zu einem Maß für Schiefe und Kurtosis? Gibt es eine Möglichkeit, dies mit der dritten oder vierten …
Für Nicht-Statistiker wie mich ist es sehr schwierig, die Idee der VIMetrik (Variation von Informationen) zu erfassen, selbst nachdem sie das relevante Papier von Marina Melia " Vergleich von Clustern - Eine informationsbasierte Distanz " (Journal of Multivariate Analysis, 2007) gelesen hat . Tatsächlich kenne ich viele Begriffe der Cluster …
Ich nehme derzeit am Kurs Eine Einführung in das Betriebsmanagement in Coursera.org teil. Irgendwann im Kurs begann der Professor, sich mit Variationen in der Operationszeit zu befassen. Die Messung, die er verwendet, ist der Variationskoeffizient , das Verhältnis zwischen der Standardabweichung und dem Mittelwert: cv=σμcv=σμc_v = \frac{\sigma}{\mu} Warum sollte diese …
In " Convolutional Deep Believe Networks für skalierbares unbeaufsichtigtes Lernen hierarchischer Repräsentationen " von Lee et. al. ( PDF ) Faltungs-DBNs werden vorgeschlagen. Auch das Verfahren wird zur Bildklassifizierung ausgewertet. Dies klingt logisch, da es natürliche lokale Bildmerkmale wie kleine Ecken und Kanten usw. gibt. In " Unüberwachtes Feature-Lernen für …
Das mgcvPaket für Rhat zwei Funktionen zum Anpassen von Tensorproduktwechselwirkungen: te()und ti(). Ich verstehe die grundlegende Arbeitsteilung zwischen den beiden (Anpassen einer nichtlinearen Wechselwirkung vs. Zerlegen dieser Wechselwirkung in Haupteffekte und eine Wechselwirkung). Was ich nicht verstehe, ist warum te(x1, x2)und ti(x1) + ti(x2) + ti(x1, x2)kann (leicht) unterschiedliche Ergebnisse …
Die Idee hinter Recurrent Neural Network (RNN) ist mir klar. Ich verstehe es folgendermaßen: Wir haben eine Folge von Beobachtungen ( Ö⃗ 1, o⃗ 2, … , O.⃗ no→1,o→2,…,o→n\vec o_1, \vec o_2, \dots, \vec o_n ) (oder mit anderen Worten multivariate Zeitreihen). Jede einzelne Beobachtung Ö⃗ icho→i\vec o_i ist ein …
Warum nehmen p-Werte und ks-Teststatistiken mit zunehmender Stichprobengröße ab? Nehmen Sie diesen Python-Code als Beispiel: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Die Ergebnisse sind: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) …
Die geschlossene Form von w in der linearen Regression kann wie folgt geschrieben werden w^=(XTX)−1XTyw^=(XTX)−1XTy\hat{w}=(X^TX)^{-1}X^Ty Wie können wir die Rolle von in dieser Gleichung intuitiv erklären ?(XTX)−1(XTX)−1(X^TX)^{-1}
Das weiß ich aus früheren Studien V.a r ( A + B ) = V.a r ( A ) + V.a r ( B ) + 2 C.o v ( A , B )Var(A+B)=Var(A)+Var(B)+2Cov(A,B)Var(A+B) = Var(A) + Var(B) + 2 Cov (A,B) Ich verstehe jedoch nicht, warum das so ist. …
Ich verstehe die Mechanik der Gewichte der Berechnung der Neigung unter Verwendung von Partituren : und dann Anwenden der Gewichte in einer Regressionsanalyse, zu der die Gewichte dienen "Kontrolle für" oder Trennung der Wirkungen von Kovariaten in den Populationen der Behandlungs- und Kontrollgruppe mit der Ergebnisvariablen.p(xi)p(xi)p(x_i)wi,j=treatwi,j=control=1p(xi)=11−p(xi)wi,j=treat=1p(xi)wi,j=control=11−p(xi)\begin{align} w_{i, j={\rm treat}} &= …
Ich habe versucht, eine numerische Schätzung der Kullback-Leibler-Divergenz für zwei Stichproben zu implementieren. Um die Implementierung zu debuggen, ziehen Sie die Stichproben aus zwei Normalverteilungen und N ( 1 , 2 ) .N.( 0 , 1 )N(0,1)\mathcal N (0,1)N.( 1 , 2 )N(1,2)\mathcal N (1,2) Für eine einfache Schätzung habe …
In einem Problemsatz habe ich dieses "Lemma" bewiesen, dessen Ergebnis für mich nicht intuitiv ist. ist eine Standardnormalverteilung in einem zensierten Modell.ZZZ Formal ist und . Dann Es besteht also eine Verbindung zwischen der Erwartungsformel über einer abgeschnittenen Domäne und der Dichte am Punkt der Kürzung . Könnte jemand die …
In dem Lehrbuch, das ich lese, verwenden sie positive Bestimmtheit (halbpositive Bestimmtheit), um zwei Kovarianzmatrizen zu vergleichen. Die Idee ist, dass wenn pd ist, kleiner als . Aber ich kämpfe darum, die Intuition dieser Beziehung zu bekommen?A−BA−BA-BBBBAAA Hier gibt es einen ähnlichen Thread: /math/239166/what-is-the-intuition-for-using-definiteness-to-compare-matrices Was ist die Intuition für die …
Der Standardfehler eines Anteils ist der größte, den er für ein gegebenes N haben kann, wenn der fragliche Anteil 0,5 beträgt, und wird kleiner, je weiter der Anteil von 0,5 entfernt ist. Ich kann sehen, warum dies so ist, wenn ich die Gleichung für den Standardfehler eines Anteils betrachte, aber …
Kann jemand bitte eine einfache (Laien-) Erklärung der Beziehung zwischen Pareto-Verteilungen und dem zentralen Grenzwertsatz geben (z. B. gilt sie? Warum / warum nicht?)? Ich versuche die folgende Aussage zu verstehen: "Der zentrale Grenzwertsatz funktioniert nicht mit jeder Verteilung. Dies liegt an einer hinterhältigen Tatsache: Stichprobenmittelwerte werden um den Mittelwert …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.