Als «self-study» getaggte Fragen

Eine Routineübung aus einem Lehrbuch, Kurs oder Test, die für eine Klasse oder ein Selbststudium verwendet wird. Die Richtlinie dieser Community besteht darin, "hilfreiche Hinweise" für solche Fragen zu geben, anstatt vollständige Antworten zu geben.

1
Ableiten des K-Mittelwert-Algorithmus als Grenze der Erwartungsmaximierung für Gaußsche Gemische
Christopher Bishop definiert den erwarteten Wert der Likelihood-Funktion für das vollständige Datenprotokoll (dh unter der Annahme, dass wir sowohl die beobachtbaren Daten X als auch die latenten Daten Z erhalten) wie folgt: EZ[lnp(X,Z∣μ,Σ,π)]=∑n=1N∑k=1Kγ(znk){lnπk+lnN(xn∣ μk,Σk)}(1)(1)EZ[ln⁡p(X,Z∣μ,Σ,π)]=∑n=1N∑k=1Kγ(znk){ln⁡πk+ln⁡N(xn∣ μk,Σk)} \mathbb{E}_\textbf{Z}[\ln p(\textbf{X},\textbf{Z} \mid \boldsymbol{\mu}, \boldsymbol{\Sigma}, \boldsymbol{\pi})] = \sum_{n=1}^N \sum_{k=1}^K \gamma(z_{nk})\{\ln \pi_k + \ln \mathcal{N}(\textbf{x}_n \mid …

1
K bedeutet als Grenzfall des EM-Algorithmus für Gaußsche Gemische mit Kovarianzen bis
Mein Ziel ist es zu sehen, dass der K-Mittelwert-Algorithmus tatsächlich ein Erwartungsmaximierungsalgorithmus für Gaußsche Gemische ist, bei dem alle Komponenten eine Kovarianz im Grenzwert als .σ2Iσ2I\sigma^2 Ilimσ→0limσ→0\lim_{\sigma \to 0} Angenommen , wir haben einen Datensatz {x1,…,xN}{x1,…,xN}\{x_1, \dots ,x_N\} von Beobachtungen von Zufallsvariablen XXX . Die Zielfunktion für M-Mittel ist gegeben …



1
wobei
Ich versuche, die Erwartung für beliebiges c &lt; 0 zu berechnen (für c &gt; 0 ist die Erwartung unendlich), wenn X logarithmisch verteilt ist, dh log ( X ) ∼ N ( μ , σ ) .E.[ ec X.]]E[ecX]E[e^{cX}]c &lt; 0c&lt;0c<0c &gt; 0c&gt;0c>0X.XXLog( X.) ∼ N.( μ , σ)log⁡(X)∼N(μ,σ)\log(X) \sim …

1
Wie finde ich eine Dichte aus einer charakteristischen Funktion?
Eine Verteilung hat die charakteristische Funktion ϕ(t)=(1−t2/2)exp(−t2/4), −∞&lt;t&lt;∞ϕ(t)=(1−t2/2)exp⁡(−t2/4), −∞&lt;t&lt;∞\phi(t) = (1-t^2/2)\exp(-t^2/4),\ -\infty \lt t \lt \infty Zeigen Sie, dass die Verteilung absolut stetig ist, und schreiben Sie die Dichtefunktion der Verteilung. Versuch: ∫∞−∞|(1−t2/2)exp(−t2/4)|dt=(−2/t)(1−t2/2)exp(−t2/4)−2exp(−t2/ 4) |0- ∞∫−∞∞|(1−t2/2)exp⁡(−t2/4)|dt=(−2/t)(1−t2/2)exp⁡(−t2/4)−2exp⁡(−t2/4)|−∞0\int_{-\infty}^{\infty}|(1-t^2/2)\exp(-t^2/4)|dt =(-2/t)(1-t^2/2)\exp(-t^2/4)-2\exp(-t^2/4)|_{-\infty}^{0} Ähnliches Ergebnis für da t quadratisch ist.[ 0 , ∞ ][0,∞][0,\infty]ttt Ich bin …

2
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


3
Zufälliger Spaziergang: Könige auf einem Schachbrett
Ich habe eine Frage zum zufälligen Gang zweier Könige in einem 3 × 3-Schachbrett. Jeder König bewegt sich zufällig mit gleicher Wahrscheinlichkeit auf diesem Schachbrett - vertikal, horizontal und diagonal. Die beiden Könige bewegen sich unabhängig voneinander im selben Schachbrett. Beide beginnen auf demselben Feld und bewegen sich dann unabhängig …

2
Likelihood Ratio für die Exponentialverteilung mit zwei Stichproben
Sei und zwei unabhängige Zufallsvariablen mit entsprechenden PDFs:XXXYYY f(x;θi)={1θie−x/θi0&lt;x&lt;∞,0&lt;θi&lt;∞0elsewheref(x;θi)={1θie−x/θi0&lt;x&lt;∞,0&lt;θi&lt;∞0elsewheref \left(x;\theta_i \right) =\begin{cases} \frac{1}{\theta_i} e^{-x/ {\theta_i}} \quad 0<x<\infty, 0<\theta_i< \infty \\ 0 \quad \text{elsewhere} \end{cases} für . Aus diesen Verteilungen werden zwei unabhängige Proben gezogen, um gegen der Größen und zu testen . Ich muss zeigen, dass LRT als Funktion einer …


2
Wenn n zunimmt, steigt der t-Wert in einem Hypothesentest an, aber die t-Tabelle ist genau das Gegenteil. Warum?
Die Formel für in einem Hypothesentest lautet: t = ˉ X - μtttt = X.¯- μσ^/ n- -- -√.t=X¯−μσ^/n. t=\frac{\bar{X}-\mu}{\hat \sigma/\sqrt{n}}. Wenn zunimmt, steigt der Wert gemäß der obigen Formel an. Aber warum nimmt der kritische Wert in der Tabelle ab, wenn (was eine Funktion von ) zunimmt?t t t …

2
Annäherung der relativen Mengen an Münzen in Kanada
Wäre es möglich, die relativen Mengen an im Umlauf befindlichen Loonies , Twoonies , Vierteln, Groschen, Nickeln (und möglicherweise dem abgekündigten Penny) genau zu approximieren , wenn man im täglichen Gebrauch einfach eine ausreichend große Münzprobe erhält? Im täglichen Gebrauch beziehe ich mich auf die Münzen, die Sie zurückbekommen, wenn …

2
Überprüfen, ob eine Dichte eine exponentielle Familie ist
Der Versuch zu beweisen, dass dies nicht zur exponentiellen Familie gehört. f(y|a)=4(y+a)(1+4a);0&lt;y&lt;1,a&gt;0f(y|a)=4(y+a)(1+4a);0&lt;y&lt;1,a&gt;0f(y|a)=4\frac{(y+a)}{(1+4a)} ; 0 < y < 1 , a>0 Hier ist mein Ansatz: f(y|a)=4(y+a)e−log(1+4a)f(y|a)=4(y+a)e−log(1+4a)f(y|a) = 4(y+a)e^{-log(1+4a)} f(y|a)=(4y)(1+ay)e−log(1+4a)f(y|a)=(4y)(1+ay)e−log(1+4a)f(y|a) = (4y)(1+\frac{a}{y})e^{-log(1+4a)} Wenn man es mit der Standardform vergleicht, kann und die nur eine Funktion von , nicht als allein definiert werden, …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.