In der Literatur zum maschinellen Lernen wird häufig die Softmax-Funktion verwendet, um eine Wahrscheinlichkeitsverteilung darzustellen. Gibt es einen Grund dafür? Warum wird keine andere Funktion verwendet?
\newcommand{\P}{\mathbb{P}} Ich werfe einen fairen Würfel. Immer wenn ich eine 1, 2 oder 3 bekomme, schreibe ich eine '1' auf; wenn ich eine 4 bekomme, schreibe ich eine '2' auf; Immer wenn ich eine 5 oder eine 6 bekomme, schreibe ich eine '3' auf. Sei NNN die Gesamtzahl der Würfe, …
Sei eine Stichprobe von iid exponentiellen Zufallsvariablen mit dem Mittelwert β , und sei X ( 1 ) , … , X ( n ) die Ordnungsstatistik aus dieser Stichprobe. Sei ˉ X = 1X1,…,XnX1,…,XnX_1,\dots,X_nββ\betaX(1),…,X(n)X(1),…,X(n)X_{(1)},\dots,X_{(n)}.X¯=1n∑ni=1XiX¯=1n∑i=1nXi\bar X = \frac{1}{n}\sum_{i=1}^n X_i Definieren Sie die Abstände Es kann gezeigt werden,dass jedes W i …
x ( t )x(t)x(t) Einige haben bereits Snap, Crackle, Pop für Derivate bis zur siebten Ordnung vorgeschlagen. Momente, die von der mechanischen Physik und der Elastizitätstheorie inspiriert sind, sind auch in der Statistik wichtig. Siehe Was ist so ein "Moment" an "Momenten" einer Wahrscheinlichkeitsverteilung? für frühe Erwähnungen in K. Pearsons …
Ich habe ein ähnliches Problem wie die hier gestellte Frage: Wie misst man die Ungleichmäßigkeit einer Verteilung? Ich habe eine Reihe von Wahrscheinlichkeitsverteilungen über die Wochentage. Ich möchte messen, wie nahe jede Verteilung an (1 / 7,1 / 7, ..., 1/7) liegt. Im Moment verwende ich eine Antwort aus der …
In einer Binomialeinstellung ist die Zufallsvariable X, die die Anzahl der Erfolge angibt, binomial verteilt. Der Stichprobenanteil kann dann als X berechnet werden wobeinIhre Stichprobengröße ist. Mein Lehrbuch besagt dasX.nXn\frac{X}{n}nnn Dieser Anteil hat keine Binomialverteilung jedoch seit ist einfach eine skalierte Version einer binomial verteilten ZufallsvariablenX, sollte sie nicht auch …
Angesichts zweier kontinuierlicher Verteilungen und ist mir nicht klar, ob das Verhältnis der konvexen Dominanz zwischen ihnen:FXFX\mathcal{F}_XFYFY\mathcal{F}_Y (0)FX<cFY(0)FX<cFY(0)\quad \mathcal{F}_X <_c \mathcal{F}_Y impliziert, dass (1)F−1Y(q)≤F−1X(q),∀q∈[0.5,1](1)FY−1(q)≤FX−1(q),∀q∈[0.5,1](1)\quad F_Y^{-1}(q) \leq F_X^{-1}(q),\quad \forall q\in[0.5,1] gilt oder ob eine weitere Hypothese erforderlich ist, wenn gelten soll?(1)(1)(1) Definition der konvexen Dominanz. Wenn zwei kontinuierliche Verteilungen und erfüllen:FXFX\mathcal{F}_XFYFY\mathcal{F}_Y …
Stabile Verteilungen sind unter Windungen unveränderlich. Welche Unterfamilien der stabilen Verteilungen werden ebenfalls unter Multiplikation geschlossen? In dem Sinne, dass wenn und , dann die Produktwahrscheinlichkeitsdichtefunktion, (bis zu einer Normalisierungskonstante) auch zu ?FFFf∈Ff∈Ff\in Fg∈Fg∈Fg\in F f⋅gf⋅gf \cdot gFFF Hinweis: Ich habe den Inhalt dieser Frage erheblich geändert. Aber die Idee …
Sei eine beliebige Verteilung mit definiertem Mittelwert und Standardabweichung . Der zentrale Grenzwertsatz besagt, dass in der Verteilung zu einer Standardnormalverteilung konvergiert. Wenn wir durch die Stichprobenstandardabweichung ersetzen , gibt es einen Satz, der besagt, dass in der Verteilung zu einer t-Verteilung konvergiert? Da für großeXXXμμ\muσσ\sigman−−√X¯−μσnX¯−μσ \sqrt{n}\frac{\bar{X} - \mu}{\sigma} σσ\sigmaSSSn−−√X¯−μSnX¯−μS …
Können wir nach dem Einbrennen die MCMC-Iterationen direkt zur Dichteschätzung verwenden, z. B. durch Zeichnen eines Histogramms oder zur Schätzung der Kerneldichte? Ich mache mir Sorgen, dass die MCMC-Iterationen nicht unbedingt unabhängig sind, obwohl sie höchstens identisch verteilt sind. Was ist, wenn wir die MCMC-Iterationen weiter ausdünnen? Ich mache mir …
Angenommen, ich habe das folgende Modell: Poisson(λ)∼{λ1λ2if t<τif t≥τPoisson(λ)∼{λ1if t<τλ2if t≥τ\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases} Und ich schließe die unten gezeigten Posterioren für und aus meinen Daten ab. Gibt es einen Bayes - Weg (oder Quantifizierung) …
Cross-Posting meiner Frage von Mathoverflow , um einige Statistiken spezifische Hilfe zu finden. Ich studiere einen physikalischen Prozess, der Daten generiert, die gut in zwei Dimensionen mit nicht negativen Werten projizieren. Jeder Prozess hat eine (projizierte) Spur vonxxx- -yyy Punkte - siehe Bild unten. Die Beispielspuren sind blau, ein problematischer …
Ich habe die Diskussion in Hacker News über die Verwendung der Standardabweichung im Gegensatz zu anderen Metriken wie der mittleren absoluten Abweichung gelesen . Wenn wir also dem Prinzip der maximalen Entropie folgen würden, mit welcher Art von Verteilung würden wir arbeiten, wenn wir nur den Mittelwert der Verteilung und …
Als einfaches Beispiel wird angenommen, dass es zwei lineare Regressionsmodelle gibt Modell 1 hat drei Prädiktoren x1a, x2bundx2c Modell 2 hat drei Prädiktoren aus Modell 1 und zwei zusätzliche Prädiktoren x2aundx2b Es gibt eine Populationsregressionsgleichung, bei der die erklärte Populationsvarianz für Modell 1 für Modell 2 . Die durch Modell …
Ich arbeite an einem Datensatz. Nachdem ich einige Modellidentifikationstechniken angewendet hatte, kam ich mit einem ARIMA (0,2,1) -Modell heraus. Ich habe die detectIOFunktion im Paket TSAin R verwendet, um bei der 48. Beobachtung meines ursprünglichen Datensatzes einen innovativen Ausreißer (IO) zu erkennen . Wie kann ich diesen Ausreißer in mein …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.