Die Normal- oder Gaußsche Verteilung hat eine Dichtefunktion, die eine symmetrische glockenförmige Kurve ist. Es ist eine der wichtigsten Verteilungen in der Statistik. Verwenden Sie das Tag [Normalität], um nach dem Testen der Normalität zu fragen.
Auf der Wikipedia-Seite über naive Bayes-Klassifikatoren gibt es diese Zeile: p ( h e i g h t | m eine l e ) = 1,5789p(heichGht|meinle)=1,5789p(\mathrm{height}|\mathrm{male}) = 1.5789 (Eine Wahrscheinlichkeitsverteilung über 1 ist in Ordnung. Es ist die Fläche unter der Glockenkurve, die gleich 1 ist.) Wie kann ein Wert …
Ich studiere Mustererkennung und Statistik und fast jedes Buch, das ich zu dem Thema aufschlage, stoße ich auf das Konzept der Mahalanobis-Distanz . Die Bücher geben eine Art intuitive Erklärungen, aber sie sind immer noch nicht gut genug, um wirklich zu verstehen, was los ist. Wenn mich jemand fragen würde: …
Wir haben einen multivariaten normalen Vektor . Partitionieren Sie und in Y∼N(μ,Σ)Y∼N(μ,Σ){\boldsymbol Y} \sim \mathcal{N}(\boldsymbol\mu, \Sigma)μμ\boldsymbol\muYY{\boldsymbol Y}μ=[μ1μ2]μ=[μ1μ2]\boldsymbol\mu = \begin{bmatrix} \boldsymbol\mu_1 \\ \boldsymbol\mu_2 \end{bmatrix} Y=[y1y2]Y=[y1y2]{\boldsymbol Y}=\begin{bmatrix}{\boldsymbol y}_1 \\ {\boldsymbol y}_2 \end{bmatrix} mit einer ähnlichen Partition von in Dann , die bedingte Verteilung der ersten Partition bei der zweiten, ist mit mittlerer …
Jemand hat mir diese Frage in einem Vorstellungsgespräch gestellt und ich habe geantwortet, dass ihre gemeinsame Verteilung immer Gaußsch ist. Ich dachte, dass ich immer einen bivariaten Gaußschen mit ihren Mitteln und Varianz und Kovarianzen schreiben kann. Ich frage mich, ob es einen Fall geben kann, bei dem die gemeinsame …
Ich muss die KL-Divergenz zwischen zwei Gaußschen bestimmen. Ich vergleiche meine Ergebnisse mit diesen , aber ich kann ihr Ergebnis nicht reproduzieren. Mein Ergebnis ist offensichtlich falsch, weil die KL für KL nicht 0 ist (p, p). Ich frage mich, wo ich einen Fehler mache und ob jemand ihn erkennen …
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
Vor langer Zeit habe ich gelernt, dass eine normale Verteilung notwendig ist, um einen T-Test mit zwei Stichproben durchzuführen. Heute erzählte mir eine Kollegin, dass für N> 50 keine Normalverteilung notwendig sei. Ist das wahr? Wenn ja, liegt das am zentralen Grenzwertsatz?
Ich bin dabei, die normale Standardtabelle in meiner Einführungsstatistikklasse einzuführen, und das hat mich gefragt: Wer hat die erste normale Standardtabelle erstellt? Wie haben sie es gemacht, bevor Computer kamen? Ich schaudere, wenn ich an jemanden denke, der tausend Riemann-Summen von Hand berechnet.
Wenn ich den Median einer ausreichend großen Anzahl von Beobachtungen aus derselben Verteilung berechne, gibt der zentrale Grenzwertsatz dann an, dass die Verteilung der Mediane einer Normalverteilung nahekommt? Ich verstehe, dass dies mit den Mitteln einer großen Anzahl von Proben zutrifft, aber gilt dies auch für Mediane? Wenn nicht, wie …
Eine standardisierte Gaußsche Verteilung auf kann durch explizite Angabe der Dichte definiert werden: 1RR\mathbb{R}12π−−√e−x2/212πe−x2/2 \frac{1}{\sqrt{2\pi}}e^{-x^2/2} oder seine charakteristische Funktion. Wie in dieser Frage erwähnt, ist es auch die einzige Verteilung, für die der Stichprobenmittelwert und die Varianz unabhängig sind. Welche andere überraschende alternative Charakterisierung von Gaußschen Maßen kennen Sie? Ich …
Ich habe dies aufgezeichnet, nachdem ich einen Shapiro-Wilk-Normalitätstest durchgeführt habe. Der Test hat gezeigt, dass es wahrscheinlich ist, dass die Bevölkerung normal verteilt ist. Wie kann man dieses "Verhalten" auf dieser Handlung sehen? AKTUALISIEREN Ein einfaches Histogramm der Daten: AKTUALISIEREN Der Shapiro-Wilk-Test sagt:
Angenommen, . Dann ist die bedingte Verteilung von unter der Voraussetzung , dass multivariate Normalverteilung mit dem Mittelwert:X∼N2(μ,Σ)X∼N2(μ,Σ)\mathbf{X} \sim N_{2}(\mathbf{\mu}, \mathbf{\Sigma})X1X1X_1X2=x2X2=x2X_2 = x_2 E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2)E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2) E[P(X_1 | X_2 = x_2)] = \mu_1+\frac{\sigma_{12}}{\sigma_{22}}(x_2-\mu_2) und Varianz:Var[P(X1|X2=x2)]=σ11−σ212σ22Var[P(X1|X2=x2)]=σ11−σ122σ22{\rm Var}[P(X_1 | X_2 = x_2)] = \sigma_{11}-\frac{\sigma_{12}^{2}}{\sigma_{22}} Es ist sinnvoll, dass die Varianz abnimmt, da wir mehr …
Ich wunderte mich, zwei Normalverteilungen mit undσ1, μ 1σ1, μ1\sigma_1,\ \mu_1σ2, μ2σ2, μ2\sigma_2, \ \mu_2 Wie kann ich den Prozentsatz überlappender Bereiche zweier Verteilungen berechnen? Ich nehme an, dieses Problem hat einen bestimmten Namen. Kennen Sie einen bestimmten Namen, der dieses Problem beschreibt? Ist Ihnen eine Implementierung davon bekannt (z. …
Ich habe Probleme, die KL-Divergenzformel unter der Annahme von zwei multivariaten Normalverteilungen abzuleiten. Ich habe den univariaten Fall ziemlich leicht gemacht. Es ist jedoch eine Weile her, dass ich Mathe-Statistiken erstellt habe, und daher habe ich einige Probleme, diese auf den multivariaten Fall auszudehnen. Ich bin mir sicher, ich vermisse …
Insbesondere möchte ich wissen, ob es einen Unterschied zwischen lm(y ~ x1 + x2)und gibt glm(y ~ x1 + x2, family=gaussian). Ich denke, dass dieser spezielle Fall von glm gleich lm ist. Liege ich falsch?
Ich verwende in meinem Buch hauptsächlich "Gaußsche Verteilung", aber jemand hat mir nur vorgeschlagen, auf "normale Verteilung" zu wechseln. Besteht ein Konsens darüber, welcher Begriff für Anfänger verwendet werden soll? Natürlich sind die beiden Begriffe Synonyme , daher handelt es sich nicht um eine inhaltliche Frage, sondern lediglich darum, welcher …
Angenommen, Sie erhalten zwei Objekte, deren genaue Position unbekannt ist, die jedoch gemäß Normalverteilungen mit bekannten Parametern verteilt sind (z. B. a∼N(m,s)ein∼N(m,s)a \sim N(m, s) und b∼N(v,t))b∼N(v,t))b \sim N(v, t)) . Wir können annehmen, dass dies beide bivariate Normalen sind, so dass die Positionen durch eine Verteilung über (x,y)(X,y)(x,y) Koordinaten …
Gibt es einen tiefen Unterschied zwischen einer Normal- und einer Gaußschen Verteilung? Ich habe viele Artikel gesehen, in denen sie unterschiedslos verwendet wurden, und ich bezeichne sie normalerweise auch als dasselbe. Mein PI hat mir kürzlich mitgeteilt, dass es sich bei einem Normalfall um den speziellen Fall des Gaußschen mit …
Angenommen, und Φ ( ⋅ )ϕ(⋅)ϕ(⋅)\phi(\cdot)Φ(⋅)Φ(⋅)\Phi(\cdot) sind Dichtefunktion und Verteilungsfunktion der Standardnormalverteilung. Wie kann man das Integral berechnen: ∫∞−∞Φ(w−ab)ϕ(w)dw∫-∞∞Φ(w-einb)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw
Ich habe mich eine Weile darüber gewundert. Ich finde es ein bisschen komisch, wie plötzlich es passiert. Warum brauchen wir eigentlich nur drei Uniformen, damit ZnZnZ_n so glatt wird? Und warum geschieht das Glätten so relativ schnell? Z2Z2Z_2 : Z3Z3Z_3 : (Bilder, die schamlos aus John D. Cooks Blog gestohlen …
In einer Normalverteilung hat die Regel 68-95-99.7 eine große Bedeutung für die Standardabweichung, aber was würde die Standardabweichung in einer nicht normalen Verteilung bedeuten (multimodal oder schief)? Würden alle Datenwerte noch innerhalb von 3 Standardabweichungen liegen? Haben wir Regeln wie die 68-95-99.7 für nicht normale Distributionen?
Gibt es bekannte Formeln für die Ordnungsstatistik bestimmter Zufallsverteilungen? Insbesondere die Statistik erster und letzter Ordnung einer normalen Zufallsvariablen, aber auch eine allgemeinere Antwort wären wünschenswert. Bearbeiten: Um dies zu verdeutlichen, suche ich nach Näherungsformeln, die mehr oder weniger explizit ausgewertet werden können, nicht nach dem exakten ganzzahligen Ausdruck. Zum …
ich habe zwei Normalverteilungen A und B mit den Bedeutungen und und den Varianzen und . Ich möchte eine gewichtete Mischung dieser beiden Verteilungen mit den Gewichten und wobei und . Ich weiß, dass der Mittelwert dieser Mischung .μAμA\mu_AμBμB\mu_BσAσA\sigma_AσBσB\sigma_Bpppqqq0≤p≤10≤p≤10\le p \le 1q=1−pq=1−pq = 1-pμAB=(p×μA)+(q×μB)μAB=(p×μA)+(q×μB)\mu_{AB} = (p\times\mu_A) + (q\times\mu_B) Was wäre …
Dies ist wahrscheinlich eine Amateurfrage, aber ich bin daran interessiert, wie die Wissenschaftler auf die Form der Normalverteilungswahrscheinlichkeitsdichtefunktion gekommen sind. Was mich im Grunde stört, ist, dass es für jemanden vielleicht intuitiver ist, wenn die Wahrscheinlichkeitsfunktion normalverteilter Daten eher die Form eines gleichschenkligen Dreiecks als eine Glockenkurve hat, und wie …
Ich hatte noch nie einen Statistikkurs und hoffe, dass ich hier an der richtigen Stelle nachfragen kann. Angenommen, ich habe nur zwei Daten, die eine Normalverteilung beschreiben: den Mittelwert μμ\mu und die Varianz σ2σ2\sigma^2 . Ich möchte einen Computer verwenden, um zufällig eine Stichprobe aus dieser Distribution zu ziehen, sodass …
Angenommen, ich habe eine multivariate normale Dichte . Ich möchte die zweite (teilweise) Ableitung von . Ich bin mir nicht sicher, wie ich eine Ableitung einer Matrix nehmen soll.N(μ,Σ)N(μ,Σ)N(\mu, \Sigma)μμ\mu Wiki sagt, nimm das Derivat Element für Element in die Matrix. Ich arbeite mit der Laplace-Approximation Der Modus ist .Θ …
Dieses Problem scheint die ganze Zeit seinen hässlichen Kopf zu haben, und ich versuche, es für mein eigenes Verständnis von Statistik (und Vernunft!) Zu enthaupten. Die Annahmen allgemeiner linearer Modelle (t-Test, ANOVA, Regression usw.) beinhalten die "Annahme der Normalität", aber ich habe festgestellt, dass dies selten klar beschrieben wird. Ich …
Wikipedia sagt - In der Wahrscheinlichkeitstheorie legt der zentrale Grenzwertsatz (Central Limit Theorem, CLT) fest, dass in den meisten Situationen , wenn unabhängige Zufallsvariablen addiert werden, ihre ordnungsgemäß normalisierte Summe zu einer Normalverteilung tendiert (informell eine "Glockenkurve"), selbst wenn die ursprünglichen Variablen selbst keine sind normal verteilt... Wenn "in den …
Gemäß diesem sehr interessanten Artikel im Quanta Magazine: "Ein lang ersehnter Beweis, gefunden und fast verloren" - wurde bewiesen, dass ein gegebener Vektor eine multivariate Gaußsche Verteilung hat, und gegebenen Intervallen I 1 , ... , I n , die mittels der entsprechenden Komponenten zentriert um x , dannx =( …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.