Viele PDFs reichen von minus bis positiv unendlich, aber einige Mittel sind definiert und andere nicht. Welches gemeinsame Merkmal macht einige berechenbar?
Viele PDFs reichen von minus bis positiv unendlich, aber einige Mittel sind definiert und andere nicht. Welches gemeinsame Merkmal macht einige berechenbar?
Antworten:
Der Mittelwert einer Verteilung wird als Integral definiert (ich schreibe ihn wie für eine kontinuierliche Verteilung - etwa als Riemann-Integral -, aber das Problem ist allgemeiner: Wir können uns mit Stieltjes- oder Lebesgue-Integration befassen diese richtig und auf einmal):
Aber was heißt das? Es ist effektiv eine Abkürzung für
oder
(obwohl du es überall brechen könntest, nicht nur bei 0)
Das Problem tritt auf, wenn die Grenzen dieser Integrale nicht endlich sind.
Betrachten Sie beispielsweise die Standard-Cauchy-Dichte, die proportional zu ... beachte das
lassen , so d u = 2 x
das ist nicht endlich. Die Grenze in der unteren Hälfte ist ebenfalls nicht endlich; die erwartung ist dabei undefiniert.
Oder wenn wir als Zufallsvariable den absoluten Wert eines Standard-Cauchy hätten, wäre seine gesamte Erwartung proportional zu dieser Grenze, die wir gerade betrachtet haben (dh ).
Andererseits setzen sich einige andere Dichten "bis unendlich" fort, aber ihr Integral hat eine Grenze.
Die anderen Antworten sind gut, aber vielleicht nicht jeder überzeugen, vor allem Menschen , die einen Blick auf die nehmen Cauchy - Verteilung (mit ) und sagen , dass es immer noch intuitiv klar ist , dass der Mittelwert sollte Null sein.
Der Grund, warum die intuitive Antwort aus mathematischer Sicht nicht korrekt ist, liegt im Riemannschen Umordnungssatz (Video) .
Wenn Sie sich einen Cauchy ansehen und sagen, dass der Mittelwert "sollte Null sein", bedeutet dies, dass Sie das "Zentrum" bei Null aufteilen und dann die Momente des Gleichgewichts zweier Größen beanspruchen. Oder mit anderen Worten, Sie machen implizit eine unendliche Summe mit "der Hälfte" der positiven Terme (den Momenten an jedem Punkt rechts) und "der Hälfte" der negativen Terme (den Momenten an jedem Punkt links) und behaupten dies summiert sich zu Null. (Für technisch Interessierte: )
Der Riemannsche Umordnungssatz besagt, dass diese Art von unendlicher Summe (eine mit sowohl positiven als auch negativen Begriffen) nur dann konsistent ist, wenn die beiden Reihen (nur positive und nur negative Begriffe) unabhängig voneinander konvergent sind. Wenn beide Seiten (positiv und negativ) für sich divergieren, können Sie eine Summierungsreihenfolge der Begriffe erstellen, die sich zu einer beliebigen Zahl summiert . (Video oben, ab 6:50 Uhr)
Also, ja, wenn Sie die Summierung auf ausgeglichene Weise von 0 bis 0 ausführen, werden die ersten Momente der Cauchy-Verteilung aufgehoben. Die (Standard-) Definition des Mittelwerts erzwingt diese Reihenfolge der Summierung jedoch nicht. Sie sollten in der Lage sein, die Momente in beliebiger Reihenfolge zu summieren und sie gleichermaßen gültig zu haben. Daher ist der Mittelwert der Cauchy-Verteilung undefiniert - indem Sie die Summe der Momente mit Bedacht auswählen, können Sie sie praktisch zu jedem Zeitpunkt "ausbalancieren" (oder nicht).
So um den Mittelwert einer Verteilung zu machen definiert, die beiden Moment Integrale müssen jeweils unabhängig konvergent (finite) um den Mittelwert vorgeschlagen (was, wenn Sie die Mathematik zu tun, ist wirklich nur eine andere Art zu sagen , dass die volle Integral ( ) muss konvergent sein). Wenn die Schwänze "fett" genug sind, um den Moment für eine Seite unendlich zu machen, sind Sie fertig. Sie können es nicht mit einem unendlichen Moment auf der anderen Seite ausgleichen.
Ich sollte erwähnen, dass das "kontraintuitive" Verhalten von Dingen wie der Cauchy-Verteilung ausschließlich auf Probleme zurückzuführen ist, wenn man über Unendlichkeit nachdenkt. Nehmen Sie die Cauchy-Verteilung und hacken Sie die Schwänze ab - sogar beliebig weit heraus, wie bei plus / minus der xkcd-Zahl - und (einmal normalisiert) erhalten Sie plötzlich etwas, das sich gut benimmt und einen definierten Mittelwert hat. Es sind nicht die fetten Schwänze an sich, die ein Problem darstellen, sondern wie sich diese Schwänze verhalten, wenn Sie sich der Unendlichkeit nähern.
General Abrial und Glen_b hatten perfekte Antworten. Ich möchte nur eine kleine Demo hinzufügen, um Ihnen zu zeigen, dass der Mittelwert der Cauchy-Verteilung nicht existiert / nicht konvergiert.
Im folgenden Experiment werden Sie feststellen, dass die Zahlen von Experiment zu Experiment sehr unterschiedlich sind, selbst wenn Sie eine große Stichprobe erhalten und den empirischen Mittelwert aus der Stichprobe berechnen.
set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))
Sie können feststellen, dass wir Experimente haben und in jedem Experiment 1 × 10 5 Punkte aus zwei Verteilungen abtasten. Bei einer so großen Stichprobengröße sollte der empirische Mittelwert über verschiedene Experimente hinweg ziemlich nahe am wahren Mittelwert liegen. Die Ergebnisse zeigen, dass die Cauchy-Verteilung keinen konvergierenden Mittelwert aufweist, die Normalverteilung jedoch.
BEARBEITEN:
Wie im Chat unter @ mark999 erwähnt, sollten wir argumentieren, dass die beiden im Experiment verwendeten Verteilungen eine ähnliche "Varianz" aufweisen (der Grund, warum ich Zitate verwende, ist, dass die Varianz der Cauchy-Verteilung ebenfalls undefiniert ist). Hier ist die Begründung: Ihre PDF sind ähnlich.
curve(dnorm, -8,8)
curve(dcauchy, -8,8)
Nach Definition des Lebesgue-Stieltjes-Integrals liegt der Mittelwert vor, wenn:
https://en.wikipedia.org/wiki/Moment_(mathematics)#Significance_of_the_moments
ist der Mittelwert der Verteilung auf dem Kreis . Aber das Mittel der Gleichverteilung auf der entsprechenden Vereinigung von zwei disjunkten Intervallen von jeweils Länge ist Null.
Da die Verteilung auf dem Kreis rotationssymmetrisch ist, kann es keinen Mittelwert, Median oder Modus auf dem Kreis geben. Ebenso können höhere Momente wie die Varianz keinen Sinn ergeben. Diese Verteilung ergibt sich natürlich in vielen Zusammenhängen. Zum Beispiel beinhaltet mein aktuelles Projekt Mikroskopbilder von Krebsgewebe. Die sehr zahlreichen Objekte im Bild sind nicht symmetrisch und jeder kann eine "Richtung" zugeordnet werden. Die offensichtliche Nullhypothese ist, dass diese Richtungen gleichmäßig verteilt sind.
Um die Einfachheit zu verschleiern, lassen Sie sei der Standardeinheitskreis und lasse . Wir definieren als Funktion von durch stereographische Projektion des Kreises aus auf die -Achse. Die Formel lautet. Differenzieren finden wir. Die infinitesimale Wahrscheinlichkeit ist daher, die übliche Form der Cauchy-Verteilung, und "Hey, presto!", wird die Einfachheit zu einem Kopfschmerz, der eine Behandlung durch die Feinheiten der Integrationstheorie erfordert.
Im Wir können die Abwesenheit von ignorieren (mit anderen Worten, wieder einsetzen ) für alle Überlegungen wie Moment mittlerer oder höherer Ordnung, da die Wahrscheinlichkeit von (sein Maß) ist Null. Das Nichtvorhandensein von Mittelwerten und höheren Momenten überträgt sich also auf die reale Linie. Es gibt jedoch jetzt einen besonderen Punkt, nämlich, die Karten zu unter stereographischer Projektion und dies wird der Median und Modus der Cauchy-Verteilung.