Sind die Begriffe Wahrscheinlichkeitsdichtefunktion und Wahrscheinlichkeitsverteilung (oder nur „Verteilung“) austauschbar?


8

Sind die Begriffe Wahrscheinlichkeitsdichtefunktion und Wahrscheinlichkeitsverteilung (oder nur "Verteilung") austauschbar, wie der Titel schon sagt? Wenn nicht, was ist der Unterschied?


2
Von den beiden denke ich tatsächlich, dass dies in vielerlei Hinsicht die besser gestellte Frage ist. Aber als letzteres von beiden sollte es wahrscheinlich geschlossen werden.
Silverfish

@Silverfish Diese Frage ist nicht nur besser gestellt als die andere, sie stellt meiner Meinung nach auch etwas anderes. In der Tat beantwortet die (einzige und akzeptierte) Antwort auf die andere Frage diese Frage überhaupt nicht, außer vielleicht im allerletzten Satz darin. Ich stimme dafür, es wieder zu öffnen; Vielleicht kannst du dich mir anschließen. Ich werde gestehen, dass ich ein Hintergedanken habe. Als Duplikate geschlossene Fragen werden von den meisten Menschen selten gesehen, und ich möchte meine Zeit nicht damit verschwendet haben, hier eine Antwort zu schreiben. Außerdem ist es eine Schande, den Menschen das Vergnügen zu nehmen, meine polemische Antwort herabzustimmen.
Dilip Sarwate

@Dilip Wenn die Threads wirklich Duplikate wären, würden wir sie zusammenführen, was dazu führen würde, dass Ihr Beitrag Teil des ursprünglichen Threads wird. In diesem Fall stimme ich Ihrer Behauptung jedoch zu, dass sich die Frage ausreichend unterscheidet, um ein erneutes Öffnen dieses Threads zu rechtfertigen.
whuber

@Dilip Wenn dies geschlossen geblieben wäre, besteht ein Ansatz zur Erhöhung der Sichtbarkeit verwandter, aber nicht identischer Antworten darin, über einen Kommentar in der Frage, die als Duplikat von geschlossen werden würde, hierher zurückzukehren.
Glen_b -State Monica

Kann jemand bitte hier einen Link zum früher vorgeschlagenen Dup posten?
kjetil b halvorsen

Antworten:


5

Der Ausdruck Wahrscheinlichkeitsdichtefunktion (pdf) bedeutet eine bestimmte Sache: eine Funktion für eine bestimmte Zufallsvariable X (dafür gibt es diesen Index, um diese Funktion von den pdfs anderer Zufallsvariablen zu unterscheiden) mit der Eigenschaft dass für alle reellen Zahlen a und b so, dass a < b , P { a < X b } = b a f X ( u )fX.()X.einbein<b Die verschiedenen Integrale sollen daran erinnern, dass es überhaupt nicht darauf ankommt, welches Symbol wir alsArgument für f X ( ) verwenden, und dass diesnichtder Fall ist (wie es leider viel zu oft von denjenigen angenommen wird, die damit beginnen dieses Thema), dass das Argumentder Kleinbuchstabe seinmuss, der dem Großbuchstaben entspricht, der die Zufallsvariable bezeichnet. Wir bestehen auch darauf, dass - f X ( u )

P.{ein<X.b}}=einbfX.(u)du=einbfX.(v)dv=einbfX.(t)dt.
fX.() Wenn P { X = α } > 0 für eine reelle Zahl α ist , dann hat X kein PDF, außer für diejenigen, die Dirac-Deltas in ihre Wahrscheinlichkeitsrechnung einbeziehen.
- -fX.(u)du=1.
P.{X.=α}}>0αX.

F.X.()X.

F.X.(α)=P.{X.α}},- -<α<.
F.X.(α)=- -αfX.(u)du.

=======

Zwar gibt es eine sehr restriktive Definition der Ausdruck seine Wahrscheinlichkeitsverteilung , dass einige Leute darauf bestehen, umfasst die umgangssprachliche Verwendung des Begriffs im Großen und Ganzen der pdf und die CDF und die PMF (Wahrscheinlichkeitsmassenfunktion , die auch die ddf oder diskrete Dichtefunktion bezeichnet wird) und was auch immer wir sonst als Beschreibung des probabilistischen Verhaltens einer Zufallsvariablen aufnehmen möchten. Zum Beispiel die Phrase

X.(ein,b)

X.(ein,b) X.(b- -ein)- -1(ein,b)0X.(ein,b)X.(ein,b)

Betrachten Sie dieses Zitat aus einer kürzlich veröffentlichten Antwort von Moderator Glen_b als ein weiteres Beispiel für die umgangssprachliche Verwendung der Verteilung zur mittleren Dichte .

"Wenn Sie den Modus sagen , bedeutet dies, dass die Distribution nur eine hat."

Eine Dichte kann einen eindeutigen Modus besitzen, aber eine CDF kann keinen eindeutigen Modus haben (in den nicht erweiterten Realzahlen). Allerdings wird wahrscheinlich niemand, der dieses Zitat liest, glauben, dass Glen_b die CDF meinte, als er "Distribution" schrieb.


1
L.1

1
@whuber Danke, dass du die Frage und das Upvote wieder geöffnet hast. Ich habe die normalen Zufallsvariablen gelöscht und durch eine bessere Illustration ersetzt, warum "Verteilung" nicht immer CDF bedeutet, sondern ein Ersatz für Dichte oder PDF sein kann.
Dilip Sarwate

1
In der Bearbeitung machen Sie ein sehr gutes Argument für Ihre Interpretation der Umgangssprache.
whuber

2

In Bezug auf die allgemeine Verwendung sollten Sie die in R verwendete Terminologie analysieren. Auf der Hilfeseite "Distribution {stats}" wird Folgendes beschrieben:

Dichte, kumulative Verteilungsfunktion, Quantilfunktion und Zufallsvariablenerzeugung für viele Standardwahrscheinlichkeitsverteilungen sind im Statistikpaket verfügbar.

Für jede der integrierten in Distributionen, es (nach den individuellen Hilfeseite) der „Dichte“ (zB bietet dnormfür Normal, dbinomfür Binomial) und die „Verteilungsfunktion“ (zB pnorm, pbinom, die „kumulative Verteilungsfunktion“ aufgerufen die Hauptverteilungsseite, wie oben angegeben).

Man könnte also interpretieren, dass "Wahrscheinlichkeitsverteilung" eine Verteilungsfamilie beschreibt (vielleicht ein Mitglied davon), "Dichte" für diskrete Verteilungen wie das Binom verwendet werden kann und der Ausdruck "Verteilungsfunktion" gegenüber "Verteilung" bevorzugt werden kann, wenn die Die kumulative Verteilungsfunktion ist beabsichtigt.

Alternativ könnte man argumentieren, dass die allgemeine Verwendung selbst unter erfahrenen Personen aus Gründen der Klarheit häufig vom Kontext abhängt.


0

Nein.

  1. "Wahrscheinlichkeitsdichtefunktion" wird nur für kontinuierliche Verteilungen verwendet. Eine diskrete Verteilung kann kein PDF haben (obwohl sie mit einem PDF angenähert werden kann). "Wahrscheinlichkeitsverteilung" wird häufig für diskrete Verteilungen verwendet, z. B. die Binomialverteilung.

  2. "Wahrscheinlichkeitsverteilung" hat eine Bedeutung sowohl für diskrete als auch für kontinuierliche Verteilungen, aber eine Wahrscheinlichkeitsverteilung ist nur für diskrete Verteilungen direkt anwendbar. Wenn das Wort mit kontinuierlichen Verteilungen verwendet wird, bezieht es sich auf ein zugrunde liegendes mathematisches Konstrukt wie die Normalverteilung, das für die meisten Zwecke in einer Funktion, typischerweise einer Wahrscheinlichkeitsdichtefunktion oder einer kumulativen Dichtefunktion, instanziiert werden muss, bevor es angewendet werden kann.


1
"'Wahrscheinlichkeitsverteilung' wird normalerweise für die diskrete Verteilung verwendet und ist nur für diese gut definiert." Meinen Sie, dass z. B. eine Normalverteilung keine Wahrscheinlichkeitsverteilung ist?
Juho Kokkala

@ Kokkala: Wenn ich das so gemeint hätte, hätte ich einfach gesagt "Die Wahrscheinlichkeitsverteilung sollte nur für diskrete Verteilungen verwendet werden." Diese zusätzlichen Wörter sollten Fälle berücksichtigen, in denen Menschen beispielsweise eine Normalverteilung als Wahrscheinlichkeitsverteilung bezeichnen. Aber Sie sprechen einen guten Punkt an: In kontinuierlichen Domänen wird immer noch "Wahrscheinlichkeitsverteilung" verwendet, aber um eine Wahrscheinlichkeitsverteilung anzuwenden, müssen wir eine spezifischere Instanziierung davon verwenden, wie z. B. ein PDF oder ein PDF. Also werde ich meine Antwort ändern, wenn ich kann.
Phil Goetz

1
X.xPr(X.x).

1
Die Mode ändert sich dabei. Die Ausdruckswahrscheinlichkeits- Massenfunktion wurde eingeführt, um den diskreten Fall vollständig zu unterscheiden, aber umgekehrt erklären viele Autoren, dass Dichte eine Dichte sein kann, die als Zählmaß definiert wird. Es ist alles eine Frage der zugrunde liegenden Maßnahme. Also nein; Kompetente Autoren können über Dichtefunktionen schreiben und haben eine breite Definition im Auge, nicht nur die Anwendbarkeit auf kontinuierliche Variablen. Der Zwischenwahrscheinlichkeitstext von Peter Whittle ist ein typisches Beispiel.
Nick Cox
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.