Würde ein Bayesianer zugeben, dass es einen festen Parameterwert gibt?


39

In der Bayes'schen Datenanalyse werden Parameter als Zufallsvariablen behandelt. Dies ergibt sich aus der Bayes'schen subjektiven Konzeptualisierung der Wahrscheinlichkeit. Aber erkennen Bayesianer theoretisch an, dass es in der "realen Welt" einen echten festen Parameterwert gibt?

Die offensichtliche Antwort scheint "Ja" zu sein, denn dann wäre es fast unsinnig, den Parameter zu schätzen. Ein akademisches Zitat für diese Antwort wäre sehr dankbar.


2
Gib mir diesen Parameter und ich werde eine Verteilung dafür definieren. :-)
Anne van Rossum

Antworten:


42

IMHO "ja"! Hier ist eines meiner Lieblingszitate von Grönland (2006: 767):

Es wird oft (fälschlicherweise) gesagt, dass "Parameter vom Frequentisten als fest, aber vom Bayes'schen als zufällig behandelt werden". Für Frequentisten und Bayesianer kann der Wert eines Parameters von Anfang an festgelegt oder durch einen physikalisch zufälligen Mechanismus erzeugt worden sein. In beiden Fällen nehmen beide an, dass es einen festen Wert angenommen hat, den wir gerne wissen würden. Der Bayesianer verwendet formale Wahrscheinlichkeitsmodelle, um die persönliche Unsicherheit über diesen Wert auszudrücken. Die 'Zufälligkeit' in diesen Modellen repräsentiert die persönliche Unsicherheit über den Wert des Parameters; Es ist keine Eigenschaft des Parameters (obwohl wir hoffen sollten, dass es genau die Eigenschaften der Mechanismen widerspiegelt, die den Parameter erzeugt haben).

Greenland, S. (2006). Bayesianische Perspektiven für die epidemiologische Forschung: I. Grundlagen und grundlegende Methoden. International Journal of Epidemiology , 35 (3), 765–774.


2
Konnte man nicht behaupten, dass die (Position, Impuls) eines Teilchens ein "Parameter" ist, den wir schätzen könnten? Man könnte argumentieren, dass es keinen "festen" Wert für diesen Parameter gibt und dass wir ihn wirklich als eine Verteilung betrachten sollten. Unbekannte spezifisch als Verteilungen und nicht als feste Werte zu betrachten, scheint das zu sein, was die Natur in bestimmten Situationen tut. Ich denke nicht, dass diese Argumentation für einen Bayesianer in der Praxis sehr ansprechend ist, aber ich denke, um die Frage der OP vollständig zu beantworten, ist eine Diskussion über die Natur der Zufälligkeit erforderlich.
Kerl

3
Ich verstehe es nicht als „unangenehm“, eine Verteilung als Ziel der Folgerung zu betrachten. Tatsächlich ist die Indizierung von Dingen mit Parametern ohnehin optional. Beispielsweise kann man seine Unsicherheit mithilfe von Verteilungen über Funktionen direkt geltend machen (siehe Neal und Williams zu Gaußschen Prozessen). Und man muss keine bestimmte Sicht der 'Zufälligkeit' haben, um die Unsicherheit mit der Wahrscheinlichkeitsrechnung darzustellen. Inference basierend auf Abtasten (Theorie) wohl nicht eine solche Theorie brauchen, aber soweit ich sehen kann Bayesianismus ist nicht (oder zumindest muss nicht sein.)
conjugateprior

2
Ich stimme nicht zu, dass ein Bayesianer annimmt, dass ein Parameter einen festen Wert hat, und es ist nur seine persönliche Unsicherheit, die ihn antreibt, den Parameter als Verteilung und nicht als Punkt zu definieren. Ich habe versucht, das in meiner Antwort zu erweitern. Ihre persönliche / theoretische Unsicherheit ist Teil der Verteilung, aber es scheint mir, dass Ihr Modell im Wesentlichen einen Durchschnitt über Variablen bildet, die nicht im Modell enthalten sind, und eine Verteilung erstellt, selbst wenn Ihre persönlichen Prioritäten sehr genau sind.
Wayne

29

Die Bayes'sche Wahrscheinlichkeitsauffassung ist nicht unbedingt subjektiv (vgl. Jaynes). Der wichtige Unterschied besteht darin, dass der Bayesianer versucht, seinen Kenntnisstand über den Wert des Parameters zu ermitteln, indem er eine vorherige Verteilung auf ihren plausiblen Wert mit der Wahrscheinlichkeit kombiniert, mit der die in einigen Beobachtungen enthaltenen Informationen zusammengefasst werden. Daher würde ich als Bayesianer sagen, dass ich mit der Vorstellung zufrieden bin, dass der Parameter einen wahren Wert hat, der nicht genau bekannt ist, und dass der Zweck einer posterioren Verteilung darin besteht, zusammenzufassen, was ich über seine plausiblen Werte weiß. basierend auf meinen vorherigen Annahmen und den Beobachtungen.

Wenn ich jetzt ein Modell mache, ist das Modell nicht Realität. In einigen Fällen existiert der fragliche Parameter in der Realität (z. B. das Durchschnittsgewicht eines Wombats) und in einigen Fragen nicht (z. B. der wahre Wert eines Regressionsparameters) - das Regressionsmodell ist nur ein Modell des Ergebnisses von die physikalischen Gesetze, die das System steuern und die vom Regressionsmodell möglicherweise nicht vollständig erfasst werden. Zu sagen, dass es in der realen Welt einen echten festen Parameterwert gibt, ist nicht unbedingt wahr.

Auf der anderen Seite würde ich vorschlagen, dass die meisten Frequentisten sagen, dass es einen wahren Wert für die Statistik gibt, aber sie wissen auch nicht, was es ist, aber sie haben Schätzer dafür und Konfidenzintervalle für ihre Schätzungen, die (in gewissem Sinne) ) quantifiziert ihre Unsicherheit in Bezug auf die Plausibilität verschiedener Werte (aber die häufig vorkommende Auffassung einer Wahrscheinlichkeit hindert sie daran, dies als direkt auszudrücken).


Ich habe immer gedacht, dass "subjektive Wahrscheinlichkeiten" als subjektiv bezeichnet werden, weil sie sich eher auf eine Eigenschaft des Subjekts beziehen, das die Berechnung durchführt (dh auf ihr Wissen), als auf eine Eigenschaft der objektiven Realität (z. B. die Gewichtsverteilung eines nicht perfekt gerechten Würfels).
Nikie

1
@nikie es gibt Prinzipien wie MaxEnt und Transformationsgruppen, um Prioritäten objektiv zu definieren. In diesem Fall gibt die Berechnung die gleiche Antwort, unabhängig davon, wer oder was die Berechnung durchführt (ein Roboter würde zu der gleichen Schlussfolgerung kommen). Frequentistische Statistik ist auch nicht ohne Subjektivität, zum Beispiel wie man für Hypothesentests setzt, aber die Absicht bestand darin, die Subjektivität aus der Statistik im Sinne von "persönlicher Wahrscheinlichkeit / Überzeugung" und nicht "Plausibilitätsgrad" (IIRC) zu entfernen. . α
Dikran Beuteltier

Ich weiß, aber sie sind immer noch subjektive Wahrscheinlichkeiten, oder? Weil sie immer noch das Wissen des Subjekts über einige Parameter beschreiben (die für einen Frequentisten überhaupt keine Zufallsvariable wären)
Nikie

Es gibt nicht unbedingt ein Thema. Eine Reihe von Robotern oder Computern könnte alle die gleiche Berechnung durchführen und zu derselben Schlussfolgerung gelangen, egal ob sie einen frequentistischen oder einen objektivistischen Bayes'schen Ansatz verwenden. Es ist der Wissensstand, unabhängig von dem Subjekt, das die Berechnung durchführt, weshalb er eher objektiv als subjektiv ist.
Dikran Beuteltier

16

Zu Ihrer Hauptsache schreibt Gelman in Bayesian Data Analysis (3rd ed., 93) ebenfalls

Aus der Perspektive der Bayes'schen Datenanalyse können wir klassische Punktschätzungen oft als genaue oder ungefähre hintere Zusammenfassungen interpretieren, die auf einem impliziten Vollwahrscheinlichkeitsmodell basieren. Tatsächlich können wir an der Grenze des großen Stichprobenumfangs eine asymptotische Theorie verwenden, um eine theoretische Bayes'sche Rechtfertigung für die klassische Maximum-Likelihood-Inferenz zu konstruieren.

Vielleicht sollten also nicht die Bayesianer "zugeben", dass es in Wahrheit einzelne reale Parameterwerte gibt, sondern die Frequentisten, die sich an die Bayesianische Statistik wenden sollten, um ihre Schätzverfahren zu rechtfertigen! (Ich sage das mit fester Zunge auf der Wange.)

Pr(θ|y)

Die Vorstellung, dass es einzelne Parameter in der Natur oder in sozialen Systemen gibt, ist jedoch nur eine vereinfachende Annahme. Es mag einige aufwändige Prozesse geben, die zu beobachtbaren Ergebnissen führen, aber es ist unglaublich kompliziert, dieses System zu entdecken. Angenommen, es gibt einen einzigen festen Parameterwert, vereinfacht das Problem dramatisch. Ich denke, das bringt den Kern Ihrer Frage auf den Punkt: Die Bayesianer sollten nicht mehr zugeben müssen, dass sie diese Vereinfachung vorgenommen haben, als dies die Frequentisten tun sollten.


Würde es Ihnen etwas ausmachen, herauszufinden, warum Sie die Bayes'sche Folgerung ablehnen, die auf der subjektiven Wahrscheinlichkeit beruht? Die von mir gelesenen Einführungstexte (Kruschke, Lynch) scheinen es alle so zu gestalten. Ist es so, dass es nur teilweise subjektiv ist (vom Prior)?
ATJ

@ATJ Ich hoffe, dass dies meinen Standpunkt klarstellt. Es gibt andere Argumente, die man vorbringen könnte, aber der eigentliche Knackpunkt für mich war die implizite Annahme, dass Bayes'sche Statistiken in einer Weise subjektiv sind, wie es andere Paradigmen nicht tun. Ich würde zum Beispiel gegen die Charakterisierung in Bernd's Zitat argumentieren, weil es genauso "persönlich" erscheint, eine Methode der unverzerrten Punktschätzung gegenüber einem Rahmen der posterioren Variabilität zu bevorzugen.
Setzen Sie Monica am

@ATJ, Einführungstexte erzählen eine Geschichte, um Methoden zu motivieren. So etwas mag die Methoden ursprünglich motiviert haben. Dies bedeutet jedoch nicht, dass diese Geschichte großen Einfluss auf die Annahmen hat, die die Menschen bei der praktischen Anwendung dieser Methoden treffen. (Und die Geschichte mag unsinnig sein: Zum Beispiel der Gedanke, dass die Wahrscheinlichkeiten in der Statistik in Bezug auf die Häufigkeit so definiert werden können, wie einführende, häufig verwendete Texte manchmal sagen, dass sie keinen Sinn ergeben - die "15 Argumente" von Google Alan Hajek Das heißt nicht, dass die Frequentist-Statistik nicht funktioniert, sondern funktioniert.)
Mars

8

Glauben Sie, dass es einen einzigen "echten festen Parameter" gibt, der so etwas wie den Beitrag des Milchtrinkens zum Wachstum eines Kindes ausmacht? Oder für die Verringerung der Größe eines Tumors basierend auf der Menge an chemischem X, die Sie in den Körper eines Patienten injizieren? Wählen Sie ein Modell aus, mit dem Sie vertraut sind, und fragen Sie sich, ob Sie tatsächlich glauben, dass es für jeden Parameter einen wahren, universellen, präzisen und festen Wert gibt, auch theoretisch.

Ignorieren Sie Messfehler, schauen Sie sich einfach Ihr Modell an, als ob alle Messungen perfekt genau und unendlich genau wären. Glauben Sie, dass in Anbetracht Ihres Modells jeder Parameter realistisch einen bestimmten Punktwert hat?

Die Tatsache, dass Sie ein Modell haben, zeigt an, dass Sie einige Details auslassen. Ihr Modell weist eine gewisse Ungenauigkeit auf, da Sie den Durchschnitt über die Parameter / Variablen bilden, die Sie ausgelassen haben, um ein Modell zu erstellen - eine vereinfachte Darstellung der Realität. (So ​​wie Sie keine 1: 1-Karte des Planeten mit allen Details erstellen, sondern eine 1: 10000000-Karte oder eine solche Vereinfachung. Die Karte ist ein Modell.)

Da Sie den Durchschnitt über die ausgelassenen Variablen berechnen, handelt es sich bei den Parametern für die Variablen, die Sie in Ihr Modell aufnehmen, um Verteilungen und nicht um Punktwerte.

Das ist nur ein Teil der Bayes'schen Philosophie - ich ignoriere theoretische Unsicherheit, Messunsicherheit, Prioritäten usw. - aber es scheint mir, dass die Vorstellung, dass Ihre Parameter Verteilungen haben, intuitiv sinnvoll ist, genauso wie deskriptive Statistiken eine haben Verteilung.


6

Aber erkennen Bayesianer theoretisch an, dass es in der "realen Welt" einen echten festen Parameterwert gibt?

Meiner Meinung nach lautet die Antwort ja. Es gibt einen unbekannten Wert des Parameters und die vorherige Verteilung beschreibt unser Wissen / unsere Unsicherheit darüber. In der Bayes'schen mathematischen Modellierung wird als die Realisierung einer Zufallsvariablen nach der vorherigen Verteilung betrachtet.θ 0θ0θ0


2

Wenn wir den Bayesianismus mit einem deterministischen Universum verbinden (bevor Sie irgendetwas mit dem Wort "Quanten" sagen, scherzen Sie mich und erinnern Sie sich, dass dies nicht Physik.StackExchange ist), erhalten wir einige interessante Ergebnisse.

Ausdrücken unserer Annahmen:

  1. Wir haben einen Bayes-Agenten, der Teil eines deterministischen Universums ist und dieses beobachtet.
  2. Der Agent verfügt nur über begrenzte Rechenressourcen.

Das deterministische Universum kann eines sein, in dem Atome kleine Newtonsche Billardkugeln sind. Es kann völlig unquant sein. Sagen wir es ist.

Der Agent wirft jetzt eine faire Münze. Denken Sie eine Sekunde darüber nach, was eine gerechte Münze in einem deterministischen Universum ausmacht. Eine Münze mit einem Wahrscheinlichkeitsverhältnis von 50/50?

Aber es ist deterministisch! Mit genügend Rechenleistung können Sie genau berechnen, wie die Münze landen wird, indem Sie ein Modell einer Münze simulieren, die auf die gleiche Weise geworfen wird.

In einem deterministischen Universum wäre eine schöne Münze eine Metallscheibe mit einheitlicher Dichte. Keine Kraft zwingt es, mehr Zeit mit dem einen Gesicht nach unten als mit dem anderen zu verbringen (denken Sie darüber nach, wie gewichtet Würfel funktionieren).

Der Agent wirft also eine faire Münze. Der Agent ist jedoch nicht mächtig genug. Es hat nicht scharf genug Augen, um zu messen, wie sich die Münze dreht, wenn sie geworfen wird, es sieht aber eine Unschärfe.

Und so heißt es: "Diese Münze wird mit einer Wahrscheinlichkeit von 50% einen Kopf landen." Mangel an Informationen führt zu Wahrscheinlichkeiten.

Wir können uns den Phasenraum ansehen, in dem eine Münze geworfen wird. Ein großes mehrdimensionales Koordinatensystem mit Achsen für Wurfrichtung, Wurfkraft, Münzdrehzahl, Geschwindigkeit und Windrichtung und so weiter. Ein einzelner Punkt in diesem Bereich entspricht einem einzelnen möglichen Münzwurf.

Wenn wir den Agenten von früher bitten, das Koordinatensystem mit einem Graustufengradienten zu färben, der der Zuweisung der Wahrscheinlichkeit von Köpfen für jeden gegebenen Wurf durch den Agenten entspricht, färbt er allesamt in einem einheitlichen Grauton.

Wenn wir ihm nach und nach leistungsfähigere interne Computer geben, mit denen die Wahrscheinlichkeiten von Köpfen berechnet werden können, wird es in der Lage sein, immer mehr anspruchsvolle Farbtöne zu erzeugen. Wenn wir ihm endlich den leistungsstärksten internen Computer geben und ihn allwissend machen, wird er effektiv ein seltsames Schachbrett malen.

Faire Münzen bestehen nicht aus Wahrscheinlichkeiten, sie bestehen aus Metall. Wahrscheinlichkeiten existieren nur in Rechenstrukturen. Das sagt der Bayesianer.


-3

Es gibt unangemessene Prioritäten, zum Beispiel Jeffreys, die eine gewisse Beziehung zur Fishers Information Matrix haben. Dann ist es nicht subjektiv.


2
Könnten Sie näher erläutern, inwiefern Jeffreys Prior und seine Beziehung zur Fisher-Informationsmatrix bedeuten, dass die Bayes'sche Folgerung nicht subjektiv ist? Nach meinem Verständnis ist der Hauptgrund für die Verwendung von Jeffreys 'Prior darin zu sehen, dass er nicht mit alternativen Parametrisierungen des Modells übereinstimmt. Darüber hinaus kann in einer mehrdimensionalen Umgebung der Prior von Jeffreys sehr informativ werden, und die Ergebnisse sind umstritten (Gelman, BDA 3, S. 53). Untergräbt dies seine Objektivität?
Setzen Sie Monica am

@ user777, da es auf Parametern der vorliegenden Dichte basiert, ist es objektiv. Angenommen, ich multipliziere die Wahrscheinlichkeit mit 1. Habe ich dann ein Subjektiv vor der Wahrscheinlichkeit? Da die hintere Wahrscheinlichkeit mit der vorherigen x-Wahrscheinlichkeit zusammenhängt.
Analyst

Und Frequentisten müssen auch Axiom of The True Model aufrufen, wenn sie die Wahrscheinlichkeit nutzen möchten ... :)
Analyst
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.