Zeichnen einer „hinteren Mittelfläche“


8

Als Teil der Reproduktion eines Modells, das ich teilweise in dieser Frage zum Stapelüberlauf beschrieben habe, möchte ich eine grafische Darstellung einer posterioren Verteilung erhalten. Das (räumliche) Modell beschreibt den Verkaufspreis einiger Immobilien als Bernoulli-Verteilung, je nachdem, ob die Immobilie teuer (1) oder billig (0) ist. In Gleichungen:

p ilogit - 1 ( b 0 + b 1 LivingArea / 1000 + b 2 Alter + w ( s ) ) w ( s ) MVN ( 0 , Σ )

yiBernoulli(pi)
pichlogit- -1(b0+b1Wohnbereich/.1000+b2Alter+w(s))
w(s)MVN(0,Σ)

wobei das binäre Ergebnis 1 oder 0 ist, die Wahrscheinlichkeit ist, billig oder teuer zu sein, eine räumliche Zufallsvariable ist, wobei seine Position darstellt . All dies für jedes da der Datensatz 70 Eigenschaften enthält. ist eine Kovarianzmatrix, die auf der geografischen Position der Datenpunkte basiert. Wenn Sie neugierig auf dieses Modell sind, finden Sie den Datensatz hier . p i w ( s ) s i = { 1 , . . . , 70 } Σyichpichw(s)sich={1,...,70}}Σ

Das Diagramm, das ich erhalten möchte, ist das folgende Konturdiagramm:

Geben Sie hier die Bildbeschreibung ein

Die Figur wird als "Bilddiagramm der hinteren Mittelfläche des latenten Prozesses , binäres räumliches Modell" beschrieben. Das Buch sagt auch Folgendes:w(s)

Abbildung 5.8 zeigt das Bilddiagramm mit überlagerten Konturlinien für die hintere mittlere Oberfläche des latenten -Prozesses.w(s)

Der Datensatz enthält jedoch nur 70 Punktepaare. Ich nehme an, um ein Konturdiagramm zu erstellen, muss ich in 70 * 70 Punkten schätzen . Meine Frage lautet also: Wie produziere ich diese hintere mittlere Oberfläche? Bisher habe ich Stichproben von posterioren Verteilungen für alle beteiligten Parameter (unter Verwendung von PyMC) und ich weiß, dass ich an einem neuen Punkt unter Verwendung der posterioren prädiktiven Verteilung vorhersagen kann. Ich weiß jedoch nicht, wie ich Werte an einem neuen Punkt vorhersagen soll . Vielleicht irre ich mich und die Handlung wurde nicht durch Vorhersage, sondern durch Interpolation konstruiert.w(s)yw(s)s

UPDATE :

Erstens ist dies der Median der posterioren Verteilung von an jeder Stelle, an der es eine Eigenschaft gibt. Dies basiert auf dem MCMC-Trace für .w(s)w

Geben Sie hier die Bildbeschreibung ein

Und dies ist die Interpolation (mit einem Konturdiagramm) unter Verwendung einer radialen Basisfunktion:

Geben Sie hier die Bildbeschreibung ein

(Wenn Sie an dem Code interessiert sind, lassen Sie es mich wissen.)

Wie Sie sehen können, gibt es signifikante Unterschiede in den Darstellungen. Einige Fragen:

  1. Wie kann ich wissen, ob diese Unterschiede durch das Interpolationsverfahren erklärt werden?

  2. Vielleicht gibt es wichtige Variationen in der posterioren Verteilung von , die ich berechnet und die im Buch gezeigt habe. Wie viel Variation ist zwischen MCMC-Simulationen akzeptabel? Sogar meine eigenen Parameter ändern sich je nach verwendetem Sampling etwas (Metropolis, Metropolis Adaptive.)w(s)

  3. Gibt es ein Bayes'sches Verfahren, um Punkte vorherzusagen , um ein Konturdiagramm zu erzeugen, wie ich es mit der radialen Basisfunktion getan habe?w(s)


1
Interpolation ist Vorhersage! (Da ein Prozess ist, bedeutet das Ermitteln eines Werts von an einer nicht beobachteten Stelle das Erraten des Werts einer Zufallsvariablen. Vorhersage bedeutet per Definition das Erraten des Werts einer Zufallsvariablen.)www
whuber

Sicher. Ich wollte Interpolation sagen, im Gegensatz zur Bayes'schen Vorhersage. Übrigens habe ich versucht, mit dem nächsten Nachbarn zu interpolieren, und ich habe schreckliche Ergebnisse erzielt.
Robert Smith

Sie sollten wahrscheinlich schreckliche Ergebnisse erzielen, wenn Sie die Rohdaten in einem Interpolationsprogramm verwenden, da dadurch ein anderes Problem gelöst wurde. Sie wollen ein Konturdiagramm nur der Begriff aber das Programm war (ich nehme an ) , um die Verwendung . y iwyich
whuber

Nein, ich habe den Median der posterioren Verteilung für jedes . w(s)
Robert Smith

An welchen räumlichen Positionen hat berechnen Sie den Median der hinteren Verteilung? Ich glaube, die Hauptmotivation für das Ausführen eines Modells dieser Art besteht darin, die Verteilung von an allen Punkten zu verfolgen, an denen Sie an der Vorhersage seiner Werte interessiert sind, die - im Fall dieser Konturkarte - alle 4900 betragen würden Gitterknoten. w ( s )sw(s)
whuber

Antworten:


1

Es ist sehr wahrscheinlich, dass der Autor einen Gaußschen Prozess verwendet hat, um die Interpolation zu erzeugen. Ich denke, das ist wahr, weil eine Übung in dem Buch ein sehr ähnliches Problem wie dieses beschreibt und eine Handlung erfordert, die auf einem Gaußschen Prozess basiert.

Ich habe es versucht und ich denke, dass die resultierende Handlung Merkmale mit der hinteren mittleren Oberfläche der ursprünglichen Frage teilt. Dies ist der Median der posterioren Verteilung von wie oben (es ist etwas anders, weil ich eine andere MCMC-Simulation durchgeführt habe):w(s)

Geben Sie hier die Bildbeschreibung ein

Und dies ist die Interpolation basierend auf einem Gaußschen Prozess:

Geben Sie hier die Bildbeschreibung ein

Wie Sie sehen können, macht die Interpolationsmethode einen großen Unterschied.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.