Wie man den Satz von Bayes auf die Suche nach einem auf See verlorenen Fischer anwendet


19

Der Artikel The Odds, Continuually Updated erwähnt die Geschichte eines Fischers auf Long Island, der buchstäblich Bayesian Statistics sein Leben verdankt. Hier ist die kurze Version:

Mitten in der Nacht sitzen zwei Fischer auf einem Boot. Während einer schläft, fällt der andere in den Ozean. Das Boot fährt die ganze Nacht mit dem Autopiloten weiter, bis der erste Mann endlich aufwacht und die Küstenwache benachrichtigt. Die Küstenwache verwendet eine Software namens SAROPS (Search and Rescue Optimal Planning System) , um ihn rechtzeitig zu finden, da er unterkühlt war und fast keine Energie mehr hatte, um über Wasser zu bleiben.

Hier ist die lange Version: Ein Fleck im Meer

Ich wollte mehr darüber wissen, wie der Satz von Bayes hier tatsächlich angewendet wird. Ich habe einiges über die SAROPS-Software herausgefunden, indem ich einfach gegoogelt habe.

Der SAROPS-Simulator

Die Simulatorkomponente berücksichtigt aktuelle Daten wie Meeresströmung, Wind usw. und simuliert Tausende von möglichen Driftpfaden. Aus diesen Driftpfaden wird eine Wahrscheinlichkeitsverteilungskarte erstellt.

Beachten Sie, dass sich die folgenden Grafiken nicht auf den Fall des vermissten Fischers beziehen, den ich oben erwähnt habe, sondern ein Spielzeugbeispiel aus dieser Präsentation sind

Wahrscheinlichkeitskarte 1 (Rot zeigt die höchste Wahrscheinlichkeit an; Blau die niedrigste) Bildbeschreibung hier eingeben

Beachten Sie den Kreis, der der Startpunkt ist.

Wahrscheinlichkeitskarte 2 - Es ist mehr Zeit vergangen Bildbeschreibung hier eingeben

Beachten Sie, dass die Wahrscheinlichkeitskarte multimodal geworden ist. Dies liegt daran, dass in diesem Beispiel mehrere Szenarien berücksichtigt werden:

  1. Die Person schwimmt im Wasser - Top-Middle-Modus
  2. Die Person befindet sich in einem Rettungsfloß (stärker vom Wind aus dem Norden betroffen) - unterste 2 Modi (aufgeteilt aufgrund von "Halseneffekten")

Wahrscheinlichkeitskarte 3 - Die Suche wurde entlang der rechteckigen Pfade in Rot durchgeführt. Bildbeschreibung hier eingeben Dieses Bild zeigt die vom Planer erstellten optimalen Pfade (eine weitere Komponente von SAROPS). Wie Sie sehen, wurden diese Pfade durchsucht und die Wahrscheinlichkeitskarte wurde vom Simulator aktualisiert.

Sie wundern sich vielleicht, warum die Bereiche, die durchsucht wurden, nicht auf eine Wahrscheinlichkeit von Null reduziert wurden. Dies liegt daran, dass die Wahrscheinlichkeit eines Ausfalls ( berücksichtigt wird, dh, dass die Wahrscheinlichkeit nicht vernachlässigbar ist, dass der Suchende die Person im Wasser übersieht. Verständlicherweise ist die Ausfallwahrscheinlichkeit für eine alleinstehende Person über Wasser viel höher als für eine Person in einem Rettungsfloß (leichter zu erkennen), weshalb die Wahrscheinlichkeiten im oberen Bereich nicht sehr stark gesunken sind.p(fail)

Auswirkungen einer erfolglosen Suche

Hier kommt der Satz von Bayes ins Spiel. Sobald eine Suche durchgeführt wurde, wird die Wahrscheinlichkeitskarte entsprechend aktualisiert, sodass eine weitere Suche optimal geplant werden kann.

Nach dem Lesen von Bayes 'Theorem auf Wikipedia und im Artikel Eine intuitive (und kurze) Erklärung von Bayes' Theorem auf BetterExplained.com

Ich habe die Bayes-Gleichung genommen:

P(EINX)=P(XEIN)×P(EIN)P(X)

Und definiert A und X wie folgt ...

  • Ereignis A: Die Person befindet sich in diesem Bereich (Gitterzelle)

  • Test X: Fehlgeschlagene Suche über diesen Bereich (Gitterzelle), dh Sie haben diesen Bereich durchsucht und nichts gesehen

Nachgeben,

P(Person dorterfolglos)=P(erfolglosPerson dort)×P(Person dort)P(erfolglos)

Ich habe in Search and Rescue Optimal Planning System festgestellt, dass SAROPS die Wahrscheinlichkeit einer fehlgeschlagenen Suche berechnet , indem es die Suchpfade und simulierten Driftpfade berücksichtigt. Nehmen wir der Einfachheit halber an, wir kennen den Wert von .P(Scheitern)P(Scheitern)

Jetzt haben wir

P(Person dorterfolglos)=P(Scheitern)×P(Person dort)P(erfolglos)
  1. Wird die Bayes-Gleichung hier richtig angewendet?

  2. Wie würde der Nenner, die Wahrscheinlichkeit einer erfolglosen Suche, berechnet werden?

    Auch im Such- und Rettungsoptimalen Planungssystem heißt es

    Die vorherigen Wahrscheinlichkeiten werden "auf die übliche Bayes'sche Weise normalisiert" , um die hinteren Wahrscheinlichkeiten zu erzeugen

  3. Was bedeutet "normalisiert nach Bayes" ?

    Bedeutet dies, dass alle Wahrscheinlichkeiten durch oder einfach normalisiert werden, um sicherzustellen, dass die gesamte Wahrscheinlichkeitskarte eins ergibt? Oder sind diese ein und dasselbe?P(erfolglos)

  4. Was wäre der richtige Weg, um die Rasterwahrscheinlichkeitskarte nach der Aktualisierung auf eine erfolglose Suche zu normalisieren, wenn Sie bedenken, dass Sie nicht ALLE Bereiche (Gitterzellen) durchsucht haben und einige Zellen gleich und einige gleich ?P(Person dort)P(Person dorterfolglos)

Noch ein Hinweis zur Vereinfachung: Gemäß Search and Rescue Optimal Planning System wird die posteriore Verteilung tatsächlich berechnet, indem die Wahrscheinlichkeiten der simulierten Driftpfade aktualisiert und dann die gerasterte Wahrscheinlichkeitskarte neu generiert werden. Um dieses Beispiel einfach zu halten, habe ich die Sim-Pfade ignoriert und mich auf die Gitterzellen konzentriert.

Antworten:


6
  1. Unter der Annahme, dass die Gitterzellen unabhängig sind, scheint das Bayes-Theorem richtig angewendet worden zu sein.
  2. Der Nenner kann erweitert werden, z. B. Verwendung der Gesetzesgesamtwahrscheinlichkeit, wobei das Komplement ist von , dh die Person ist nicht da. Wahrscheinlich würden Sie annehmen, dass .
    P(X)=P(X|A)P(A)+P(X|Ac)P(Ac)
    AcAP(X|Ac)=1
  3. Ich bin mir nicht sicher, was "normalisiert in der normalen Bayes'schen Mode" bedeutet, da ich das Handbuch nicht geschrieben habe. Sie sprechen aber sicherlich von der Tatsache, dass die folgenden drei Gleichungen ausreichen, um : Sie müssen also niemals , dh die Normalisierungskonstante. Ob sie damit die Wahrscheinlichkeit für eine einzelne Gitterzelle oder für die gesamte Karte aktualisiert haben, weiß ich nicht (wahrscheinlich beides).P(A|X)
    P(A|X)P(X|A)P(A)P(Ac|X),P(X|Ac)P(Ac), and P(A|X)+P(Ac|X)=1
    P(X)
  4. Lassen Sie uns die Notation so erweitern, dass die Rasterzelle und das Ereignis ist, in dem sich die Person in der Rasterzelle und das Ereignis ist, in dem die Rasterzelle durchsucht und niemand gefunden wurde. Mit der neuen Notation wird die Sammlung von Suchen sein, die fehlgeschlagen sind. Wir gehen von Folgendem aus:iAiiXiiX

    • iP(Ai|X)=1 , dh nach dem Durchführen von Suchen ist die Gesamtsumme der Zellen der Wahrscheinlichkeit, dass sich das Individuum in dieser Zelle befindet, 1. Dies ist wieder das Gesamtwahrscheinlichkeitsgesetz.
    • Wenn wir annehmen, dass die Suche in einer Zelle nichts über eine andere Zelle aussagt, dann wird nach Zellen gesucht, die und for Zellen, die nicht durchsucht wurden . Wenn wir keine Unabhängigkeit annehmen, werden die Formeln komplizierter, aber die Intuition wird ähnlich sein, dh wir berechnen bis zu einer Proportionalitätskonstante.P(Ai|X)=P(Ai|Xi)P(Xi|Ai)P(Ai)P(Ai|X)P(Ai)P(EINich|X)

    Mit diesen beiden Annahmen können wir berechnen und die Karte entsprechend aktualisieren.P(EINich|X)


Vielen Dank für die hervorragenden Antworten. Unter der Annahme, dass die Gitterzellenunabhängigkeit und , wäre es nach einmaliger Suche in jeder Zelle gültig, zu berechnen. für jede Zelle und dividieren Sie dann jede Zelle durch die Summe aller Zellen ( ), um zu normalisieren? P ( X | A ) P ( A ) Σ i P ( X | A ) P ( A i )ichP(EINich|X)=1P(X|EIN)P(EIN)ichP(X|EIN)P(EINich)
Montag,

Ich habe gerade festgestellt, dass das Durchsuchen jeder Zelle mit einer festen Ausfallwahrscheinlichkeit absolut keine Änderung der Wahrscheinlichkeitsverteilung zur Folge hat :)
mlai

Also um es neu zu formulieren ... Unter der Annahme des Gesetzes der Gesamtwahrscheinlichkeit (wie in Ihrer Antwort zu 4.), konnten wir nach der Suche einiger (aber nicht aller) Zellen eine Normalisierung durchführen, indem wir jede Zelle durch die Summe aller Zellen dividierten? ... mit für den Wert der durchsuchten Zellen und für die nicht durchsuchten Zellen . P ( A i )P(X|EIN)P(EINich)P(EINich)
Mlai

4

Ich wurde auf ein Buch verwiesen, das ein ganzes Kapitel meiner Frage gewidmet hat - Naval Operations Analysis - von einem ehemaligen Professor, der Hubschrauberpilot war und tatsächlich Such- und Rettungsmissionen durchgeführt hat, nicht weniger!

In Kapitel 8 finden Sie ein Beispiel wie dieses (ich habe es ein wenig angepasst):

Zu Beginn wird die Position der vermissten Person (en), des Bootes usw. im Voraus in Tabellenform angegeben.

Vorabverteilung: Vorherige Verteilung

Eine Suche wird auf einem Teil des Gitters durchgeführt und die Wahrscheinlichkeiten werden mit einer normalisierten posterioren Verteilung aktualisiert, indem die Bayes-Gleichung auf die gleiche Weise angewendet wird, wie ich es in meinen Fragen erwähnt habe:

P(Ziel in (i, j)kein Nachweis)=P(kein NachweisZiel in (i, j))×P(Ziel in (i, j))P(kein Nachweis)

wo (i, j) = (lat, long)

In diesem Fall habe ich mich für die Suche in Spalte 3 entschieden, da diese Spalte die größte vorherige Wahrscheinlichkeit hatte.

Normalisierte posteriore Verteilung nach Durchsuchung der dritten Spalte mit pFail = 0.2: Normalisierte posteriore Verteilung (mit Ausfallwahrscheinlichkeit = 0,2)

Meine Frage war hauptsächlich, wie der hintere Teil normalisiert wurde. Hier ist , wie es in dem Buch fertig war - einfach jede einzelne posteriore Wahrscheinlichkeit dividieren durch die Gesamtsumme , S :

Bildbeschreibung

Ich habe eine Wahrscheinlichkeit von 0,2 für eine fehlgeschlagene Suche gewählt, weil mein Professor folgendes sagte: "Wir suchen nur mit einer Erkennungswahrscheinlichkeit von 80%, da dies in der Regel der beste Kompromiss zwischen Aktualität und Genauigkeit ist."

Nur zum Spaß habe ich ein weiteres Beispiel mit einem pFail von 0,5 ausgeführt. Während im ersten Beispiel ( pFail = 0,2) die nächstbeste Suchroute (bei normalisierter posteriorer und unter der Annahme von geraden Suchen, keine Diagonale oder Zick-Zack) im zweiten Beispiel ( pFail = 2) wäre, über Spalte 2 zu fliegen 0.5) Die nächstbeste Route verläuft über Zeile 2.

Normalisierte posteriore Verteilung nach Durchsuchung der dritten Spalte mit pFail = 0,5: eNormalisierte posteriore Verteilung (mit Ausfallwahrscheinlichkeit = 0,5)

Bildbeschreibung hier eingeben

Er fügte hinzu: "Flugzeuge haben eine kleine Checkliste dabei, um die beste Flughöhe und Fluggeschwindigkeit zu bestimmen. Das Arbeiten in einem fliegenden Hubschrauber ist, als würde man auf einer Waschmaschine sitzen und ein Buch lesen, das mit Klebeband an einer anderen Waschmaschine befestigt ist."

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.