Welche Statistik wird verwendet, um das Vorhandensein eines Signals im Rauschen zu bestimmen?


12

Dies ist ein Detektorproblem, von dem ich glaube:

Ich bin verblüfft über ein scheinbar einfaches Problem. Grundsätzlich habe ich eine Band von Interesse. Wenn innerhalb dieses interessierenden Bandes Signalenergien vorhanden sind, führe ich die Operation X für mein Signal aus.

Mein Problem ist, dass ich nicht genau weiß, wie ich entscheiden soll, ob ein Signal vorhanden ist oder nicht. Nachdem ich eine FFT durchgeführt habe, kann ich nach Peaks suchen.

Aber was jetzt?

  • Wird die verwendete Statistik normalerweise mit dem umgebenden Mittelwert des Spektrums verglichen? Oder ist es eine andere Statistik?
  • Mit welchem ​​statistischen Maß kann ich einfach feststellen, ob ein Signal vorhanden ist, und von dort aus fortfahren?
  • Wie setze ich diesen Wert? Einfache Schwellenwertbildung?

BEARBEITEN Basierend auf Feedback:

Für diesen einfachen Fall gehe ich von einem Ton in weißem Gaußschen Rauschen aus. Was ich versuche in den Griff zu bekommen sind:

  1. Wie genau man eine ROC erzeugte Kurve . Muss man zuerst alle Daten beschriften und dann die wahr-positiven und falsch-positiven Raten für eine Vielzahl von Schwellenwerten erhalten?

  2. Wie wirkt sich eine Verringerung des SNR auf die ROC-Kurve aus? Bewegen Sie es in Richtung der Diagonale?

  3. Was macht die adaptive Schwellwertbildung mit einer bestimmten ROC-Kurve, die ansonsten ohne eine adaptive Schwelle erzeugt wurde?

    3a. Welche gängigen adaptiven Schwellenwerttechniken, die ich betrachten kann, sind üblich?


Möchten Sie einen Batch-Algorithmus (offline) oder einen sequentiellen Algorithmus (online)? Haben Sie Rausch- und Signalstatistiken (dh können Sie das Wahrscheinlichkeitsverhältnis charakterisieren)? Wenn ja, haben Sie versucht, ein SPRT zu verwenden ?
Emre

@ Emre Es kann offline sein. Ich bin mir nicht sicher, was Sie unter Signal- / Rauschstatistik verstehen. Ich habe einen Sensor, der ein Signal (Ton) bei Vorhandensein von Rauschen misst, und sein SNR kann variieren ...
Spacey

Er meint: Was sind die statistischen Eigenschaften des Rauschens und des Signals? Kennen Sie die Verteilung des Geräusches? Was ist mit der Verteilung des Signals plus Rauschen?
Jason R

@ JasonR Ich verstehe. Nun, das Signal wird ein Ton sein und das Rauschen ist Gauß. Vermisse ich etwas
Spacey

Könnte sein. Weißer Gaußscher? Der Punkt ist, dass Sie, um es theoretisch zu analysieren, ein Wahrscheinlichkeitsmodell für das Rauschen und das Signal plus Rauschen annehmen müssen. Basierend auf dieser Antwort können Sie das tun.
Jason R

Antworten:


9

Dies ist eines der ältesten Signalverarbeitungsprobleme, und eine einfache Form wird wahrscheinlich in einer Einführung in die Detektionstheorie angetroffen. Es gibt theoretische und praktische Ansätze zur Lösung eines solchen Problems, die sich je nach spezifischer Anwendung überschneiden können oder nicht.

P.d P.fein

P.dP.feinP.d=1P.fein=0und nenne es einen Tag. Wie Sie vielleicht auch erwarten, ist es nicht so einfach. Es gibt einen inhärenten Kompromiss zwischen den beiden Metriken. Wenn Sie etwas tun, das das eine verbessert, werden Sie in der Regel eine gewisse Verschlechterung des anderen feststellen.

Ein einfaches Beispiel: Wenn Sie nach dem Vorhandensein eines Impulses vor dem Hintergrund eines Rauschens suchen, können Sie einen Schwellenwert irgendwo über dem "typischen" Rauschpegel festlegen und das Vorhandensein des interessierenden Signals anzeigen, wenn Ihre Erkennungsstatistik unterbrochen wird oberhalb der Schwelle. Willst du eine wirklich niedrige Fehlalarmwahrscheinlichkeit? Stellen Sie den Schwellenwert hoch ein. Dann kann die Erkennungswahrscheinlichkeit jedoch erheblich abnehmen, wenn der erhöhte Schwellenwert auf oder über dem erwarteten Signalleistungspegel liegt!

P.dP.fein

Geben Sie hier die Bildbeschreibung ein

Ein idealer Detektor hätte eine ROC-Kurve, die sich an die Oberseite des Diagramms schmiegt. Das heißt, es könnte eine garantierte Erkennung für jede Fehlalarmrate bieten. In Wirklichkeit hat ein Detektor eine Eigenschaft, die wie die oben dargestellten aussieht. Durch Erhöhen der Erkennungswahrscheinlichkeit wird auch die Fehlalarmrate erhöht und umgekehrt.

Aus theoretischer Sicht laufen diese Arten von Problemen daher darauf hinaus, ein Gleichgewicht zwischen Erkennungsleistung und Fehlalarmwahrscheinlichkeit zu wählen. Wie dieses Gleichgewicht mathematisch beschrieben wird, hängt von Ihrem statistischen Modell für den vom Detektor beobachteten Zufallsprozess ab. Das Modell hat normalerweise zwei Zustände oder Hypothesen:

H.0::Es ist kein Signal vorhanden
H.1::Signal ist vorhanden

Typischerweise hat die Statistik, die der Detektor beobachtet, eine von zwei Verteilungen, nach denen die Hypothese wahr ist. Der Detektor wendet dann eine Art Test an, der verwendet wird, um die wahre Hypothese zu bestimmen und daher festzustellen, ob das Signal vorhanden ist oder nicht. Die Verteilungen der Erkennungsstatistik sind eine Funktion des Signalmodells, das Sie für Ihre Anwendung entsprechend auswählen.

Übliche Signalmodelle sind die Detektion eines pulsamplitudenmodulierten Signals vor dem Hintergrund eines additiven weißen Gaußschen Rauschens (AWGN) . Während diese Beschreibung etwas spezifisch für die digitale Kommunikation ist, können viele Probleme auf dieses oder ein ähnliches Modell abgebildet werden. Insbesondere wenn Sie nach einem zeitlich lokalisierten Ton mit konstantem Wert vor dem Hintergrund von AWGN suchen und der Detektor die Signalgröße beobachtet, weist diese Statistik eine Rayleigh-Verteilung auf, wenn kein Ton vorhanden ist, und eine Rician-Verteilung, wenn einer vorhanden ist.

Sobald ein statistisches Modell entwickelt wurde, muss die Entscheidungsregel des Detektors angegeben werden. Dies kann so kompliziert sein, wie Sie es wünschen, je nachdem, was für Ihre Anwendung sinnvoll ist. Im Idealfall möchten Sie eine Entscheidung treffen, die in gewissem Sinne optimal ist, basierend auf Ihrem Wissen über die Verteilung der Erkennungsstatistik unter beiden Hypothesen, der Wahrscheinlichkeit, dass jede Hypothese wahr ist, und den relativen Kosten, wenn eine Hypothese falsch ist ( worüber ich gleich mehr sprechen werde). Die Bayes'sche Entscheidungstheorie kann als Rahmen für die Annäherung an diesen Aspekt des Problems aus theoretischer Sicht verwendet werden.

T.T.(t)t

T.T.=5P.d=0,9999P.fein=0,01

Wo Sie sich letztendlich entscheiden, auf der Leistungskurve zu sitzen, liegt bei Ihnen und ist ein wichtiger Konstruktionsparameter. Der richtige Leistungspunkt hängt von den relativen Kosten der beiden möglichen Fehlertypen ab: Ist es für Ihren Detektor schlimmer, ein Auftreten des Signals zu verpassen, wenn es auftritt, oder ein Auftreten des Signals zu registrieren, wenn es nicht aufgetreten ist? Ein Beispiel: Ein fiktiver ballistischer Raketendetektor mit automatischer Rückschlagfunktion würde am besten dazu dienen, eine sehr falsche Alarmrate zu haben. Es wäre unglücklich, einen Weltkrieg wegen einer falschen Entdeckung zu beginnen. Ein Beispiel für die umgekehrte Situation wäre ein Kommunikationsempfänger, der für Anwendungen zur Sicherheit des Lebens verwendet wird. Wenn Sie maximale Sicherheit haben möchten, dass keine Notmeldungen empfangen werden,


Danke JasonR, sehr schöner Beitrag. Ich verdaue immer noch Ihren Beitrag, aber eine Frage kommt mir in den Sinn. Wie genau wird diese ROC-Kurve erzeugt? Ich verstehe, dass ich für jeden Klassifikator die wahr-positive und falsch-positive Rate messe und dass dies einen Punkt in der ROC-Kurve markiert . Was wird also so geändert, dass ich viele Punkte bekomme, damit ich eine Kurve für einen Klassifikator erstellen kann?
Spacey

1
P.dP.fein

1

Die Statistik ist das Likelihood Ratio (LR), und der Test ist ein Vergleich des LR mit einem Schwellenwert. Wenn Sie der Tradition folgen, die Wahrscheinlichkeit der Nullhypothese in den Nenner zu setzen, entscheiden Sie sich für die Alternativhypothese ( gegen die Nullhypothese ), wenn der LR ausreichend hoch ist. Je höher das Verhältnis, desto größer ist Ihr Vertrauen. Dies ist der Test, den Sie durchführen würden, wenn Sie die Daten bereits gesammelt haben. Wenn Sie entscheiden möchten , wann die Daten Stück für Stück eingehen , können Sie einen sequentiellen Test wie SPRT verwenden .

In dieser Phase können Sie von einem Buch über Hypothesentests oder Entscheidungstheorie (allgemeiner) profitieren .

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.