Warum werden Gauß-Filter als Tiefpassfilter in der Bildverarbeitung verwendet?

30

Bei der 1d-Signalverarbeitung werden viele Arten von Tiefpassfiltern verwendet. Gaußsche Filter werden jedoch fast nie verwendet.

Warum sind sie in Bildverarbeitungsanwendungen so beliebt? Handelt es sich bei diesen Filtern um ein Ergebnis der Optimierung eines Kriteriums oder handelt es sich nur um eine Ad-hoc-Lösung, da die Bildbandbreite normalerweise nicht genau definiert ist.

image-processing

— Nimrodm
quelle

28

Bildverarbeitungsanwendungen unterscheiden sich von Audio-Verarbeitungsanwendungen, da viele von ihnen auf das Auge abgestimmt sind. Gaußsche Masken simulieren nahezu perfekt optische Unschärfen (siehe auch Punktverteilungsfunktionen ). In jeder Bildverarbeitungsanwendung, die auf künstlerische Produktion ausgerichtet ist, werden standardmäßig Gauß-Filter zum Weichzeichnen verwendet.

Eine weitere wichtige quantitative Eigenschaft von Gauß-Filtern ist, dass sie überall nicht negativ sind . Dies ist wichtig, da die meisten 1D-Signale um 0 variieren ( ) und entweder positive oder negative Werte haben können. Bilder unterscheiden sich dahingehend, dass alle Werte eines Bildes nicht negativ sind ( ). Die Faltung mit einem Gaußschen Kernel (Filter) garantiert ein nicht negatives Ergebnis, daher ordnet eine solche Funktion nicht negative Werte anderen nicht negativen Werten zu ( ). Das Ergebnis ist also immer ein anderes gültiges Bild. $x \in \mathbb{R}$ $x \in \mathbb{R}^+$ $f: \mathbb{R}^+ \rightarrow \mathbb{R}^+$

Im Allgemeinen ist die Frequenzunterdrückung bei der Bildverarbeitung nicht so entscheidend wie bei 1D-Signalen. In Modulationsschemata müssen Ihre Filter beispielsweise sehr genau sein, um andere Kanäle, die auf unterschiedlichen Trägerfrequenzen gesendet werden, usw. abzulehnen. Ich kann mir nichts als Einschränkung für Bildverarbeitungsprobleme vorstellen.

— Phonon
quelle

21

Gauß-Filter werden in der Bildverarbeitung verwendet, da sie die Eigenschaft haben, dass ihre Unterstützung im Zeitbereich der Unterstützung im Frequenzbereich entspricht. Dies kommt dadurch zustande, dass der Gaußsche seine eigene Fouriertransformation ist.

Was sind die Implikationen davon? Nun, wenn die Unterstützung des Filters in beiden Bereichen gleich ist, bedeutet dies, dass das Verhältnis beider Unterstützungen 1 ist. Wie sich herausstellt, bedeutet dies, dass Gauß-Filter das 'Produkt mit minimaler Zeitbandbreite' aufweisen.

Also, was könnten Sie sagen? Nun, bei der Bildverarbeitung ist es eine sehr wichtige Aufgabe, weißes Rauschen zu entfernen und dabei die ausgeprägten Kanten zu erhalten. Dies kann eine widersprüchliche Aufgabe sein - weißes Rauschen existiert bei allen Frequenzen gleichermaßen, während Kanten im Hochfrequenzbereich existieren. (Plötzliche Änderungen der räumlichen Signale). Bei der herkömmlichen Rauschunterdrückung durch Filterung wird ein Signal tiefpassgefiltert, was bedeutet, dass Hochfrequenzkomponenten in Ihrem Signal vollständig entfernt werden.

Wenn Bilder jedoch Kanten als Hochfrequenzkomponenten haben, werden diese durch herkömmliches LPF-Verfahren ebenfalls entfernt, und dies äußert sich visuell darin, dass die Kanten stärker "verschmiert" werden.

Wie also, um Rauschen zu beseitigen, aber auch Hochfrequenzkanten zu erhalten? Geben Sie den Gaußschen Kern ein. Da die Fourier-Transformation eines Gaußschen auch ein Gaußscher ist, hat das Gaußsche Filter bei einer Durchlaßbandfrequenz, bei der alle höheren Frequenzen entfernt werden, keine scharfe Grenze. Stattdessen hat es einen anmutigen und natürlichen Schwanz, der mit zunehmender Frequenz immer niedriger wird. Dies bedeutet, dass es als Tiefpassfilter fungiert, aber auch Komponenten mit höherer Frequenz zulässt, die der Geschwindigkeit entsprechen, mit der sein Schwanz abfällt. (Andererseits wird ein LPF ein Produkt mit einer höheren Zeitbandbreite haben, da seine Unterstützung in der F-Domäne nicht annähernd so groß ist wie die eines Gaußschen).

Auf diese Weise kann das Beste aus beiden Welten erzielt werden - Rauschunterdrückung plus Kantenschutz.

— Spacey
quelle

2

Ich bin mir nicht sicher, ob Sie die beiden Träger direkt vergleichen können, da einer in Zeit / Länge und der andere in Hz / Bogenmaß gemessen wird. Ihre Morphologie ist identisch, aber die universelle Skalierungseigenschaft bleibt bestehen.

— Phonon

Vielen Dank, dass Sie mich an das Produkt mit der minimalen Zeitbandbreite erinnert haben. Wie Phonon bereits erwähnte, erhöht die Reduzierung der räumlichen (~ Zeit) Domänenunterstützung notwendigerweise die Bandbreite. Mit einem einfachen Gauß-Filter können Sie auf keinen Fall sowohl Rauschunterdrückung als auch Kantenerhaltung erzielen. Aus diesem Grund hat Perona & Malik eine anisotrope Filterung entwickelt.

— Nimrodm

@ Phonon Wie ich gesehen habe, ist die Unterstützung einfach, wie viele Nicht-Null-Einträge die Funktion in beiden Domänen beschreiben - ich glaube, sie sind gleich. (Daher Verhältnis 1). Dabei wird das Zeit-Bandbreiten-Produkt als Produkt der zeitlichen und frequenten Varianz der Funktion gemessen. Wie sich seine Normalisierung von den Autoren unterscheidet, habe ich gesehen, dass es entweder 1/2 oder 1/4 entspricht.

— Spacey

1

@nimrodm "Die Reduzierung der räumlichen (~ Zeit) Domänenunterstützung erhöht notwendigerweise die Bandbreite.", Ja, das ist der Trend , der aus der Zeit-Frequenz-Beziehung resultiert. (Hier kommt die Zeit-Frequenz-Unsicherheit her). Die Gaußsche Funktion ist jedoch eine Klasse, die dieses Produkt vollständig minimiert. In Anbetracht des umgekehrten Verhältnisses zwischen Zeit und Häufigkeit gibt es keine Möglichkeit, dies zu tun, es sei denn, es wird in beiden Bereichen gleichermaßen unterstützt.

— Spacey

@nimrodm Bei der anisotropen Diffusion sind die Kerne, die ich gesehen habe, immer noch Gauß'sch, allerdings mit Kovarianzmatrizen, die vom Gradienten des Bildes abhängen. (Es ist auch eine nichtlineare Methode, VS Gaußsche Glättung, die linear ist). Der Gaußsche Wert bleibt jedoch aufgrund seiner Eigenschaften erhalten.

— Spacey

11

Sie haben bereits gute Antworten, aber ich füge nur eine weitere nützliche Eigenschaft von 2D-Gauß-Filtern hinzu: Sie sind trennbar , dh der 2D-Filter kann in zwei 1D-Filter zerlegt werden. Dies kann ein wichtiger Leistungsaspekt für größere Kernelgrößen sein, da ein MxN-separierbarer Filter mit M+NMultiplikationsadditionen implementiert werden kann, während ein nicht separierbarer MxN-Filter M*NMultiplikationsadditionen erfordert .

— Paul R
quelle

2

Das ist ein gutes Argument. Ein 2D-Gauß-Filter ist sowohl radialsymmetrisch als auch noch trennbar, so dass der Implementierungsaufwand erheblich reduziert wird.

— Nimrodm

1

Als Referenz bietet das DSP-Handbuch für Wissenschaftler und Ingenieure eine hervorragende Beschreibung dieser Eigenschaft in Kapitel 24 .

— Caleb Reister

6

Das imagemagick-Handbuch enthält eine gute Erklärung, warum das Filtern mit sinc-Funktionen zu "Klingeleffekten" führt, während dies bei Gauß nicht der Fall ist. ( http://www.imagemagick.org/Usage/fourier/#blurring und http://www.imagemagick.org/Usage/fourier/#circle_spectrum ). Wenn Sie Kanten (Diskontinuitäten) in Ihrem Bild haben (was bei den meisten Bildern der Fall ist), werden durch das vollständige Ausschneiden aller hohen Frequenzen Wellen im räumlichen Bereich erzeugt. Sie klingeln auch, wenn Sie Rechteckwellen mit einer Sinusfunktion in einer Dimension filtern.

— Wandering Logic
quelle

2

Es gab bereits schöne Antworten, aber ich werde mein Salzkorn hinzufügen, eher aus einer anderen Perspektive:

Das Filtern auf der abstraktesten Ebene kann als Anwenden von Vorkenntnissen auf einige Rohdaten betrachtet werden. Dies bedeutet, dass einige Filteralgorithmen angewendet werden müssen, bevor beispielsweise ein optimales Signal-Rausch-Verhältnis ermittelt werden kann.

Ein klassischer Prior für Bilder ist die Glätte von Werten (z. B. Intensität) in Bezug auf die Position (dies kann als die von @Phonon erwähnte Punktverteilungsfunktion angesehen werden). Es wird oft als Gaußscher Satz modelliert, da dies die Form ist, die Sie erhalten würden, wenn Sie verschiedene Objekte mit einem bekannten Glättungsradius mischen (dies wird als zentraler Grenzwertsatz bezeichnet ). Dies ist vor allem dann nützlich, wenn Sie Ableitungen eines Bildes vornehmen möchten: Anstatt auf dem Rohsignal zu differenzieren (was zu einer verrauschten Ausgabe führen würde), sollten Sie dies auf dem geglätteten Bild tun. Dies entspricht der Anwendung eines Wavelet-ähnlichen Operators wie Gabor-Filtern .

— meduz
quelle