DCT und Hard Thresholding


8

Wenn ich ein Bild habe und die DCT finde und dann eine harte Schwellwertbildung auf die Koeffizienten und dann die IDCT anwende, habe ich das Rauschen gedämpft. Kann mir bitte jemand etwas näher erläutern oder mich auf die Antwort hinweisen, warum das funktioniert. Ich verstehe, warum ein Filter, der Hochfrequenz blockiert, beim Entrauschen funktioniert (weil wir annehmen, dass Rauschen aus Hochfrequenzkomponenten besteht), aber warum funktioniert die Größenschwelle?

Antworten:


4

Die Tiefpassfilterung basiert auf der Annahme, dass "natürliche" Bilder in den Niederfrequenzkoeffizienten mehr Energie haben als in den Hochfrequenzkoeffizienten; während Rauschen alle Koeffizienten gleichermaßen beeinflusst. Somit wird durch Entfernen der Hochfrequenzkoeffizienten vergleichsweise mehr Rauschen als Signal eliminiert. Das Problem ist, dass es "legitime" Hochfrequenzkoeffizienten in Bildern gibt, wie z. B. Kanten. Das Entrauschen durch Tiefpassfilterung dämpft diese Koeffizienten und verursacht Kantenunschärfe.

Die Eigenschaft, die bei der Größenschwelle verwendet wird, ist die Sparsamkeit - "natürliche" Bilder haben sehr wahrscheinlich nur einen kleinen Satz hoher Koeffizienten ungleich Null im Frequenzbereich. Das Hinzufügen eines gleichmäßigen (und von Pixel zu Pixel unabhängigen) Rauschens entspricht dem Hinzufügen eines kleinen Zufallswerts zu allen Frequenzkoeffizienten. Das Ergebnis ist, dass alle Koeffizienten, die im Originalbild 0 waren, jetzt einen kleinen Wert haben. während die Koeffizienten, die im Originalbild hoch waren, vergleichsweise unberührt bleiben. Durch Schwellenwertbildung der kleinen Größenkoeffizienten wird der Beitrag des Rauschens zu diesen Koeffizienten aufgehoben - obwohl die Auswirkung des Rauschens auf die hohen Koeffizienten nicht wiederhergestellt wird.

Wenn Sie Kanten durch Transienten / Attacken ersetzen, gilt das Gleiche übrigens auch für Sounds.


1

Sehen Sie sich das folgende Optimierungsproblem an:

argminx12Axy+λx0

Wo zählt die Anzahl der Elemente ungleich Null.0

Es ist bekannt, dass Iterative Hard Thresholding verwendet werden kann, um dieses Problem zu lösen, und in einigen Fällen garantiert, um die richtige Lösung zu finden (siehe Iterative Hard Thresholding für Compressed Sensing ).

Wenn Sie nun als DCT-Wörterbuch verwenden (was Sie können und viele tun), versuchen Sie im Grunde, dies zu lösen.A

Dies ist der Gesichtspunkt der Optimierung.
Der Grund, warum es so gut funktioniert, die Idee spärlicher (niedriger Freiheitsgrad) Darstellungen?
Nun, die einfache Intuition ist Effizienz.
Die Dinge sollten einfach sein, wenn man die richtigen Werkzeuge verwendet, um sie zu beschreiben.

Ein großartiger Ort, um sich eingehend mit eDx zu befassen - Sparse Representations in Signal and Image Processing: Fundamentals von Michael Elad .


0

DCTs sind sehr nützlich bei der Energieverdichtung. Einfach ausgedrückt, nachdem eine DCT eines Bildes aufgelöst wurde, werden einige Basisfunktionen gewichtet. Nach einer DCT enthält die resultierende Matrix Multiplikatoren für jede Basisfunktion. Und man kann ohne Verlust der Allgemeinheit sagen, dass die hohen Wertkoeffizienten diejenigen sind, die wesentlich zur psycho-visuellen Wahrnehmung des Bildes durch das menschliche Auge beitragen.

Niederfrequenzrauschen addiert sich zu den Niederfrequenzkoeffizienten, jedoch führt Hochfrequenzrauschen zu kleineren Größen der Hochfrequenzkoeffizienten der resultierenden transformierten Matrix.

Wenn wir also die transformierte Matrix mit einem Schwellenwert versehen, eliminieren wir jegliches Rauschen, das nicht Teil der Koeffizienten mit hoher Größe ist. Es ist also immer noch etwas Rauschen vorhanden, das nach der IDCT auftreten kann.

Die Hauptidee hier ist jedoch in Bildern, in denen Hochfrequenzdaten minimal sind. Eine DCT, gefolgt von einer Größenschwelle, ist wahrscheinlich besser als ein typischer Hochpassfilter. Wenn man sich ein Bild vorstellen kann, bei dem eine Frequenz im Bild eine reale Bildkomponente und eine Rauschkomponente aufweist, bei der die reale Bildkomponente klein oder Null ist, wird diese Frequenzkomponente durch eine DCT gefolgt von einer Größenschwelle eliminiert, wodurch hauptsächlich auf die verrauschte Komponente abgezielt wird .

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.