Was bedeutet Frequenzbereich bei Bildern?


110

Ich habe gerade etwas über den Frequenzbereich in Bildern gelernt.

Ich kann das Frequenzspektrum bei Wellen verstehen. Es gibt an, welche Frequenzen in einer Welle vorhanden sind. Zeichnen wir das Frequenzspektrum von cos(2πft) , so erhalten wir ein Impulssignal bei f und +f . Und wir können entsprechende Filter verwenden, um bestimmte Informationen zu extrahieren.

Aber was bedeutet Frequenzspektrum bei Bildern? Wenn wir die FFT eines Bildes in OpenCV aufnehmen, erhalten wir ein seltsames Bild. Was bedeutet dieses Bild? Und wie ist ihre Anwendung?

Ich habe einige Bücher gelesen, aber sie geben viele mathematische Gleichungen und nicht die physikalische Implikation. Kann jemand also eine einfache Erklärung des Frequenzbereichs in Bildern mit einer einfachen Anwendung in der Bildverarbeitung bereitstellen?


5
Der beste Weg zu verstehen, was eine Transformation bewirkt, besteht darin, einfache Eingaben in die inverse Transformation einzuspeisen .
Endolith

1
Siehe auch diese interessante Erklärung von Steve Eddins blogs.mathworks.com/steve/2009/12/04/…
Alessandro Jacopson

@endolith Ja!
Um

Lieber die Frequenzdomäne des Bildes repräsentieren die Leistungsintensität in Watt in Bezug auf die bestimmte Frequenz in Hertiz wie (Gleichstromkomponente, Niederfrequenz und Hochfrequenz)
Mntaser

Antworten:


93

Aber was bedeutet Frequenzspektrum bei Bildern?

Die "mathematischen Gleichungen" sind wichtig, überspringen Sie sie also nicht ganz. Die 2d FFT ist aber auch intuitiv zu interpretieren. Zur Veranschaulichung habe ich die inverse FFT einiger Beispielbilder berechnet:

Bildbeschreibung hier eingeben

Wie Sie sehen, ist im Frequenzbereich nur ein Pixel eingestellt. Das Ergebnis in der Bilddomäne (ich habe nur den Realteil angezeigt) ist ein "gedrehtes Kosinusmuster" (der Imaginärteil wäre der entsprechende Sinus).

Wenn ich im Frequenzbereich (am linken Rand) ein anderes Pixel einstelle:

Bildbeschreibung hier eingeben

Ich erhalte ein anderes 2D-Frequenzmuster.

Wenn ich mehr als ein Pixel im Frequenzbereich einstelle:

Bildbeschreibung hier eingeben

Sie erhalten die Summe von zwei Cosinus.

So wie eine 1d-Welle, die als Summe von Sinus und Cosinus dargestellt werden kann, kann jedes 2d-Bild (lose gesprochen) als Summe von "gedrehten Sinus und Cosinus" dargestellt werden, wie oben gezeigt.

Wenn wir ein Bild in opencv aufnehmen, bekommen wir ein seltsames Bild. Was bedeutet dieses Bild?

Es gibt die Amplituden und Frequenzen der Sinus / Cosinus an, die, wenn sie addiert werden, das ursprüngliche Bild ergeben.

Und wie ist ihre Anwendung?

Es gibt wirklich zu viele, um sie alle zu nennen. Korrelation und Faltung können mit einer FFT sehr effizient berechnet werden, aber das ist eher eine Optimierung. Sie "sehen" sich das FFT-Ergebnis dafür nicht an. Es wird für die Bildkomprimierung verwendet, da die Hochfrequenzkomponenten normalerweise nur Rauschen sind.


3
Können Sie angeben, welcher Teil im Frequenzbereich hochfrequent und welcher niederfrequent ist?
Abid Rahman K

4
@arkiaz: In den von mir gezeigten Bildern befindet sich die höchste Frequenz in der Bildmitte, die niedrigste Frequenz (dh der Mittelwert des Eingangsbilds) befindet sich im FFT-Ergebnis oben links. Das bieten Ihnen die meisten FFT-Implementierungen. Wenn Sie das FFT-Ergebnis anzeigen, wird häufig die niedrigste Frequenz in die Mitte des angezeigten Bildes verschoben.
Niki Estner

1
@ Mohammad: Ich habe Mathematics InverseFourierFunktion benutzt. ifft2Tun Octave / Matlab nicht dasselbe?
Niki Estner

1
@JimClay Für Farbbilder würde ich eigentlich die Verwendung der YUV-Domain empfehlen . Y = absolute Intensität und UV = Farbe. Selbst bei Farbbildern sind die meisten Informationen, an denen Sie interessiert sind, im Intensitätsbereich des Bildes enthalten. Sie verwenden dieselben mathematischen Werkzeuge, denken Sie jedoch daran, die Transformation rückgängig zu machen.
Atav32

4
Diese wären großartig als Animationen, um den Punkt zu bewegen und zu zeigen, wie sich die Breite und der Winkel der Wellen ändern
Endolith

29

Ich denke, dies wurde sehr gut in den bekannten "DSP-Leitfaden" ( Kapitel 24, Abschnitt 5 ) aufgenommen:

Die Fourier-Analyse wird in der Bildverarbeitung ähnlich wie bei eindimensionalen Signalen eingesetzt. Bei Bildern ist die Information jedoch nicht im Frequenzbereich codiert, wodurch die Techniken weniger nützlich sind. Wenn beispielsweise die Fourier-Transformation eines Audiosignals durchgeführt wird, wird die verwirrende Zeitbereichswellenform in ein einfach zu verstehendes Frequenzspektrum umgewandelt.

Im Vergleich dazu wandelt die Fouriertransformation eines Bildes die einfachen Informationen in der räumlichen Domäne in eine verwürfelte Form in der Frequenzdomäne um. Kurz gesagt, erwarten Sie nicht, dass die Fourier-Transformation Ihnen hilft, die in Bildern codierten Informationen zu verstehen.

Das scheinbar zufällige Muster, das durch die Aufnahme der DFT eines typischen Bildes (wie im folgenden Beispiel) erhalten wird, hat natürlich eine gewisse Struktur und Bedeutung, aber es liegt nicht in einer Form vor, die das menschliche Gehirn intuitiv verstehen möchte. zumindest in Bezug auf die visuelle Wahrnehmung.

Imgur

Hier ist eine weitere interessante und gut lesbare Darstellung dessen, was in einer Fourier-Transformation eines Bildes enthalten ist und wie es interpretiert werden kann. Es enthält eine Reihe von Bildern, die deutlich machen, welche Korrespondenz zwischen dem Fourier-transformierten und dem Originalbild besteht.

Bearbeiten: Schauen Sie sich auch diese Seite an , die zeigt, wie die meisten für die Wahrnehmung wichtigen Informationen eines Bildes in der Phasen- (Winkel-) Komponente der Frequenzdarstellung gespeichert sind.

edit 2: ein weiteres Beispiel für die Bedeutung von Phase und Betrag in der Fourier-Darstellung: "Abschnitt 3.4.1, Bedeutung von Phase und Betrag" in TU Delfts Lehrbuch " Grundlagen der Bildverarbeitung " zeigt dies ganz deutlich:

Imgur


Hallo! Ich habe versucht, dem zweiten Link in Ihrer Frage zu folgen ( "eine weitere interessante und gut lesbare Darstellung ..." ), aber der Link funktioniert nicht. Ich habe auch den in den Kommentaren angegebenen Link ausprobiert, aber er funktioniert nicht. Könnten Sie bitte einen funktionierenden Link finden und bearbeiten?
Penelope

@penelope Du bist die zweite Person, die Probleme mit dem Link bemerkt (siehe meinen vorherigen Kommentar). Die Seite scheint in der Tat instabil zu sein. Wie ich bereits sagte, werde ich den Link durch die Web Archive-Version ersetzen. Vielen Dank für den Hinweis!
Waldyrious

1
Tatsächlich sind die Beispiele und Erklärungen unter dem (endlich funktionierenden) Link großartig :)
penelope

12

Die Welle ist eine eindimensionale Welle; es kommt nur auf . Die Welle ist eine zweidimensionale Welle. Es hängt von und . Wie Sie sehen, haben Sie zwei Frequenzen in beide Richtungen.t f ( x , y ) = c o s ( ω x + ψ y ) x yf(t)=cos(ωt)tf(x,y)=cos(ωx+ψy)xy

Daher ist die Fourier - Transformation (FFT) von geben Ihnen , genau wie die FFT von gibt Ihnen . Und wenn Ihre Eingabe eine Funktion ist, die 2D-Cosinus summiert, dann ist Ihre 2D-FFT die Summe der Frequenzen dieser Cosinus - wieder ein direktes Analogon der 1D-FFT.ω , ψ c o s ( ω x ) ωcos(ωx+ψy)ω,ψcos(ωx)ω


10

Es kann erwähnenswert sein, dass die Fourier-Analyse ein Spezialfall eines Konzepts ist, das als orthogonale Funktionen bezeichnet wird . Die Grundidee ist, dass Sie ein kompliziertes Signal in eine lineare Überlagerung von einfacheren "Basis" -Funktionen zerlegen. Sie können die Basisfunktionen verarbeiten oder analysieren und dann die Ergebnisse für die Basisfunktionen summieren, um das Ergebnis für das ursprüngliche Signal zu erhalten.

Damit dies funktioniert, gibt es bestimmte mathematische Anforderungen an die Basisfunktionen, dh sie bilden idealerweise eine orthonormale Basis. Bei der Fourier-Transformation sind die Basisfunktionen komplexe Exponentiale. Es gibt jedoch auch viele andere Funktionen, die dafür verwendet werden können.


Das ist richtig. Welche anderen Arten von Basisfunktionen gibt es? Ich denke daubechies Wavelets, aber gibt es auch andere? Was würde sie unterscheiden?
Spacey

Am bekanntesten sind wohl die Polynome; Die Darstellung einer Funktion als Satz von Polynomen wird als Taylor-Serie bezeichnet . Diese Serie wird einfach aus den Funktionsableitungen berechnet.
MSalters

2
Eine Möglichkeit, Basisfunktionen zu finden, besteht in der Anwendung der Hauptkomponentenanalyse . Die resultierenden "Eigenbilder" haben oft ein menschlich intuitiveres Erscheinungsbild als sin / cos-Funktionen. Ein Beispiel finden Sie unter Eigengesichter . Der Frequenzbereich ist weiterhin für die Wahrnehmung relevant (unsere Augen / Gehirne verfügen über Kantendetektoren, die frequenzempfindlich sind, insbesondere wenn es um Bewegung geht). Die Basisfunktionen sind als Bilder einfach nicht sehr aussagekräftig.
Dan Bryant

PCA ist eine gute, allgemein bekannte Berechnungsgrundlage, aber es gibt viele andere, die unterschiedliche Annahmen darüber treffen, wie die Daten generiert wurden. Independent Component Analysis (ICA) ist ein beliebtes Beispiel. Etwas weiter entfernt gibt es Algorithmen für das generische Lernen von Basisfunktionen unter Verwendung von spärlicher Codierung (z. B. J Mairal et al., "Online-Wörterbuchlernen für spärliche Codierung", ICML 2009) und anschließend die von den Deep Nets entwickelten "Feature Learning" -Ansätze Leute.
lmjohns3

1
Warum müssen die Funktionen orthogonal sein?
quantum231

8

In Bildern ist eine zunehmende Frequenz mit abrupteren Übergängen in Helligkeit oder Farbe verbunden. Darüber hinaus ist das Rauschen normalerweise im oberen Bereich des Spektrums eingebettet, sodass eine Tiefpassfilterung zur Rauschunterdrückung verwendet werden kann.


1
du meinst also abrupte übergänge werden manchmal als rauschen angesehen?
Abid Rahman K

1
Ja manchmal. Gängige Beispiele sind Moskito-Rauschen (Klingeln um Kanten), JPEG-Block-Rauschen an den Kanten der Makroblöcke und natürlich Getreide. Betrachten Sie ein Bild eines einfachen Verlaufs. Durch Hinzufügen von Körnung zu diesem Bild wird der Hochfrequenzgehalt erhöht, indem winzige Übergänge im gesamten Bild eingefügt werden.
Emre

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.