Was sind einige der Unterschiede zwischen DFT und FFT, die FFT so schnell machen?

16

Ich versuche FFTs zu verstehen, hier ist was ich bisher habe:

Um die Größe von Frequenzen in einer Wellenform zu finden, muss man nach ihnen suchen, indem man die Welle mit der Frequenz, nach der sie suchen, in zwei verschiedenen Phasen (sin und cos) multipliziert und jeweils einen Durchschnitt bildet. Die Phase wird durch ihre Beziehung zu den beiden gefunden, und der Code dafür ist ungefähr so:

//simple pseudocode
var wave = [...];                //an array of floats representing amplitude of wave
var numSamples = wave.length;
var spectrum = [1,2,3,4,5,6...]  //all frequencies being tested for.  

function getMagnitudesOfSpectrum() {
   var magnitudesOut = [];
   var phasesOut = [];

   for(freq in spectrum) {
       var magnitudeSin = 0;
       var magnitudeCos = 0;

       for(sample in numSamples) {
          magnitudeSin += amplitudeSinAt(sample, freq) * wave[sample];
          magnitudeCos += amplitudeCosAt(sample, freq) * wave[sample];
       }

       magnitudesOut[freq] = (magnitudeSin + magnitudeCos)/numSamples;
       phasesOut[freq] = //based off magnitudeSin and magnitudeCos
   }

   return magnitudesOut and phasesOut;
}

Um dies für sehr viele Frequenzen sehr schnell zu tun, verwenden FFTs viele Tricks.

Mit welchen Tricks sind FFTs so viel schneller als DFT?

PS Ich habe versucht, fertige FFT-Algorithmen im Web zu betrachten, aber alle Tricks lassen sich ohne viel Erklärung zu einem schönen Stück Code zusammenfassen. Was ich zuerst brauche, um das Ganze zu verstehen, ist eine Einführung in jede dieser effizienten Änderungen als Konzepte.

Vielen Dank.

fft dft algorithms

— Seph Reed
quelle

7

"DFT" bezieht sich nicht auf einen Algorithmus, sondern auf eine mathematische Operation. "FFT" bezieht sich auf eine Klasse von Methoden zur Berechnung dieser Operation.

1

Ich wollte nur darauf hinweisen, dass die Verwendung sudoin Ihrem Codebeispiel verwirrend sein kann, da dies ein in der Computerwelt bekannter Befehl ist. Du hast wahrscheinlich Pseudocode gemeint.

— RWFEDER

1

@nwfeather Er meinte wahrscheinlich "Pseudocode".

— user207421

20

Die naive Implementierung einer Punkt-DFT ist im Grunde genommen eine Multiplikation mit einer Matrix. Dies führt zu einer Komplexität von . $N$ $N \times N$ $\mathcal{O}(N^2)$

Einer der gebräuchlichsten Fast Fourier Transform (FFT) -Algorithmen ist der Cooley-Tukey-Decimation-in-Time-FFT-Algorithmus ( Radix-2) . Dies ist ein grundlegender Ansatz zum Teilen und Erobern.

Definieren Sie zuerst den "Twiddle-Faktor" als: wo

W_{N} ≜ e^{- j \frac{2 π}{N}}

$W_N \triangleq e^{-j\frac{2\pi}{N}}$

ist die imaginäre Einheit, dann ist die DFT

von

gegeben durch

j ≜ \sqrt{- 1}

$j \triangleq \sqrt{-1}$

X [k]

$X[k]$

x [n]

$x[n]$

Wenn

ist (und

X [k] = \sum_{n = 0}^{N - 1} x [n] W_{N}^{k n} .

$X[k] = \sum_{n=0}^{N-1} x[n] \, W_N^{kn} \, .$

N

$N$

ist eine ganze Zahl), kann die Summe dann in zwei Summen wie folgt unterteilt wird

\frac{N}{2}

$\tfrac{N}{2}$

X [k] = \sum_{n = 0}^{N / 2 - 1} x [2 n] W_{N}^{2 k n} + \sum_{n = 0}^{N / 2 - 1} x [2 n + 1] W_{N}^{k (2 n + 1)}

$X[k] = \sum_{n=0}^{N/2-1} x[2n]W_N^{2kn} + \sum_{n=0}^{N/2-1} x[2n+1]W_N^{k(2n+1)}$ wobei sich die erste Summation mit den geraden Abtastwerten von

und die zweite mit den ungeraden Abtastwerten von

. Definieren von

und

und mit der Tatsache , dass

x [n]

$x[n]$

x [n]

$x[n]$

x_{e} [n] ≜ x [2 n]

$x_e[n] \triangleq x[2n]$

x_{o} [n] ≜ x [2 n + 1]

$x_o[n] \triangleq x[2n+1]$

und $W_N^{k(2n+1)} = W_N^{2kn}W_N^k$
$W_N^{2kn} = W_{N/2}^{kn}$

\begin{aligned} X [k] & = \sum_{n = 0}^{N / 2 - 1} x_{e} [n] W_{N / 2}^{k n} + W_{N}^{k} \sum_{n = 0}^{N / 2 - 1} x_{o} [n] W_{N / 2}^{k n} \\ = X_{e} [k] + W_{N}^{k} X_{o} [k] \end{aligned}

$\begin{align} X[k] &= \sum_{n=0}^{N/2-1} x_e[n] W_{N/2}^{kn} + W_N^k\sum_{n=0}^{N/2-1} x_o[n]W_{N/2}^{kn} \\ & = X_e[k] + W_N^k X_o[k] \end{align}$

X_{e} [k]

$X_e[k]$

X_{o} [k]

$X_o[k]$

\frac{N}{2}

$\tfrac{N}{2}$

x [n]

$x[n]$

N

$N$

\frac{N}{2}

$\tfrac{N}{2}$

2 {(\frac{N}{2})}^{2} + N < N^{2}

$2 \left( \frac{N}{2} \right)^2 + N < N^2$

N > 2

$N > 2$

$\mathcal{O}(N\log N)$ $\mathcal{O}(N^2)$

— anpar
quelle

Würden Sie gerne auflisten, wofür jede der Variablen steht? Ich bin ziemlich neu in diesem, so W, j, X(), Nund knoch nicht haben Definitionen für mich.

— Seph Reed

W

$W$

k

$k$

n

$n$

19

http://nbviewer.jupyter.org/gist/leftaroundabout/83df89a7d3bdc24373ea470fb50be629

DFT, Größe 16

FFT, Größe 16

Der Unterschied in der Komplexität ist ziemlich offensichtlich, nicht wahr?

So verstehe ich FFT.

$\operatorname{FT} : \mathcal{L}^2(\mathbb{R}) \to \mathcal{L}^2(\mathbb{R})$

$\mathbb{R}\to\mathbb{C}$ Der einfachste Fall ist, dass Ihre Funktion stetig ist und Sie sie in so kleine Bereiche unterteilen, dass sie in jedem von ihnen im Grunde konstant ist. Dann hat jede der STFTs am stärksten einen nullten Term. Wenn Sie die (sowieso abklingenden) anderen Koeffizienten ignorieren, ist jede Domäne nur ein einzelner Datenpunkt. Von all diesen Kurzzeit-LF-Grenzkoeffizienten könnten Sie eine diskrete Fourier-Transformation durchführen. Das ist genau das, was Sie tun, wenn Sie eine FT mit gemessenen Daten aus der realen Welt durchführen!

Die gemessenen Daten müssen jedoch nicht unbedingt einer physikalischen Grundgröße entsprechen. Wenn Sie beispielsweise eine Lichtintensität messen, messen Sie tatsächlich nur die Amplitude einer elektromagnetischen Welle, deren Frequenz selbst zu hoch ist, um mit einem ADC abgetastet zu werden. Es ist jedoch klar, dass Sie auch die DFT eines abgetasteten Lichtintensitätssignals berechnen können, und das zu einem günstigen Preis, trotz der irrsinnigen Frequenz der Lichtwelle.

Dies kann als der wichtigste Grund für die Kostengünstigkeit von FFT angesehen werden:

Versuchen Sie nicht, die einzelnen Schwingungszyklen von der höchsten Ebene aus zu sehen. Transformieren Sie stattdessen nur Informationen auf höherer Ebene, die bereits lokal vorverarbeitet wurden.

Das ist jedoch noch nicht alles. Das Tolle an FFT ist, dass Sie immer noch alle Informationen erhalten, die eine vollständige DFT liefern würde . Dh alle Informationen, die Sie auch erhalten, wenn Sie die exakte elektromagnetische Welle eines Lichtstrahls abtasten. Kann dies durch Transformieren eines Fotodiodensignals erreicht werden? - Können Sie daraus die genaue Lichtfrequenz messen?

$\Delta \nu = 1/{\Delta t}$

Durch eine insgesamt längere Zeitspanne sollten wir auch in der Lage sein, die Frequenzunsicherheit einzugrenzen. Und dies ist tatsächlich möglich, wenn Sie nicht nur die Grobfrequenz, sondern auch die Phase der Welle lokal messen . Sie wissen, dass ein 1000-Hz-Signal genau dieselbe Phase hat, wenn Sie es eine Sekunde später betrachten. Während ein 1000,5-Hz-Signal auf der kurzen Skala nicht zu unterscheiden ist, hat es eine Sekunde später eine invertierte Phase.

Glücklicherweise kann diese Phaseninformation sehr gut in einer einzigen komplexen Zahl gespeichert werden. Und so funktioniert FFT! Es beginnt mit vielen kleinen, lokalen Veränderungen. Diese sind billig - zum einen offensichtlich, weil sie nur eine geringe Datenmenge verwenden, zum anderen, weil sie wissen, dass sie die Frequenz aufgrund der kurzen Zeitspanne ohnehin nicht sehr genau auflösen können - und daher auch für Sie noch erschwinglich sind mache eine ganze Menge solcher Transformationen.

Diese zeichnen jedoch auch die Phase auf , woraufhin Sie die Frequenzauflösung auf der obersten Ebene genauer einstellen können. Die erforderliche Transformation ist wieder günstig, da sie sich nicht um hochfrequente Schwingungen kümmert, sondern nur um die vorverarbeiteten niederfrequenten Daten.

^†_{Ja, meine Argumentation ist an dieser Stelle etwas kreisförmig. Nennen wir es einfach rekursiv und es geht uns gut ...}

^‡_{Diese Beziehung ist nicht quantenmechanisch, aber die Heisenbergsche Unsicherheit hat tatsächlich den gleichen fundamentalen Grund.}

— links herum
quelle

2

schöne bildliche darstellung der frage. :-)

— robert bristow-johnson

2

Lieben Sie keine Diagramme, die überall wiederholt und nie wirklich irgendwo erklärt werden :)

— Mehrdad

1

Nachdem ich die Antwort von anpar gelesen hatte, verstand ich das Bild.

— JDługosz

15

$W_N^{nk}$ $e^{j2\pi \frac{nk}{N}}$

Beachten Sie den gezeigten Pfad und die Gleichung darunter zeigt das Ergebnis für das Frequenzfach X (1), wie es durch Roberts Gleichung gegeben ist.

Gestrichelte Linien unterscheiden sich nicht von durchgezogenen Linien, um zu verdeutlichen, wo sich die Summationsverknüpfungen befinden.

— Dan Boschen
quelle

8

Bei der Berechnung der naiven DFT direkt aus der Summe gilt:

X [k] = \sum_{n = 0}^{N - 1} x [n] e^{j 2 π \frac{n k}{N}}

$X[k] = \sum\limits_{n=0}^{N-1} x[n] \, e^{j 2 \pi \frac{nk}{N}}$

$N$ $e^{j 2 \pi \frac{nk}{N}}$ $N$ $N-1$ $X[k]$ $k$ $X[k+1]$

Die FFT behält also einige Zwischendaten bei.
Bei der FFT wird auch der Twiddle-Faktor ein wenig berücksichtigt, damit derselbe Faktor für eine Zwischenkombination von Daten verwendet werden kann.

— Robert Bristow-Johnson
quelle

4

Ich bin eine visuelle Person. Ich stelle mir die FFT lieber als Matrixtrick als als Summationstrick vor.

Auf hohem Niveau erklären:

Eine naive DFT berechnet jede Ausgangsabtastung unabhängig und verwendet jede Eingangsabtastung in jeder Berechnung (klassischer N²-Algorithmus).

Eine übliche FFT verwendet Symmetrien und Muster in der DFT-Definition, um die Berechnung in "Schichten" (log N Schichten) durchzuführen, wobei jede Schicht mit konstantem Zeitbedarf pro Stichprobe einen N log N-Algorithmus erzeugt.

Weitere Einzelheiten:

Eine Möglichkeit, diese Symmetrien zu visualisieren, besteht darin, die DFT als 1 × N-Matrixeingang multipliziert mit einer N × N-Matrix zu betrachten aller Ihrer komplexen Exponentialfunktionen. Beginnen wir mit dem Fall "radix 2". Wir werden die geraden und ungeraden Zeilen der Matrix aufteilen (entsprechend den geraden und ungeraden Eingangsabtastwerten) und sie als zwei separate Matrixmultiplikationen betrachten, die sich addieren, um das gleiche Endergebnis zu erhalten.

Schauen Sie sich nun diese Matrizen an: In der ersten Hälfte ist die linke mit der rechten Hälfte identisch. In der anderen ist die rechte Hälfte die linke Hälfte x −1. Das heißt, wir müssen wirklich nur die linke Hälfte dieser Matrizen für die Multiplikation verwenden und die rechte Hälfte kostengünstig durch Multiplikation mit 1 oder –1 erstellen. Beachten Sie als Nächstes, dass sich die zweite Matrix von der ersten Matrix durch in jeder Spalte identische Faktoren unterscheidet, sodass wir diese herausrechnen und in die Eingabe multiplizieren können, sodass jetzt sowohl gerade als auch ungerade Samples dieselbe Matrix verwenden, jedoch einen Multiplikator erfordern zuerst. Und der letzte Schritt besteht darin, zu beobachten, dass diese resultierende N / 2 × N / 2-Matrix mit einer N / 2-DFT-Matrix identisch ist, und wir können dies immer wieder tun, bis wir eine 1 × 1-Matrix erreichen, bei der die DFT eine Identitätsfunktion ist.

Um über die Basis 2 hinaus zu verallgemeinern, können Sie das Teilen jeder dritten Zeile und das Betrachten von drei Spaltenblöcken oder jedem vierten usw. betrachten.

Für den Fall von Eingaben mit Primzahlgröße gibt es eine Methode zum korrekten Nullstellen, FFT und Abschneiden, die jedoch den Rahmen dieser Antwort sprengt.

Siehe: http://whoiskylefinn.com/MatrixFFT.html

— kylefinn
quelle

Prime FFT , verschiedene FFT . Die Verwendung von Zero-Pad ist nicht die einzige Option. Entschuldigung, ich finde Null-Polster einfach zu stark. Eine kleine Frage, ich verstehe nicht, was Sie mit "jeder Schicht mit konstantem Zeitbedarf pro Probe" meinen, wenn Sie das erklären könnten, wäre es fantastisch.

— Evil

1

Tut mir leid, ich wollte nicht sagen, dass Null-Polsterung DER Weg ist, sondern wollte nur auf weiteres Lesen verweisen. Und "Schicht" bedeutet eine Rekursion oder eine Translation von einer N DFT zu 2 N / 2 DFTs, wobei konstante Zeit pro Abtastung bedeutet, dass dieser Schritt O (N) ist.

— Kylefinn

Bisher scheint diese Beschreibung der Vereinfachung eines komplexen Problems am nächsten zu kommen. Die große Sache, die fehlt, ist jedoch ein Beispiel für diese Matrizen. Würdest du zufällig einen haben?

— Seph Reed

Dies hochgeladen

— kylefinn

1

Die DFT multipliziert eine Brute-Force-N ^ 2-Matrix.

FFTs machen clevere Tricks, indem sie die Eigenschaften der Matrix ausnutzen (degeneralisieren die Matrix multiplizieren), um die Rechenkosten zu senken.

Schauen wir uns zunächst eine kleine DFT an:

W = fft (Auge (4));

x = rand (4,1) + 1j * rand (4,1);

X_ref = fft (x);

X = W * x;

assert (max (abs (X-X_ref)) <1e-7)

Gut, dass wir MATLABs, die die FFTW-Bibliothek aufrufen, durch eine kleine (komplexe) 4x4-Matrixmultiplikation ersetzen können, indem wir eine Matrix aus der FFT-Funktion füllen. Wie sieht diese Matrix aus?

N = 4,

Wn = exp (-1j · 2 · pi / N),

f = ((0: N-1) '* (0: N-1))

f =

 0     0     0     0
 0     1     2     3
 0     2     4     6
 0     3     6     9

W = Wn. ^ F

W =

1 1 1 1

1 -i -1 i

1 -1 1 -1

1 i -1 -i

Jedes Element ist entweder +1, -1, + 1j oder -1j. Dies bedeutet natürlich, dass wir komplexe Multiplikationen vermeiden können. Ferner ist die erste Spalte identisch, was bedeutet, dass wir das erste Element von x immer wieder mit demselben Faktor multiplizieren.

Es stellt sich heraus, dass Kronecker-Tensorprodukte, "Twiddle-Faktoren" und eine Permutationsmatrix, in der der Index entsprechend der gespiegelten binären Repräsentation geändert wird, kompakt sind und eine alternative Perspektive für die Berechnung von FFTs als Satz von Operationen mit geringer Matrixdichte bieten.

Die folgenden Zeilen zeigen eine einfache DIF-Vorwärts-FFT (Decimation in Frequency) mit der Basis 2. Die Schritte mögen mühsam erscheinen, es ist jedoch zweckmäßig, sie für Forward / Inverse FFT, Radix4 / Split-Radix oder Decimation-in-Time wiederzuverwenden, während die Implementierung von In-Place-FFTs in der realen Welt angemessen dargestellt wird. Ich glaube.

N = 4;

x = Randn (N, 1) + 1j * Randn (N, 1);

T1 = exp (-1j · 2 · pi · ([Nullen (1, N / 2), 0: (N / 2-1)]). '/ N),

M0 = kron (Auge (2), fft (Auge (2))

M1 = Kronen (fft (Auge (2)), Auge (2)),

X = Bitreihenfolge (x. '* M1 * Diag (T1) * M0),

X_ref = fft (x)

assert (max (abs (X (:) - X_ref (:))) <1e-6)

CF Van Loan hat ein großartiges Buch zu diesem Thema.

— Knut Inge
quelle

1

Wenn du aus dem Feuer der Weisheit trinken willst, schlage ich vor:

"Schnelle Transformationen - Algorithmen, Analysen, Anwendungen" von Douglas F. Elliott, K. Ramamohan Rao

Es deckt FFT, Hartley, Winograd und Anwendungen ab.

Ein starker Punkt ist, dass es sich bei der FFT um eine Reihe von Faktorisierungen mit geringer Matrixdichte mit Bitumkehrreihenfolge handelt.

— Fat32
quelle