Es gibt signifikante mathematische Annahmen in der DFT (FFT). Das Bedeutsamste in diesem Fall ist, dass Sie eine abgestumpfte Sinustransformation mit unendlich langer Zeit durchführen. Das zweite ist, dass angenommen wird, dass die verkürzten Zeit- und die verkürzten Frequenzsignale modulo-umhüllt sind (zirkular). Die in einer normalen FFT beabstandeten Bins bilden nur aufgrund dieser Annahmen (und des geraden arithmetischen Abtastabstands) eine orthonormale Menge Zeit <-> Frequenzpaare sind daher perfekt umkehrbar.
Die Konstante-Q-Transformation schneidet nicht so gut ab, daher liefert jede praktische Implementierung keine perfekte ortho-normale Paarung. Der Kernel ist eine unendlich lange, exponentiell abklingende Sinuskurve und kann daher nicht den oben angegebenen kreisförmigen Vorteil haben. Wenn Sie nicht abschneiden, bilden sie eine orthonormale Menge.
Die Wavelet-Transformationen haben typischerweise einen Abstand zur Zweierpotenz, was für eine feinkörnige Frequenzschätzung nicht sehr nützlich ist.
Bei dem Vorschlag, eine Standard-Sinus-DFT ungleichmäßig zu verteilen, werden Informationen in dem weit auseinander liegenden Bereich übersehen, während Informationen in dem dicht auseinander liegenden Bereich dupliziert werden. Es sei denn, für jede Frequenz wird eine andere Apodisationsfunktion verwendet ... sehr kostspielig.
Eine praktische Lösung besteht darin, ein Halbspektrum-> 2-mal-dezimiertes Verfahren durchzuführen, um auf Oktaven basierende Unterabschnitte zu erhalten, die einen gewissen Minimax-Schätzfehler pro Oktave erfüllen. Das Verhältnis von Portionsspektrum zu Dezimierung kann auf ein beliebiges Verhältnis eingestellt werden, um die gewünschte Granularität zu erzielen. Trotzdem ziemlich rechenintensiv.