Der aktuelle Stand der Technik bei der Audiosignalinterpolation


11

Drei Fragen:

  1. Mit welchen Metriken kann die Qualität der Audiointerpolation objektiv gemessen werden? (aber wenn möglich auch in Bezug auf Psychoakustik)

  2. Wie ist der aktuelle Stand der Audio-Interpolation nach diesen Metriken?

  3. Angenommen, ich würde zwei Dateien aus einer Folge von Noten von virtuellen Instrumenten in zwei Auflösungen rendern und dann ein Upsampling einer Datei mit der hochfrequenten gerenderten Version vergleichen. Mit welcher Software könnte man diese objektiv vergleichen? - Idealerweise unter Verwendung der oben genannten Metriken

Soweit ich bisher feststellen konnte, bieten diese Resampler die beste Qualität

  1. http://www.mega-nerd.com/SRC/
  2. http://sox.sourceforge.net/SoX/
  3. http://www.izotope.com/tech/src/

Eines der Probleme, die diese Resampler zu haben scheinen, ist das Klingeln vor und nach dem Klingeln.

Ich sollte beachten, dass die Signalrekonstruktion von zentralem Interesse ist (sofern dieser Begriff sinnvoll ist), also mehr Upsampling als Downsampling.

Bearbeiten: Die Effizienz der Interpolationszeit ist in diesem Zusammenhang irrelevant.

Viele Grüße, die Neugierigen :-)

Antworten:


5

In Bezug auf das "Problem", das Sie bei Resamplern feststellen:

Viele Resampling-Algorithmen verwenden einen Mehrphasen-Interpolationskern mit linearem Tiefpassfilter. Ein Minimalphasenfilter-Interpolationskern im Gegensatz zu einem Linearphasen-Interpolationskern (mit demselben Frequenzgang) würde beim erneuten Abtasten auf eine höhere Abtastrate weniger Vorklingeln erzeugen, was objektiv als weniger genau, aber möglicherweise psychologisch gemessen werden kann klingt für den Menschen akustisch "besser".

Hier ist ein Hinweis zum Erstellen von Mindestphasenfiltern zum Filtern mit möglicherweise weniger Vorklingeln: http://www.music.columbia.edu/pipermail/music-dsp/2004-February/059372.html

Außerdem kann ein von Remez (Parks-McClellan) entworfenes Tiefpassfilter im Frequenzbereich eine deutliche periodische Welligkeit aufweisen, die auch im Zeitbereich einen Vorringimpuls erzeugen kann. Vielleicht möchten Sie stattdessen einen Sinc mit Fenster oder eine Ableitung eines klassischen Analogfilters für das Tiefpassfilterdesign (letzteres führt normalerweise zu etwas näher an der Mindestphase) für den Resampling-Interpolationskern versuchen.


In Bezug auf Ihren Punkt zu Minimalphasenfiltern: Ich bin mir bei den ersten beiden Links nicht sicher, aber der SRC von iZotope ermöglicht eine stufenlose Phase zwischen Minimum und Linear. Bei Hörtests neigen Menschen dazu, irgendwo zwischen der minimalen Phase und der linearen Phase zu mögen.
Schnarf

Ein Fenster-Sinc-Filter wäre in Bezug auf das Klingeln im Zeitbereich nicht unbedingt besser als ein Equiripple-Filter (über Remez-Austausch entwickelt). Der Klingeleffekt wird als Gibbs-Phänomen bezeichnet und wird beobachtet, wenn Sie ein Signal, das Diskontinuitäten enthält (z. B. eine Rechteckwelle), bandlimitieren. Es wird nicht durch die Frequenzbereichswelligkeit eines Equiripple-Filters verursacht. Der Effekt macht sich stärker bemerkbar, wenn Sie Filter mit sehr scharfem Cutoff verwenden. Durch Erhöhen der Übergangsbreite kann dies etwas gemindert werden.
Jason R

@ Jason R: Sinus im Zeitbereich = Impuls im Frequenzbereich, Position abhängig von der Welligkeitsrate des Sinus. Kehren Sie nun die beiden Domänen um und fügen Sie eine sinusförmige Welligkeit in eine Frequenzbereichsantwort ein. Der Impuls geht in den Zeitbereich, wobei die Position von den Welligkeitseigenschaften abhängt.
hotpaw2

@ hotpaw2: Ich sehe deine Analogie. Ich habe die Absicht Ihres Begriffs "Vorringimpuls" falsch verstanden.
Jason R

Außerdem reproduziert ein glattes Fenster im Zeitbereich seine nicht diskontinuierliche Form um Diskontinuitäten im Frequenzbereich durch Faltung, wodurch das Gibbs-Überschwingen verringert wird.
hotpaw2

6

Es gibt diesen ziemlich gründlichen Vergleich von Resampling-Algorithmen: http://src.infinitewave.ca/

Sie können die Tests sehen, die sie dort verwendet haben. Aliasing ist groß und lässt sich leicht mit einem Spektrogramm eines Sinus-Sweeps visualisieren. Es gibt auch einen Hochfrequenzgang - SRC kann hohe Frequenzen abrollen und Aliasing verursachen. Sie können die Phasenantwort mit dem Impulsantwortdiagramm oder mit einem Diagramm der Phasenantwort visualisieren.


Ja, ich kenne diese hervorragende Ressource. Ich wollte nur alle Parameter kennen, die es wert sind, gemessen zu werden, wenn die Leistung des Resamplings (insbesondere des Upsamplings) gemessen wird.
Bent Rasmussen
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.