2
Wie interpretiere ich den DCT-Schritt im MFCC-Extraktionsprozess?
Bei den meisten Audioverarbeitungsaufgaben ist eine der am häufigsten verwendeten Transformationen MFCC (Mel-Frequenz-Cepstral-Koeffizienten) . Ich kenne hauptsächlich die Mathematik, die hinter dem MFCC steckt: Ich verstehe sowohl den Filterbankschritt als auch die Mel-Frequenzskalierung. Was ich nicht bekomme, ist der DCT-Schritt (Discrete Cosine Transform): Welche Informationen erhalte ich in diesem Schritt? …