4
Was ist der Unterschied zwischen einer Fourier-Transformation und einer Cosinus-Transformation?
Bei der Spracherkennung führt das Front-End im Allgemeinen eine Signalverarbeitung durch, um eine Merkmalsextraktion aus dem Audiostream zu ermöglichen. Eine diskrete Fourier-Transformation (DFT) wird dabei zweimal angewendet. Das erste Mal ist nach dem Fenster; Danach wird Mel-Binning angewendet und dann eine weitere Fourier-Transformation. Ich habe jedoch festgestellt, dass es in …