Ich habe eine 2-sekündige Aussprache eines Vokals aufgenommen. Die ersten 0,12 Sekunden des Signals sind unten gezeigt.
Jetzt habe ich ein Auto-Regressive-Modell 8. Ordnung konstruiert, um dieses Signal zu komprimieren. (Eigentlich modelliere ich nur 160 Abtastwerte oder jeweils 0,02 Sekunden.) Die ar
Funktion in der System Identification Toolbox von Matlab kann die Parameter für eine "optimale" Spektrumanpassung schätzen.
Mein Problem ist die Auswahl der stochastischen Eingabe für den Modellfilter. Ich nehme an, es gibt etwas Besseres als weißes Rauschen. Die Periodizität (14 Perioden pro 0,02 Sekunden) lässt mich denken, dass ein Impulszug mit derselben Periode geeignet wäre.
Wenn ja, wie würde ich die Amplitude wählen und wie würde ich die Periodizität finden? ACF- und PSD-Schätzungen sind ziemlich verrauscht. Bin ich überhaupt auf dem richtigen Weg?