Als «speech» getaggte Fragen

4
Bibliotheken zur Sprachaktivitätserkennung (keine Spracherkennung)
Als Reaktion auf meine vorherige Frage habe ich mich gefragt, ob es Spracherkennungsbibliotheken gibt. Unter Spracherkennung verstehe ich das Übergeben eines Audiopuffers und das Zurückholen eines Indexes, in dem die Sprache beginnt und stoppt. Wenn ich also 10 Sekunden Audio-Sampling bei 44 kHz habe, würde ich eine Reihe von Zahlen …
18 audio  speech 


1
Erkennen Sie menschliche Sprache in Echtzeit-Audio auf Mobiltelefonen
Ich möchte eine Android-App entwickeln. Als Teil der Funktionalität würde die App erfordern, 3-5 Sekunden Audio zufällig abzutasten und es als menschlich sprechend zu klassifizieren oder nicht. Ich verstehe, dass dieses Konzept als Sprachaktivitätserkennung bezeichnet wird. Was wäre der beste Weg, um dies auf einem Mobiltelefon zu implementieren. Ich habe …

2
Welche Eingabe soll für ein AR-Modell eines Vokaltons verwendet werden?
Ich habe eine 2-sekündige Aussprache eines Vokals aufgenommen. Die ersten 0,12 Sekunden des Signals sind unten gezeigt. Jetzt habe ich ein Auto-Regressive-Modell 8. Ordnung konstruiert, um dieses Signal zu komprimieren. (Eigentlich modelliere ich nur 160 Abtastwerte oder jeweils 0,02 Sekunden.) Die arFunktion in der System Identification Toolbox von Matlab kann …

1
Erkennen von Änderungen zwischen Stimme und Musik
Ich habe eine Reihe von Audiodateien, die sowohl Sprach- als auch Musikteile enthalten (denken Sie an Radio). Beispielsweise kann eine bestimmte Datei aus den folgenden Abschnitten bestehen: music --- speech --- music --- speech --- music --- speech --- music Mein Ziel ist es, zu erkennen, wann die Datei zwischen …

3
Wie sehen farbige Geräusche im Zeitbereich aus?
Ich verstehe, dass die Zeitbereichsdarstellung von weißem Rauschen wie Impulse aussieht. Wie sehen farbige Geräusche wie Braun, Rosa usw. aus, wenn wir eine inverse Fourier-Transformation durchführen? Was könnten farbige Rauschquellen sein, die Sprachsignale beeinflussen können?

1
Wie entspricht diese Gleichung der Glättung?
Bitte helfen Sie mir, die Glättung von Daten zu verstehen. Dies ist eine Fortsetzung meiner vorherigen Frage, die hier veröffentlicht wurde . Besonders die Top-Antwort von Junuxx, wo er einen Weg zur Glättung einer Funktion sagtf( x )f(x)f(x) ist: f′[t]=0.1f[t−1]+0.8f[t]+0.1f[t+1]f′[t]=0.1f[t−1]+0.8f[t]+0.1f[t+1] f'[t] = 0.1 f[t-1] + 0.8 f[t] + 0.1 f[t+1] …

1
Sprachkomprimierung - Wie funktioniert der lineare Vorhersagefilter in LPC auf allgemeiner Ebene?
Hallo, ich nehme an einem Multimedia-Systemkurs teil und bereite mich auf meine Prüfung am Dienstag vor. Ich versuche, mich allgemein mit der LPC-Komprimierung zu befassen, aber ich habe Probleme mit dem, was mit dem linearen Vorhersagefilterteil vor sich geht. Dies ist mein bisheriges Verständnis: LPC digitalisiert das analoge Signal und …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.