Spracherkennung - MP3-zu-Text-Software [geschlossen]


16

Ich suche ein sprecherunabhängiges Programm (kommerziell oder kostenlos), mit dem ich MP3-Dateien mit Sprachaufzeichnungen (insbesondere Podcasts) in Text umwandeln kann. Ich wollte Dragon Naturally Speaking ausprobieren, aber es scheint, dass es nur das Transkribieren meiner eigenen Sprachaufnahmen unterstützt. Also, was sind die Alternativen?


Kommentar von Avi: Ich glaube nicht, dass das möglich ist - sprecherunabhängig
Ivo Flipse

welches Betriebssystem?
Studiohack

Windows oder Linux.
Pako

Antworten:


7

Dragon Naturally Speaking importiert MP3-Dateien und versucht, sie zu transkribieren. Es zieht es vor, die Spracherkennung auf den einzelnen Sprecher abzustimmen, leistet aber einen fairen Job, ohne ihn abzustimmen. Es würde wahrscheinlich am besten funktionieren, wenn Ihre Podcast-Lautsprecher wie Tom Brokaw klingen.


2
Ich habe Dragon Naturally Speaking ausprobiert, aber für Podcasts mit unbekannten Sprechern hat es einen schrecklichen Job gemacht. Es funktionierte nur nach dem Training des Programms ziemlich gut mit meiner eigenen Stimme.
Pako

1
Kann es auch andere Audiodateien importieren und transkribieren?
Larry Morries

4

Eine mögliche Lösung wäre, dein Video auf Youtube hochzuladen und die automatischen Untertitel zu testen, die du aktivieren kannst. Es ist noch nicht zu genau, aber du kannst die Untertiteldatei herunterladen und sie selbst bearbeiten, wenn das hilft Bei Urheberrechts- / Pirateriethemen für den Song können Sie das Video in Ihrem Profil als privat kennzeichnen, wenn dies überhaupt möglich ist.


1
@studioback: Wird diese Methode von Youtube nur auf das eigene Video angewendet, nicht auf die von anderen hochgeladenen?
StackExchange for All

1
@ Tim: es ist eigentlich für beide.
Studiohack

1
@studiohack: Wie geht das bei Videos, die von anderen hochgeladen wurden? Ich meine, ohne meine eigenen Videos herunterzuladen und hochzuladen?
StackExchange for All

1
Bei den meisten Videos befindet sich unten ein CC-Symbol. Klicken Sie darauf und dann auf die automatische Transkription ...
studiohack


2

Ich würde davor warnen, Dragon Naturally Speaking zu testen. Ich habe einige Skripte auf meinem iPhone mit Jailbreak geschrieben, um alle Voicemail-Dateien von meinem Telefon in einen Ordner auf meinem PC zu kopieren / konvertieren, und den Transkriptionsdienst von Dragon Naturally Speaking ausführen lassen.

Das Ergebnis der Transkription für Dateien mit verschiedenen Lautsprechern war absolut unbrauchbar. Ich habe einige der Open-Source-Alternativen ausprobiert, aber die sprecherunabhängige Spracherkennung scheint immer noch auf sehr kleine Wörterbücher beschränkt zu sein.


1

Ich benutze http://www.voicebase.com mit Podcast und Videos auf Englisch und es funktioniert sehr gut. Es ist 50 Stunden lang kostenlos.

Sie können die Audiotranskription auf RTF, SRT oder PDF herunterladen.

Sie können Maschinentranskriptionen ca. 10-15 Minuten nach dem Hochladen und manchmal auch frühzeitig herunterladen.


1

Open Source: CMU Sphinx

Shareware: http://www.e-speaking.com/ (Windows)

Werbung: Dragon NaturallySpeaking (Windows)

Sie können diese Methode auch ausprobieren, wenn Sie mit osx arbeiten, was mit Audacity und Soundflower möglich ist

Sie könnten auch einige relevante Links für opensource finden, eine andere Shareware, die es wert ist, ausprobiert zu werden, war voxcribecc

Wenn Sie ein .NET-Programmierer sind, können Sie mit dieser Methode Ihr eigenes Kit erstellen


0

Podzinger wäre eine großartige Lösung, aber ich bin mir nicht sicher, ob die Rampe (der neue Name für das Unternehmen, das früher EveryZing war und Podzinger produzierte) den Service nicht mehr kostenlos anbietet ...

http://en.wikipedia.org/wiki/Podzinger

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.