Wie erhalte ich eine Sprachausgabe aus dem eingegebenen Text über die Befehlszeile?
Auch die Möglichkeit, Sprachrate, Tonhöhe, Lautstärke usw. mit einem einfachen Befehl zu ändern .
Wie erhalte ich eine Sprachausgabe aus dem eingegebenen Text über die Befehlszeile?
Auch die Möglichkeit, Sprachrate, Tonhöhe, Lautstärke usw. mit einem einfachen Befehl zu ändern .
Antworten:
In absteigender Reihenfolge der Popularität :
say konvertiert Text mithilfe der GNUstep-Sprachmaschine in hörbare Sprache.
sudo apt-get install gnustep-gui-runtime
say "hello"
Festival Allgemeines mehrsprachiges Sprachsynthesesystem.
sudo apt-get install festival
echo "hello" | festival --tts
spd-say sendet eine Text-zu-Sprache-Ausgabeanforderung an den Speech-Dispatcher
sudo apt-get install speech-dispatcher
spd-say "hello"
espeak ist ein mehrsprachiger Software-Sprachsynthesizer.
sudo apt-get install espeak
espeak "hello"
sudo pip install gTTS
(Google Text to Speech / github.com/pndurette/gTTS ) gtts-cli "hello" -o hello.mp3
können Sie es mpg123 -
auch weiterleiten . gtts-cli "why, hello there" | mpg123 -
.
spd-say
scheint nicht in der Lage zu sein, tts gleichzeitig zu spielen, nur einmal
espeak
/ spd-say
ist das Beste für Meme (die anderen können das Wort "meme" nicht einmal richtig aussprechen). Am besten kann ich sagen, spd-say
verwendet espeak
als Backend (die Stimmen klingen gleich).
espeak
ist ein schönes kleines Werkzeug.
Ich spiele einfach gerne in einer Befehlszeile damit herum. Möglicherweise liegt ein Konflikt mit Pulseaudio vor, daher verwende ich eine langwierige Version, die es nicht erforderlich macht, sie ordnungsgemäß einzurichten.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help
zeigt Ihnen die Optionen zum Kalibrieren von Lesegeschwindigkeit, Tonhöhe, Stimme usw.
Wenn Sie Ihre Notizen machen, speichern Sie sie als Textdatei und dann:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Sie können dann mit ffmeg et al herumspielen, um dies von PCM auf etwas besser handhabbares wie MP3 oder OGG zu komprimieren. Aber das ist eine andere Geschichte.
Von man spd-say
:
NAME spd-say - Sendet eine Text-zu-Sprache-Ausgabeanforderung an den Sprachverteiler ZUSAMMENFASSUNG spd-say [Optionen] "etwas Text" BESCHREIBUNG spd-say sendet eine Text-zu-Sprache-Ausgabeanforderung an den Speech-Dispatcher-Prozess, der diese verarbeitet und das Ergebnis idealerweise ausgibt zum Audiosystem. OPTIONEN -r, --rate Legen Sie die Sprechgeschwindigkeit fest (zwischen -100 und +100, Standard: 0) -p, --pitch Stellen Sie die Tonhöhe der Rede ein (zwischen -100 und +100, Standard: 0) -i, --Volumen Stellen Sie die Lautstärke (Intensität) der Rede ein (zwischen -100 und +100, Standard: 0)
Daher können Sie Text-to-Speech erhalten, indem Sie folgenden Befehl ausführen:
spd-say "<type text>"
Ex:
spd-say "Welcome to Ubuntu Linux"
Sie können auch Sprachrate, Tonhöhe, Lautstärke usw. einstellen ( siehe Manpage).
spd-say -t female2 "text"
macht es erträglich
Mbrola funktioniert nicht seit dem 11.10.
SVOX (pico) -Tools sind einfach zu installieren, leicht zu verwenden und bieten eine gute Sprachqualität in Ubuntu. Es installieren:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
Noch einfacher ist es, LibreOffice in Kombination mit SVOX (pico) -Tools zu verwenden, indem Sie die Erweiterung "Read Text" installieren und eine "GUI" für diese hervorragende TTS-Software erhalten:
Richten Sie die Optionen der Read Text Extension mit Extras - Add-Ons - Auswahl lesen ... ein. Verwenden Sie / usr / bin / python als externes Programm. Wählen Sie eine Befehlszeilenoption mit dem Token (PICO_READ_TEXT_PY).
Python Google Speach:
pip install google_speech
google_speech "Test the hello world"
Svox Von Android:
apt-get install svox-pico
pico2wave --wave=test.wav "Test the hello world"
play test.wav
Svox Nanotts:
git clone https://github.com/gmn/nanotts.git
cd nanotts
make
./nanotts -v en-US "Test the hello world"
Links - Wiki:
google_speech
auf Ubuntu 18.04 zu installieren und zu verwenden, musste ich installieren python3-pip
und libsox-fmt-mp3
und verwenden pip3 install google_speech
.
Das Folgende ist keine FLOSS-Lösung, aber Sie finden es möglicherweise lohnenswert. (es ist eine Wein - Lösung),
Ich persönlich bin sehr an TTS interessiert, ich benutze es ziemlich oft ... zB. Hören Sie sich einen abwechslungsreichen Diskurs an, bei dem ich nie die Mühe machen würde, mich an andere zu halten (weil ich noch eine Tasse Kaffee brauche ... :)
Ein paar Dinge, die ich auf dem Weg entdeckt habe ... oder sollte ich sagen, Dinge, die ich auf dem Weg nicht entdeckt habe ... Um es klar auszudrücken: Jedes Stück FOSS TTS- Sprachsoftware, das ich ausprobiert habe, ist unterdurchschnittlich und daher ungeeignet für langatmiges Hören ...
Ich benutze derzeit ATnT's NaturalVoices. Es ist nur für Windows (vielleicht den Mac) verfügbar, läuft aber unter wine
Ubuntu. (Es hat eine kleine Glytch, wo ich manchmal auf das Panel klicken muss, wenn ich mich vom Reader entferne ... Es ist eine kleine Glytch Problem im Vergleich zum Vorteil der Sprachqualität von NatualVoices.
Einige andere Dinge, die ich für ein halbwegs vernünftiges Hörerlebnis als praktisch unerlässlich empfunden habe, sind:
Diese TTS-Programme sind nicht intelligent (na ja, vielleicht so intelligent wie ein junger Pavian). Deshalb brauchen sie jede Hilfe, die sie bekommen können. und es gibt ein (und nur ein Reader- Programm, das ich gefunden habe und das dabei sehr ReadPlease (2003 Pro)
hilfreich ist. Die App heißt ... Sie können Wörter und Wortgruppen so ändern, dass sie ausgesprochen werden, wie Sie es möchten ist keineswegs perfekt, aber für mich hat es den Unterschied gemacht, ob der gesamte Prozess nutzbar oder nicht nutzbar ist ...
Die Sprache in Natural Voices ist "okay", aber es ist ein bisschen langweilig. Es gibt auch andere gute Produkte, aber sie sind alle leider für Windows).
Es infiziert manchmal überraschend gut. Aber OMG, anfangs ist es ein Schmerz! .. so ist # 2 * Geduld ... und viele Aktualisierungen Ihrer "Spezialwörter" -Liste ... Mit Geduld meine ich, dass Sie (ich) sich tatsächlich an die Sprachmuster meines Pavians gewöhnt haben:) ... und durch Übrigens habe ich derzeit ungefähr 3000 Wörter, die jetzt "menschlich" genug klingen, dass ich nicht mehr zusammenzucke, wenn ich sie höre.
3 .. "Follow the Bouncing Ball" ... Da die Stimme nie so gut ist wie die eines echten Sprechers, müssen die Dinge manchmal geklärt werden. Das Reader-Programm, das ich verwende, hat eine Funktion, für die ich mich sogar mit seiner klobig aussehenden Oberfläche zufrieden gegeben habe Mitte des Bildschirms. Dies ist von unschätzbarem Wert, wenn Sie vor und zurück sehen und schnell nachlesen möchten, was Sie gerade verpasst haben (daher ist es gut, die aktuelle Linie automatisch zu zentrieren).
Nun, das ist meine Erfahrung. Ich mache jetzt einen Kaffee, und während ich das mache, höre ich mir das an, um zu sehen, wie es "liest". TTS ist überraschend gut zum Abholen Tippfehler (ich mache viele Tippfehler) ...
Wenn etwas so Gutes wie ATnT NaturalVoices im Ubuntu-Repository auftaucht, werde ich es versuchen.
Hier ist ein Link zu einigen Beispielen von Natural Voices : Ich benutze "MIke"
SVOX pico2wave
das ist was ich benutze. Und es klingt natürlich, es ist leicht zu verstehen, es erkennt Einheiten (m, ° C, kg, ...)
Hier ist mein erster Beitrag zu pico2wave
Natürlich klingender Text zu Sprache?
Alles was du tun musst, ist:
Gehen Sie zum Ubuntu Software Center und suchen Sie nach "pico". Sie finden 4 oder 5 Einträge mit "Small Footprint Ling ...". Installieren Sie sie.
Eine mögliche Verwendung von pico2wave ist in meinem ersten Posting beschrieben (folgen Sie dem obigen Link).
Tschüss
Für festival
(die Stimme scheint mir natürlicher zu sein):
sudo apt-get install festival
echo "hello" | festival --tts
Pitch- und Speed-Konfiguration:
erstellen ~/.festivalrc
:
(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100")
(Parameter.set 'Audio_Method 'Audio_Command)
Siehe auch http://www.solomonson.com/content/ubuntu-linux-text-speech
Update: auf einem anderen Ubuntu-Computer ausprobiert. Musste Englisch Sprachmodul Paket installieren, um mit Festival richtig zu arbeiten:
sudo apt-get install festvox-kallpc16k
play
Ist auch ein cli Befehl, der mit sox
Paket kommt:
sudo apt-get install sox
Obwohl Sie bereits eine Antwort angenommen haben, wollte ich erwähnen festival
, was mir auch sehr gefällt. Dieser Beitrag in den Ubuntu-Foren enthält viele Informationen darüber, wie Sie sehr nette Stimmen dafür einrichten können.
Meet espeak-ng
- Ein mehrsprachiger Software-Sprachsynthesizer:
espeak-ng "text to read"
espeak-ng -f "~/file to read"
Es wird eine englische Standardstimme verwendet, es gibt jedoch zahlreiche andere Stimmen für andere Sprachen und sogar Dialekte, die mit espeak-ng --voices
(für alle) oder z. B. espeak-ng --voices=en
(für Englisch) aufgelistet werden können . Sie können -v
zusammen mit der Sprachabkürzung oder dem Dateinamen festgelegt werden, z. B. für Schottisch oder Suaheli:
espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili
Es gibt viele andere Optionen, z. B. -s
für die Geschwindigkeit und -w
zum Schreiben der Ausgabe in eine Wave-Datei, siehe die unten verlinkte Manpage.
espeak-ng
("Ng" für "next generation") ist ein aktiv entwickelter Zweig der ursprünglichen espeak
Sprachsynthesizer-Software , siehe das Kapitel "History" auf Wikipedia . Beide sind aus den offiziellen Quellen über das Paket espeak
bzw. espeak-ng
erhältlich.
Balabolka under Wine funktioniert (für mich) mit SAPI4-Stimmen (SAPI5-Stimmen werden auf meinem Linux-System nicht erkannt). Es kann Dateien öffnen und mit dem Lesen beginnen.
Hier ist der Link zum AppDB-Eintrag von wine für Balabolka: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
Das Tool gTTS eignet sich hervorragend zum Generieren von Audiodateien aus Text. Es verwendet die Text-to-Speech-API von Google Translate und generiert MP3-Dateien.
Da es pip
für die Installation verwendet wird, empfehle ich dringend, Miniconda zu installieren und anschließend conda
eine Umgebung zu erstellen, in der Sie gTTS installieren können. Sie können Miniconda hier herunterladen:
https://docs.conda.io/en/latest/miniconda.html
Das GitHub-Repository für gTTS ist:
https://github.com/pndurette/gTTS
Und die Dokumentation von gTTS finden Sie hier: