Natürlich klingender Text zu Sprache?


85

Ich suche nach einer einfach zu installierenden Text-to-Speech-Software für Ubuntu, die sich natürlich anhört. Ich habe installiert Festival, Gespeakeretc., aber nichts klingt sehr natürlich. Alles sehr synthetisch und schwer zu verstehen.

Irgendwelche Empfehlungen da draußen?


Antworten:


51

SVOX pico2wave

Ein sehr minimalistisches TTS, das besser klingt als Espeak oder Mbrola (meiner Meinung nach). Einige Informationen hier .

Ich verstehe nicht, warum pico2wave im Vergleich zu espeak oder mbrola selten diskutiert wird. Es ist klein, klingt aber sehr gut (natürlich). Ohne Modifikation hören Sie eine natürlich klingende weibliche Stimme.

UND ... im Vergleich zu Mbrola erkennt es Einheiten und spricht es richtig!
Zum Beispiel:

  • 2 ° C → zwei Grad
  • 2m → zwei Meter
  • 2 kg → zwei kg

Nach der Installation benutze ich es in einem Skript:

#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Führen Sie es dann mit dem gewünschten Text aus:

<scriptname>.sh "hello world"

oder lesen Sie den Inhalt einer ganzen Datei:

<scriptname>.sh "$(cat <filename>)"

Das ist alles, um ein leichtes, stabiles TTS auf Ubuntu zu haben.


1
Soweit ich sehen kann, werden nur CLI-Parameter als Eingabe verwendet. Kann ich pico2wave auf irgendeine Weise dazu bringen, Text aus einem Dateinamen zu lesen?
Carlos Eugenio Thompson Pinzón

13
pico2waveist in libttspico-utilsneueren Ubuntu-Versionen enthalten. @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
naught101

1
@ CarlosEugenioThompsonPinzón pico2wave -w a.wav "$(input.txt)"=). Stimmen Sie zu, dass diese CLI-Schnittstelle ein schlechtes Design aufweist: Im Gegensatz zu den meisten CLIs kann die maximale CLI- Argumentlänge des Betriebssystems erreicht werden .
Ciro Santilli新疆改造中心法轮功六四事件

1
@Koen ich weiß es nicht! :-) Wie jedes andere Problem, versuchen Sie ein minimales Beispiel, zum Beispiel zur Herstellung von mitecho {1..1000}
Ciro Santilli新疆改造中心法轮功六四事件

1
@ user49557 Wir sollen nicht die Fragen anderer hijacken, also können Sie vielleicht eine neue Frage erstellen, in der erklärt wird, was genau Sie installiert haben und was schief gelaufen ist, und dann kann ich immer versuchen, Ihnen zu helfen (jedoch keine Garantie) Ich bin kein Experte: P)
Koen

22

Sag es!

Ich glaube, ich habe die beste kostenlose TTS-Software mit einer Google Chrome-Erweiterung namens "SpeakIt" gefunden. Dies funktioniert nur im Chrome-Browser für mich unter Ubuntu. Aus irgendeinem Grund funktioniert es nicht mit Chrom. SpeakIt kommt mit zwei weiblichen Stimmen, die beide im Vergleich zu allem anderen sehr realistisch klingen. Mindestens vier weitere männliche und weibliche Stimmen sind in den Chrome-Erweiterungen aufgeführt, wenn Sie im Chrome Web Store nach "TTS" suchen.

Verwendung : Zur Verwendung auf einer Website. Sie markieren den zu lesenden Text und klicken entweder mit der rechten Maustaste und "SpeakIt" oder auf das SpeakIt-Symbol in der oberen Leiste von Chrome.


Firefox-Benutzer haben auch zwei Möglichkeiten. Suchen Sie in Firefox-Addons nach TTS und finden Sie "Click Speak" und "Text to Voice". Die Stimmen sind nicht so gut wie die Chrome SpeakIt-Stimmen, aber definitiv verwendbar.

Die SpeakIt-Erweiterung verwendet die iSpeech-Technologie und für einen Preis von 20 USD pro Jahr kann die Site Text in MP3-Audiodateien konvertieren. Sie können Text, URLs, RSS-Feeds sowie Dokumente wie TXT, DOC und PDF eingeben und in MP3 ausgeben. Sie können Podcasts erstellen, Audiodaten einbetten usw. Hier ist ein Link und ein Beispiel für deren Audio (Sie wissen nicht, wie lange der Link dauern wird).


3
Leider funktioniert keine der Browseroptionen für PDF-Dateien. Sind Sie auf eine gestoßen, die dies tut? Ich möchte in der Lage sein, Absätze zum Lesen aus einem PDF auszuwählen (dh keine Bits in ein Terminal oder ein anderes einfügen zu müssen)
James Owers

1
Diese Erweiterung funktioniert für mich auf Chrom 50.0.2661.94 mit Debian 8.4 und es ist großartig! Ich mag besonders die englische Frauenstimme. Meine einzige Beschwerde ist, dass es zu lange bei Kommas pausiert.
Mulllhausen

Oft werden Wörter falsch ausgesprochen, und es dauert eine Weile, bis der Text an einen separaten Server gesendet wird, anstatt nur Ihr eigenes System zu verwenden.
Goddard

14

Pico und espeak machen Spaß und sind einfach zu arbeiten, aber sie sind nicht so gut. Die voreingestellten Festivalstimmen sind auch nicht so gut. Festival ist jedoch ein auf Schemata basierendes Sprachsystem, in dem eine Reihe von Forschern viel bessere Plug-In-Stimmen entwickelt haben. Sie können die pico2wave-Qualität von Ubuntu auf Lager leicht übertreffen, da eine dieser Stimmen als fertiges Paket erhältlich ist.

Um das Festival natürlich klingen zu lassen, gehen Sie wie folgt vor:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Sie können dies von der Befehlszeile aus tun, indem Sie -b(oder --batch) verwenden und jeden Befehl in einfache Anführungszeichen setzen:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Sie können andere sehr gute Stimmen aus dem Nitech-Repository erhalten, aber die Installation ist schwierig, und die Standardpfade wurden geändert, sodass die Dateinamenreferenzen in den mitgelieferten Schemadateien möglicherweise manuell bearbeitet werden müssen, um mit Ubuntu zu arbeiten.


2
Übrigens, in Ubuntu 16.04 scheint dieses Paket zu fehlen. Sie können die Deb von Debian herunterladen und installieren, und sie funktioniert einwandfrei : packages.debian.org/sid/all/festvox-us-slt-hts/download sudo dpkg -i Downloads / festvox-us-slt-hts_0.2010.10. 25-2_all.deb
Jon Watte

13

Einfaches Google ™ TTS

Update von der Projektseite (2019-02) : Dieses Projekt wird derzeit nicht gewartet und wird dies auf absehbare Zeit auch bleiben


Da es keine bessere Alternative gibt, habe ich ein Bash-Skript geschrieben , das mit einem Perl-Skript von Michal Fapso zusammenarbeitet , um TTS über Google Translate bereitzustellen. Aus der Projektbeschreibung:

Ziel ist es, eine benutzerfreundliche Oberfläche für die Ausgabe von Text in Sprache über das Sprachsynthesesystem von Google bereitzustellen. Eine Fallback-Option mit pico2wave bietet automatisch eine TTS-Synthese, falls keine Internetverbindung gefunden wird.

Derzeit unterstützt der Wrapper das Lesen von Standardeingaben, Nur-Text-Dateien und der X-Auswahl (hervorgehobener Text).

Die Hauptmerkmale sind:

  • Online-TTS-Synthese über Google Translate
  • Offline-TTS-Synthese über pico2wave
  • unterstützt eine Vielzahl von verschiedenen Sprachen
  • kann von CLI, Textdateien und hervorgehobenem Text lesen
  • unterstützt das Lesen von markiertem Text mit fester Formatierung (zB PDF-Dateien)

Installation und Verwendung sind auf der Projektseite dokumentiert .

Ich wäre froh, wenn Sie es versuchen würden. Fehlerberichte und andere Rückmeldungen sind willkommen!


Dies muss eines der coolsten Projekte sein, die ich je gesehen habe. Einfach wow. 😲

5
Dies wird nicht mehr aufrechterhalten.
Goddard

8

Ich habe für Ubuntu, das von hoher Qualität ist, nach Text zu Sprache gesucht. Da ist gar nichts. Meine Stimmbänder sind gelähmt, deshalb brauchte ich TTS, um meine Ubuntu-Videos mit Sprachanweisungen zu versehen . Hier können Sie kommerzielle, qualitativ hochwertige Linux-Text-to-Speech-Software erwerben . Es ist nur sehr teuer. Am Ende kaufte ich Natural Reader für Windows (funktioniert in Ubuntu unter Wine nicht) für 40 US-Dollar. Vielleicht bekomme ich später das Linux.


Alter, es gibt und ich benutze es wie letzte Woche, es gibt mindestens 5 oder 6 und ich kann für mein ganzes Leben keinen von ihnen finden, ich muss unsere Gemeinschaft lieben
mchid

Textaloud hat Anweisungen, damit das Produkt unter Wein funktioniert. siehe nextup.com/forum/viewtopic.php?t=3349 Ich glaube, dass Cepstral auch einen Linux-Port hat. Ich war nicht in der Lage, meine Lieblingssoftware balabolka zum Laufen zu bringen. Ich habe Windows 10 vor allem für die TTS-Verarbeitung installiert. MS David ist gut und ähnlich wie Cepstral David. Die vorherige ist kostenlos, wenn Sie Windows 10 haben.
Bhikkhu Subhuti

6

Ich habe nach dem am besten klingenden und leicht zu stimmenden Text für Sprachstimmen gesucht. Nachstehend finden Sie eine Liste der meiner Meinung nach Top 5-Produkte in der Reihenfolge der Klangqualität. Die meisten mit diesem Produkt verbundenen Websites verfügen über eine interaktive Demo, mit der Sie selbst bestimmen können.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. AT & T Natürliche Stimmen
  5. CereProc Voices

1
gibt es welche für linux? Ich glaube nicht
Mehdi Khademloo

5

Ich finde Nitech HTS-Stimmen auf dem Festival sehr natürlich und beruhigend gegenüber allen anderen Stimmen, die ich gehört habe. Unter diesem Link erfahren Sie, wie Sie Nitech und andere Sounds mit festival einrichten. Ich habe keine gute Benutzeroberfläche gefunden, mit der ich diese Stimmen konfigurieren kann, aber die Einstellung über festival.scm funktioniert immer noch. Dieser Beitrag ist sehr alt und Sie können das tatsächliche Installationsverzeichnis mit dem Befehl "locate festival" ermitteln


Scheint sehr gut zu sein. Gefunden Demos hier cstr.ed.ac.uk/projects/festival/onlinedemo.html
Iacchus

2
Ja, die Nitech-Stimmen stehen den anderen Festival-Stimmen in nichts nach (mit Ausnahme der CMU-Stimmen, die ebenfalls sehr gut sind). Schade, dass sie schwer zu installieren sind. Es gibt eine gute CMU-Stimme mit einem Standardpaket in Ubunut, das heißt cmu_us_slt_arctic_hts und im Paket festvox-us-slt-hts enthalten ist. Es ist viel besser als Pico oder Espeak!
Jon Watte

5

Kombinieren Sie SVOX-Tools (Pico) mit LibreOffice:

SVOX (Pico) -Tools sind einfach zu installieren und bringen qualitativ hochwertige Stimmen in Ubuntu. Es installieren:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Sie können LibreOffice in Kombination mit SVOX (pico) -Tools verwenden, indem Sie die Erweiterung "Read Text" installieren, und Sie erhalten eine "GUI" für diese hervorragende TTS-Software:

Richten Sie die Optionen der Read Text Extension mit Extras - Add-Ons - Auswahl lesen ... ein. Verwenden Sie / usr / bin / python als externes Programm. Wählen Sie eine Befehlszeilenoption, die das Token (PICO_READ_TEXT_PY) enthält . Möglicherweise möchten Sie einige davon testen .

Jetzt müssen Sie nur noch Text in LO Writer, Calc, Impress oder Draw auswählen und auf das als Symbolleiste hinzugefügte Symbol (ein fröhliches Gesicht mit einem Ballon) klicken.


4

Hier ist, was ich getan habe, um reine natürliche Sprache für PDF- und andere Textdateien zu haben (andere Lösungen sind nicht natürlich oder sie sind nur bezahlte Dienste). Dies ist eigentlich eine Abhilfe mit Chrom oder Chrom, funktioniert aber schnell und einfach.

  1. Installieren Sie SpeakIt! Verlängerung auf Ihrem Chrom oder Chrom.
  2. Installieren Sie PDF Viewer, wenn Sie Chrom verwenden (Chrome verfügt bereits über einen kostenlosen PDF-Viewer ), und aktivieren Sie in den Erweiterungseinstellungen von Chrom die Optionen "In Inkognito zulassen" und "Zugriff auf Datei-URLs zulassen".
  3. Ziehen Sie Ihr PDF in den Browser und legen Sie es dort ab.
  4. Markieren Sie nun einen Text und klicken Sie mit der rechten Maustaste und wählen Sie SpeakIt! So können Sie rein natürlichen Text-to-Speech-Texten zuhören.

Es gibt auch Möglichkeiten, andere Dateien wie .doc und .txt in Chrome zu öffnen und das Gleiche zu tun. Es gibt andere Erweiterungen für Chrome, mit denen Sie PDF-Dateien anzeigen und prüfen können, ob sie besser zu Ihnen passen. Außerdem können Sie alle Arten von Texten in Google Drive hochladen und SpeakIt! um es für dich zu lesen. Eine andere Erweiterung namens "Text sprechen" funktioniert auf die gleiche Weise und hat natürliche Sprache.


Können Sie erläutern, wie Sie SpeakIt dazu bringen, in Google Drive gespeicherte PDF-Dateien zu lesen?
Marco Lackovic

2

Wenn für einen besseren tts Motor der Suche mit dem neuen verwenden Firefox 49 narrativen Modus fand ich pico tts (SVOX) - meinen Liebling Motor TTS.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Wie ändere ich die Standard-Sprachsynthese-Engine systemweit?

Die Leute von Arch Linux haben mich auf den richtigen Weg gebracht:

Deaktivieren Sie das gewünschte Modul und legen Sie es in den Einstellungen für den Sprachverteiler als Standard fest:

# sudo vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Starten Sie den Daemon neu:

# sudo systemctl restart speech-dispatcher.service

ABER, wenn Firefox erneut gestartet wird, passiert nichts. Laut dem obigen Link (Arch Forum Post # 10 und # 16) funktioniert das mit Festival (habe es nicht versucht), aber der Speech-Dispatcher für Pico listet keine verfügbaren Stimmen auf. Es läuft nicht.

Jede Idee da draußen wäre sehr dankbar ;-)


1

Mein Lieblings-Text-to-Speech-Programm heißt Magic English, aber wie Natural Reader von Joe Steiger ist es ein Windows-Programm und ich bin mir nicht sicher, ob es unter Wine laufen wird.

AT & T Natural Voices ist online als Demo verfügbar, aber das ist mehr ein Workaround als eine Lösung ...


1

Einfaches Google ™ TTS

Pico, Mbrola, Cmu, Festival, Flite, alle saugen im Jahr 2017 (Sie waren erstaunlich in den 90er Jahren). Die natürliche Sprache von AT & T (die fantastisch ist) ist nicht mit Linux kompatibel und auch nicht kostenlos. Deshalb verwenden wir Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -

Dies ist ein Duplikat der Glutanimate-Antwort (der Autor dieses Projekts). Außerdem: "Statusaktualisierung: Dieses Projekt wird derzeit nicht gewartet und wird dies auf absehbare Zeit auch bleiben." Er schlägt einige Alternativen vor
Pablo A

1

gTTS

gTTS ( Google Text-to-Speech ), eine Python-Bibliothek und ein CLI-Tool zur Anbindung an die Text-to-Speech-API von Google Translate. Schreibt gesprochene mp3Daten in eine Datei, ein dateiähnliches Objekt (Bytestring) zur weiteren Audiomanipulation oder stdout.

Nachteile : Nur CLI. Müssen online sein, um einen öffentlichen offenen Endpunkt von Google anzufordern.

sudo -H pip install gTTS  # Install

Verwendungszweck

gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -

Dokumentation und weitere Beispiele

Andere

Einige wurden bereits erwähnt


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.