Sprachsteuerung über Desktop-Umgebung


16

Ich möchte ein System aktivieren, das auf Sprachbefehle des Benutzers reagiert und Skripte gemäß dem verbalen Befehl GIVEN ausführt.

Idealerweise möchte ich, dass der Computer ständig zuhört.

Sobald es das Schlagwort "Computer" hört, wird es aktiviert und wartet etwa 10 Sekunden lang auf Befehle.

Einmal aktiv und während es zuhört, möchte ich, dass ein weiterer Satz Modewörter Skripte ausführen kann.

Zum Beispiel....

(Computer ist im Leerlauf) "Computer" (Computer hört sofort zu) "Greifen Sie auf neue NACHRICHTEN zu" (NACHRICHTEN sind das Schlagwort * IGNORES "ACCESS NEW" - Computer führt ein Skript aus und öffnet die Evolution oder Empathie). Es könnte einen für den Browser geben, einen zum Schließen von Fenstern und Anzeigen von Desktops, oder wirklich ein paar Dinge.

Ist das überhaupt möglich?

Antworten:


7

Gnome-Sprachsteuerung

Diese Idee wurde im Rahmen von Google Summer of Code 2007 entwickelt, um einige Funktionen zu entwickeln, die die Benutzerfreundlichkeit von Gnome Desktop verbessern.

Ziel ist die Implementierung eines Desktop-Sprachsteuerungssystems. Das System besteht aus einer Anwendung, die den Audioeingang (Mikrofon) überwacht. Wenn ein signifikantes Audiosignal erkannt wurde, erfasst, verarbeitet und erkennt die Software das Signal und führt die gewünschte Aktion über den Gnome-Desktop aus. Zu einer Reihe von Aktionen könnte gehören: Maximieren, Minimieren, Schließen des aktiven Fensters. ein bestimmtes Programm öffnen; Wechseln von einem Desktop zu einem anderen; unter anderen. GnomeVoiceControl wird in C in Verbindung mit CMU Sphinx implementiert, einem Open-Source-Tool, mit dem Sprache in Text umgewandelt werden kann.

Diashow der Autoren

Leider sieht es so aus, als ob sich nicht viel über die grundlegenden "Ziele" hinaus entwickelt hat - es scheint jedoch einige Aktivitäten zu geben, die in diesem Jahr Unterstützung für neue Sprachen wie Bulgarisch und Türkisch hinzufügen.

Installieren:

sudo apt-get install gnome-voice-control

Schnabeltier

Es gibt ein interessant aussehendes Projekt namens platypus - im Grunde ist es ein Linux-Front-End für Dragon Naturally Speaking, das in Wine ausgeführt wird.

Der Anspruch für diese Anwendung ist, dass sie sogar Windows- oder Linux-Programme und -Skripte starten kann, z. B. "Terminal starten".

VEDICS

Dies ist ein neues Projekt , das besagt, dass es mit der Unity-Oberfläche funktioniert.

Die Projektseite gibt an, dass "run [Programmname]" erkannt wird. Theoretisch können Sie [Programmname] also jedes Skript sein, das Sie ausführen möchten.


Vielen Dank für die außergewöhnlich schnelle Antwort. Ich habe von diesem Programm gehört und es installiert, aber es scheint nicht über die Konfiguration hinauszugehen - es heißt nur "config". Ich bin überrascht, dass an dieser Front nicht viel gearbeitet wurde. Gibt es vielleicht ein gleichwertiges Fenster, das ich mit Wein betreiben könnte?
BorgDomination

1
Die ältere Version von Gnome Voice, die synaptisch ist, lieferte die gleichen Ergebnisse. Ich habe das Neueste von der Website ausprobiert und es schien weiter zu gehen, aber ich habe es nie richtig zum Laufen gebracht. Die manuellen Abhängigkeiten waren ein Schmerz für mich.
Kendrick

3

Simon hört zu

Dies ist ein Open-Source-Projekt, das darauf abzielt, Maus und / oder Tastatur durch Spracherkennung zu ersetzen, die ursprünglich für körperbehinderte Menschen entwickelt wurde.

Es gibt ein ppa, von dem aus wir die Anwendung installieren können: ppa: grasch-simon-listens / simon


funktioniert simon nur mit kde? Es sieht wirklich fantastisch aus und ich habe es installiert, kann es aber nicht mit der Gnome-Shell zum Laufen bringen. speziell Fensterverwaltung. Wenn ich zum Beispiel alle Fenster anzeigen möchte, wird das in kde env und gnome env anders funktionieren, oder?
Joshua Robison

1
Abhängigkeiten sollten aufgelöst werden, wenn Sie auf Ubuntu <= 12.04 vom ppa aus installieren, aber ich habe es in letzter Zeit nicht versucht, und ich habe auch keine Ahnung, wie es die GNOME-Shell stören könnte. Es gibt (noch) keine Version für 12.10.
Takkat

3

Google2Ubuntu

Google2Ubuntu ist ein Tool, mit dem Sie Ihren Computer mithilfe von Sprachbefehlen über die Google-Spracherkennungs-API steuern können.

Führen Sie die folgenden Befehle auf dem Terminal aus, um zu installieren google2Ubuntu.

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

Quelle


1

Linux Spracherkennung

Es wurde für Linux-Distributionen entwickelt, ist sehr konfigurierbar und einfach zu erweitern, unterstützt benutzerdefinierte Wörterbücher, kontextbasierte Erkennung, Diktiermodus und konfigurierbare Makros.

Um Linux Speech Recognition zu installieren, gehen Sie zur GitHub- Seite des Projekts . Laden Sie die ZIP-Datei herunter und extrahieren Sie sie.

Dann installieren Sie einige Abhängigkeiten:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

Öffnen Sie den extrahierten Ordner (Palaver-master) im Terminal und führen Sie das Setup aus:

cd /~Path-to-folder~/Palaver-master/
./setup

Jetzt müssen Sie nur noch einen Hotkey zuweisen, um die Aufzeichnung zu aktivieren. Gehen Sie dazu zu Systemeinstellungen ...> Tastatur> Verknüpfungen> Benutzerdefinierte Verknüpfungen. Klicken Sie auf die Plus-Schaltfläche, um eine Verknüpfung hinzuzufügen, und geben Sie den Namen Spracherkennung ein.

/~Path-to-folder~/Palaver-master/hotkey

Klicken Sie auf Übernehmen, klicken Sie auf die Verknüpfung und weisen Sie dann einen Hotkey zu, um die Spracherkennung zu aktivieren.

Beachten Sie, dass noch kein stabiler Build veröffentlicht wurde. Erwarten Sie also nicht, dass Befehle in dieser Phase voll funktionsfähig sind. Viele Ausdrücke werden erkannt, aber es werden keine wirklichen Aktionen ausgeführt.



0

Snips.ai

Habe es gerade auf Pi3 ausprobiert - scheint potentielle
Runs im Docker zu haben

https://snips.ai/


1
Willkommen bei Ask Ubuntu. Bitte beachten Sie, dass Sie dies in Ihrem Beitrag ausdrücklich angeben müssen, wenn Sie mit diesem Tool verbunden sind. Siehe Wie man kein Spammer ist .
Glorfindel

1
Auf der offiziellen Website heißt es: Open Source: Wir sind bestrebt, Snips im Laufe der Zeit zu öffnen , daher lohnt es sich, Snips auszuprobieren.
Karl
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.