www. SATIS. de

(16.08.06)

Tipp-Bereich 56-65: Sprachausgaben, Textlesesysteme
Tipp-Gruppe 61: Spracheingaben

Tipp 61-1: Allgemeines über Spracheingaben

Kurz-Info

Unter "Spracheingabe" versteht man Techniken, gesprochene Sprache auf elektronischem Wege in Text zu verwandeln, also umgekehrt wie bei der Sprachausgabe (Tippgruppen 56-59). In diesem Tipp werden allgemein die Verwendungszwecke von Spracheingaben beschrieben, sowie die heute noch bestehenden Probleme bei der Nutzung.

Beschreibung

1. Spracheingabe, wozu dient sie?
Spracherkennungs-Software dient dazu, gesprochene Sprache in geschriebenen Text bzw. in eine Text-Datei umzuwandeln.  Die Stimme kann direkt vom Mikrofon stammen, aber auch sehr bedingt zum Beispiel aus dem Radio oder von einer Audio-Datei. In dieser Form ist der Text dann bequemer zugänglich und leichter weiterzubearbeiten.
In unserem Zusammenhang interessiert vor allem auch die prinzipielle Möglichkeit, Befehle an den PC über direkte Spracheingabe statt über die Tastatur einzugeben.
Spracheingabe-Software ist relativ preiswert erhältlich, d.h. schon ab unter 100 Euro, da es sich um kein spezielles Hilfsmittel, sondern ein Produkt des algemeinen EDV-Marktes handelt.  Siehe hierzu Tipp 61-2 oder auch die Produktübersicht www.himilis.de, hierin das Ende von Kapitel 4.7 (Sprachausgaben/ Spracheingaben): www.himilis.de/html/47_spr.html.

2. Zur Eignung von Spracheingabe für Behinderte
Als Hilfsmittel für Behinderte bei der Arbeit am PC ist die Texterfassung über Spracheingabe nur begrenzt nützlich. Wichtig ist sie für Körperbehinderte, die die Tastatur nicht bedienen können.
Sehbehinderte und Blinde ziehen bei der normalen PC-Bedienung die Eingabe über Tastatur vor, zumal die Sprachausgabe den Wechsel zwischen Texteingaben und Befehlseingaben schwer auseinanderhalten kann, und weil viele Befehlseingaben schneller und eindeutiger über Tastenkombinationen möglich sind. Dennoch kann die Verwendung einer Spracheingabe verlockend sein, insbesondere wenn man nicht flüssig blind auf der Tastatur schreiben kann.

3. Nutzungsprobleme von Spracheingaben, insbesondere für Sehbehinderte und Blinde
Die formale Analyse gesprochener Sprache ist bis heute nicht fehlerfrei und wird es wohl auch nie ganz werden. Selbst bei sehr korrekter Aussprache gibt es Mehrdeutigkeiten wie "mehr" und "Meer", und das kann ein Computer nur begrenzt sinnentsprechend deuten und demzufolge korrekt schreiben.
Ein verbreitetes Verfahren, die Erkennungsrate zu verbessern, ist, dass der Benutzer der Software vor dem eigentlichen Gebrauch einige Sätze vom Bildschirm ablesen und einsprechen muss, so dass der PC Eigenarten der Stimme erkennen und wiedererkennen kann. Hier haben Sehbehinderte und Blinde das Problem, dass sie diese Sätze möglicherweise nicht flüssig ablesen können, und das ist für das Sprachtraining natürlich nötig.
Ein anderes Verfahren zur korrekten Sinnerfassung und Rechtschreibung ist, dass der PC ein großes Wörterbuch führt, und für die Sprachabschnitte, die er keinem Wort zuordnen kann, eine Liste von ähnlich klingenden Ersatzwörtern anbietet. Das funktioniert ähnlich wie bei der automatischen Rechtschreibprüfung und -korrektur, ist aber meist für Sehbehinderte und Blinde schlecht oder gar nicht bedienbar.
Die Fehlerrate einer Spracherkennungssoftware ist heute nicht mehr sehr hoch (siehe den Testbericht in Tipp 61-2), aber die Korrekturen machen möglicherweise mehr Mühe, als wenn man den Text gleich selbst eintippt.
Zahlreiche Vorgänge bei der Textbearbeitung lassen sich ohnehin kaum über Spracheingabe eindeutig ausdrücken,wenn z.B. ein spezieller Textbereich markiert, gelöscht oder unterstrichen werden soll. Und wenn man sowieso nicht um Tastatureingaben herumkommt, dann verzichtet man vielleicht gern ganz auf die Möglichkeit der Spracheingabe.

4. Fazit
Die Möglichkeit der Spracheingabe in den PC, um Texte zu erstellen oder Befehle einzugeben, hat sich aus erkennbaren Gründen nicht allgemein durchgesetzt, und es ist auch für Sehbehinderte und Blinde eher mit Problemen verbunden als dass es die Arbeit am PC erleichtert.
Andererseits ist Spracherkennungssoftware heute recht preiswert erhältlich, und für bestimmte Zwecke kann es doch hilfreich sein.
Als Beispiel sei das Erfassen längerer Fachtexte aus Medizin, Recht, Naturwissenschaft usw. genannt, wo die Software Spezialwörterbücher benutzen kann und dann in der Fehlerrate dem schreibenden Menschen vielleicht heute sogar schon überlegen ist.
Wenn ein Vortrag, zum Beispiel sehr bedingt aus dem Radio, erst einmal in Text umgewandelt ist, hat man trotzdem eine deutlich verbesserte Möglichkeit, nach bestimmten Wörtern zu suchen oder nachträgliche Änderungen vorzunehmen.
Die Stimme wird vom Computer nach einer "Trainingszeit" von über Mikrofon eingesprochenen Sätzen) relativ fehlerfrei "verstanden", die vorgegebenen Trainingssätze und die Korrektur der verbliebenen Fehler ist allerdings i. a. sehr wenig sehbehindertenfreundlich. Allgemein haben sich Spracheingaben auf dem Markt noch wenig durchgesetzt; das könnte sich aber durchaus noch ändern. Der Nutzen für Sehbehinderte und Blinde hängt stark von bequemer Bedienung und Fehlerfreiheit ab.

© Die Weitergabe der Tipps mit Quellenangabe ist gestattet.