![]() |
www. SATIS. de |
(16.08.06) |
Unter "Spracheingabe" versteht man Techniken, gesprochene Sprache auf elektronischem Wege in Text zu verwandeln, also umgekehrt wie bei der Sprachausgabe (Tippgruppen 56-59). In diesem Tipp werden allgemein die Verwendungszwecke von Spracheingaben beschrieben, sowie die heute noch bestehenden Probleme bei der Nutzung.
1. Spracheingabe, wozu dient sie?
Spracherkennungs-Software dient dazu, gesprochene Sprache in
geschriebenen Text bzw. in eine Text-Datei umzuwandeln. Die
Stimme kann direkt vom Mikrofon stammen, aber auch sehr bedingt zum
Beispiel aus dem Radio oder von einer Audio-Datei. In dieser Form ist
der Text dann bequemer zugänglich und leichter weiterzubearbeiten.
In unserem Zusammenhang interessiert vor allem auch die prinzipielle
Möglichkeit, Befehle an den PC über direkte Spracheingabe
statt über die Tastatur einzugeben.
Spracheingabe-Software ist relativ preiswert erhältlich, d.h.
schon ab unter 100 Euro, da es sich um kein spezielles Hilfsmittel,
sondern ein Produkt des algemeinen EDV-Marktes handelt. Siehe
hierzu Tipp 61-2 oder auch die Produktübersicht www.himilis.de,
hierin das Ende von Kapitel 4.7 (Sprachausgaben/ Spracheingaben):
www.himilis.de/html/47_spr.html.
2. Zur Eignung von Spracheingabe für Behinderte
Als Hilfsmittel für Behinderte bei der Arbeit am PC ist die
Texterfassung über Spracheingabe nur begrenzt nützlich.
Wichtig ist sie für Körperbehinderte, die die Tastatur nicht
bedienen können.
Sehbehinderte und Blinde ziehen bei der normalen PC-Bedienung die
Eingabe über Tastatur vor, zumal die Sprachausgabe den Wechsel
zwischen Texteingaben und Befehlseingaben schwer auseinanderhalten
kann, und weil viele Befehlseingaben schneller und eindeutiger
über Tastenkombinationen möglich sind. Dennoch kann die
Verwendung einer Spracheingabe verlockend sein, insbesondere wenn man
nicht flüssig blind auf der Tastatur schreiben kann.
3. Nutzungsprobleme von Spracheingaben, insbesondere für
Sehbehinderte und Blinde
Die formale Analyse gesprochener Sprache ist bis heute nicht fehlerfrei
und wird es wohl auch nie ganz werden. Selbst bei sehr korrekter
Aussprache gibt es Mehrdeutigkeiten wie "mehr" und "Meer", und das kann
ein Computer nur begrenzt sinnentsprechend deuten und demzufolge
korrekt schreiben.
Ein verbreitetes Verfahren, die Erkennungsrate zu verbessern, ist, dass
der Benutzer der Software vor dem eigentlichen Gebrauch einige
Sätze vom Bildschirm ablesen und einsprechen muss, so dass der PC
Eigenarten der Stimme erkennen und wiedererkennen kann. Hier haben
Sehbehinderte und Blinde das Problem, dass sie diese Sätze
möglicherweise nicht flüssig ablesen können, und das ist
für das Sprachtraining natürlich nötig.
Ein anderes Verfahren zur korrekten Sinnerfassung und Rechtschreibung
ist, dass der PC ein großes Wörterbuch führt, und
für die Sprachabschnitte, die er keinem Wort zuordnen kann, eine
Liste von ähnlich klingenden Ersatzwörtern anbietet. Das
funktioniert ähnlich wie bei der automatischen
Rechtschreibprüfung und -korrektur, ist aber meist für
Sehbehinderte und Blinde schlecht oder gar nicht bedienbar.
Die Fehlerrate einer Spracherkennungssoftware ist heute nicht mehr sehr hoch (siehe den Testbericht in Tipp 61-2), aber die Korrekturen machen
möglicherweise mehr Mühe, als wenn man den Text gleich selbst eintippt.
Zahlreiche Vorgänge bei der Textbearbeitung lassen sich ohnehin
kaum über Spracheingabe eindeutig ausdrücken,wenn z.B. ein
spezieller Textbereich markiert, gelöscht oder unterstrichen
werden soll. Und wenn man sowieso nicht um Tastatureingaben herumkommt, dann verzichtet man vielleicht gern ganz auf die Möglichkeit der
Spracheingabe.
4. Fazit
Die Möglichkeit der Spracheingabe in den PC, um Texte zu erstellen
oder Befehle einzugeben, hat sich aus erkennbaren Gründen nicht
allgemein durchgesetzt, und es ist auch für Sehbehinderte und
Blinde eher mit Problemen verbunden als dass es die Arbeit am PC
erleichtert.
Andererseits ist Spracherkennungssoftware heute recht preiswert
erhältlich, und für bestimmte Zwecke kann es doch hilfreich
sein.
Als Beispiel sei das Erfassen längerer Fachtexte aus Medizin,
Recht, Naturwissenschaft usw. genannt, wo die Software
Spezialwörterbücher benutzen kann und dann in der Fehlerrate
dem schreibenden Menschen vielleicht heute sogar schon überlegen
ist.
Wenn ein Vortrag, zum Beispiel sehr bedingt aus dem Radio, erst einmal
in Text umgewandelt ist, hat man trotzdem eine deutlich verbesserte
Möglichkeit, nach bestimmten Wörtern zu suchen oder
nachträgliche Änderungen vorzunehmen.
Die Stimme wird vom Computer nach einer "Trainingszeit" von über
Mikrofon eingesprochenen Sätzen) relativ fehlerfrei "verstanden",
die vorgegebenen Trainingssätze und die Korrektur der verbliebenen
Fehler ist allerdings i. a. sehr wenig sehbehindertenfreundlich.
Allgemein haben sich Spracheingaben auf dem Markt noch wenig
durchgesetzt; das könnte sich aber durchaus noch ändern. Der
Nutzen für Sehbehinderte und Blinde hängt stark von bequemer
Bedienung und Fehlerfreiheit ab.
© Die Weitergabe der Tipps mit Quellenangabe ist gestattet.