18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

28.3 Erkennung spontaner Vortragssprache 459<br />

meint, ist es sinnvoll, die Historie auf Trigramme zu beschränken, um so eine<br />

Übereinstimmung mit dem Sprachmodell des Erkenners zu gewährleisten.<br />

Eine Erweiterung des Verfahrens besteht darin, in Gl. 28.7 nicht nur<br />

die beste Klasse zu berechnen, sondern die besten n Klassen. Das optimale<br />

Ergebnis kann meist dadurch erzielt werden, daß die wichtigen Wörter in<br />

die besten drei bis fünf Klassen eingefügt werden. Durch das Einfügen aller<br />

wichtigen Wörter, auch der Nicht-OOV-Wörter kommen letztere mehrfach<br />

im Sprachmodell vor, einmal als einzelnen Individuum und einmal als<br />

Element einer oder mehrerer Klassen. Dies ist durchaus sinnvoll, denn mache<br />

Fachwörter haben in Vorträgen eine besondere Semantik, die möglicherweise<br />

besser durch die OOV-Klasse erfaßt wird als durch die durchschnittliche<br />

Verwendung des Wortes in den Trainingsdaten des Basis-Modells.<br />

Die in [?] vorgestellen Experimente belegen, daß die Wortfehlerrate des<br />

Spracherkenners auf drei verschiedenen Vorträgen allein durch Hinzufügen<br />

der aus den Vortragsfolien extrahierten OOV-Wörtern (ca. 5% der Vortragssprache)<br />

deutlich gesenkt werden konnte. Das Hinzufügen der ohnehin schon<br />

im Vokabular vorhandenen wichtigen sinntragenden Wörter in ausgewählte<br />

Sprachmodellklassen konnte die Fehlerrate darüber hinaus noch weiter reduzieren<br />

(s. Tab. 28.1).<br />

Vortrag A B C<br />

Ausgangssystem 33.5% 43.7% 31.0%<br />

nur OOV-Wörter hinzugefügt 28.1% 39.7% 29.8%<br />

alle ” wichtigen Wörter“ hinzugefügt 26.8% 37.8% 27.6%<br />

Tabelle 28.1. Fehlerrate des Vortragsverfolgers ohne/mit Sprachmodelladaption<br />

Im gleichen Experiment konnte gezeigt werden, daß auch die Tracking-<br />

Fehlerrate des nicht adaptierten Systems von zwischen 31.8% und 34.7% auf<br />

27.8% bis 31.0% beim adaptierten System verbessert werden konnte.<br />

Für die Leistung eines Vortragsverfolgers ist es selbstverständlich von<br />

größter Bedeutung, wie umfangreich die Informationen auf den Vortragsfolien<br />

sind. Wenn sich dort im wesentlichen nur Bilder und kaum Text befinden,<br />

dann ist die Aufgabe wesentlich schwieriger. Je mehr Text auf den Folien<br />

ist, und je näher der gesprochene Vortrag an den Folien liegt, umso sicherer<br />

arbeitet das System.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!