18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

28.3 Erkennung spontaner Vortragssprache 457<br />

Die Untersuchung der Präsentationsfolien und Dokumente verfolgt zwei<br />

Ziele. Das eine ist die Extraktion der wichtigen sinntragenden Wörter, das<br />

andere die Erzeugung einer textuellen Repräsentation (einfaches ASCII) der<br />

Dokumente, die dann dazu verwendet werden kann, eine Korrelation mit<br />

der Ausgabe des Spracherkenners zu berechnen. So weiß das System immer,<br />

über welchen Teil der Präsentation der Sprecher gerade spricht.<br />

Die extrahierten Wörter werden mit dem großen Hintergrundlexikon des<br />

Spracherkenners verglichen. Für jedes sinntragende Wort wird ein tfidf-Wert<br />

berechnet. Schließlich werden alle OOV-Wörter sowie die Wörter, deren<br />

tfidf-Wert über dem Durchschnitt liegt, als ” wichtige“ Wörter angesehen.<br />

Danach wird jedes wichtige Wort aus den Präsentationsdokumenten für<br />

eine Anfrage bei einer Internet-Suchmaschine verwendet. Die höchstrangigen<br />

m WWW-Seiten werden heruntergeladen und analysiert. Alle Fünfgramme<br />

deren mittleres Wort ein wichtiges Wort ist, werden extrahiert und abgespeichert.<br />

Zusätzlich können Anfragen gemacht werden, in denen mehrere<br />

(eventuell alle) wichtigen Wörter vorkommen. Bei solchen Anfragen kann<br />

erwartet werden, daß die gefundenen WWW-Seiten eine größere Ähnlichkeit<br />

mit dem Thema des Vortrags haben.<br />

Das primäre Ziel des Entwurfs des Sprachmodells ist es, zu ermöglichen<br />

daß neue Wörter möglichst einfach integriert werden können. Dafür eignet<br />

sich ein klassenbasiertes Trigramm-Sprachmodell. In [?] wird das Basis-<br />

Sprachmodell nur auf einem Vokabular besteht aus den häufigsten 2/3 der<br />

Wörter des Trainingskorpus trainiert. Die selteneren 1/3 der Trainingswörter<br />

werden mit Hilfe eines Ballungsverfahrens [?] zu einer Menge von Wortklassen<br />

zusammengeballt. Aus der Sicht des Basis-Sprachmodells handelt es sich<br />

bei den Klassen also um Klassen von OOV-Wörtern.<br />

Von den Klassen werden nur die Z größten verwendet. Alle kleineren<br />

Klassen werden in der Annahme, sie könnten eventuell durch zu wenige<br />

Trainingsdaten schlecht geschätzt sein, verworfen. Daraufhin wird ein<br />

klassenbasiertes Sprachmodell, bestehend aus dem Basis-Sprachmodell und<br />

den Klassen, erzeugt.<br />

Die entstehenden Klassen enthalten typischerweise Wörter gleicher Wortart,<br />

oder gleicher Flexionsform, aber auch Namen von Personen oder auch<br />

thematisch zusammenhängende Wörter, wie zum Beispiel in Abb. 28.7.<br />

Ein solches Sprachmodell ist nun dazu vorbereitet, neue Wörter aufzunehmen,<br />

indem sie als zusätzliches Element in eine passende Klasse eingefügt<br />

werden. Das Finden einer passenden Klasse geschieht wie folgt:

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!