18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

346 20. Erkennung von Spezialvokabular<br />

Eine Kombination der beiden Hypothesenlisten sieht im einfachsten Falle so<br />

aus, daß durch einfache Multiplikation der Wahrscheinlichkeiten ” gleicher“<br />

Namenshypothesen eine gemeinsame Hypothesenliste gebildet wird, in der<br />

dann mit höherer Wahrscheinlichkeit die korrekte Hypothese die beste ist (s.<br />

Abb. 20.1).<br />

Kontinuierlicher<br />

Erkenner<br />

Göthestraße<br />

Gothaer Straße<br />

Mörikestraße<br />

Gatterstraße<br />

Geraer Straße<br />

Göttersberg<br />

Krötengraben<br />

.<br />

0.19<br />

0.11<br />

0.09<br />

0.07<br />

0.04<br />

0.02<br />

0.01<br />

Buchstabier-<br />

Erkenner<br />

GERAERST...<br />

GEBERTS...<br />

GATTERS...<br />

GOTHAER...<br />

GOTTLIEB...<br />

GÖTHEST...<br />

GABLERS...<br />

.<br />

0.22<br />

0.10<br />

0.09<br />

0.08<br />

0.07<br />

0.05<br />

Abb. 20.1. Kombination von n-besten Hypothesen<br />

Gemeinsame<br />

n-besten Liste<br />

Gothaer Straße 0.0099<br />

Göthestraße<br />

.<br />

0.0095<br />

Geraer Straße 0.0088<br />

Gatterstraße 0.0063<br />

Gottliebstraße 0.0006<br />

Gartenstraße 0.0003<br />

0.04 Gablerstraße 0.0001<br />

Schon bei der Erkennung einzelner Buchstaben (z.B. der B-D-G-Task)<br />

wurde festgestellt, daß einfache Mustervergleicher mittels dynamischen<br />

Programmierens unter anderem deshalb Probleme haben, weil ein großer<br />

zeitlicher Teil der akustischen Evidenz eines Buchstaben nicht für die<br />

Unterscheidung von den anderen hilfreich ist. So sind die zur Unterscheidung<br />

der Buchstaben B, D und G wichtigen Verschlußlaute, die Phoneme b, d und<br />

g, nur sehr kurz, während die zur Unterscheidung unwichtigen Endungen,<br />

das Phonem esehr viel Raum einnimmt und so viel mehr zum Distanzmaß<br />

beiträgt.<br />

Wenn solche Eigenschaften des zu erkennenden Vokabulars vorher<br />

bekannt sind, kann der Erkenner auch daraufhin optimiert werden. Spezielle<br />

Trainingsmethoden oder Parameterräume können die Erkennungsraten<br />

deutlich verbessern.<br />

Eine wichtige Eigenschaft, die für die Erkennung von Buchstabiersequenzen<br />

erfolgversprechend ist, ist ein diskriminatives Training, wobei sich<br />

die Verwendung der Systemparameter vermehrt auf die Unterscheidung der<br />

Buchstaben konzentriert statt auf die möglichst exakte Modellierung jedes<br />

einzelnen Buchstaben unabhängig von den anderen. Immer wenn es um<br />

diskriminatives Training geht drängt sich die Idee der künstlichen neuronalen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!