18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

440 27. Entwicklung von Anwendungen<br />

Auf den ersten Blick erscheint eine Automatische Erkennung solcher<br />

Daten als hoffnungslos. Das Problem ist ähnlich schwierig wie die Bedienung<br />

von Navigationssystemen oder von Web-Browsern. Die riesige Menge an<br />

möglichen Namen – und Adressen bestehen nahezu nur aus Namen und<br />

einigen Zahlen – macht eine Erkennung extrem schwierig. Dennoch ist<br />

es so, daß der Arbeitsaufwand, der normalerweise für die Transkribierer<br />

entsteht wesentlich gesenkt werden kann, wenn ein beachtlicher Anteil der<br />

Adressen mit ausreichender Sicherheit automatisch erkannt werden könnte.<br />

Bei mehreren Millionen Personennamen in Deutschland ist dies allerdings<br />

ohne zusätzliche Maßnahmen mit einem Standard Erkenner nicht möglich.<br />

Nicht nur, daß ein noch so großes Aussprachelexikon viele Namen gar nicht<br />

enthalten würde, auch ein naives Sprachmodell wäre wenig hilfreich. Eine<br />

Erkennungsaufgabe mit einer Perplexität von mehreren Millionen wäre mit<br />

den heutigen Techniken aussichtslos.<br />

Es ist nun aber möglich, auf zweierlei Art das Problem dramatisch<br />

zu erleichtern. Zum einen werden nur diejenigen Aufnahmen automatisch<br />

transkribiert, bei denen eine ausreichend hohe Konfidenz festgestellt wird.<br />

Alle anderen werden verworfen, und an einen menschlichen Transkribierer<br />

verwiesen. Natürlich sollte der Anteil solcher Aufnahmen möglichst gering<br />

sein. Bei der Mehrzahl der Adressen könnte man allerdings zur Senkung der<br />

Perplexität ein Telefonbuch benutzen. Ein allgemeines Sprachmodell, daß<br />

Klassen für Ortsnamen, Postleitzahlen, Straßennamen, Hausnummern, Vorund<br />

Nachnamen verwendet und ansonsten einige Wörter berücksichtigt,<br />

die bei der Formulierung von Adressen verwendet werden können, hat eine<br />

relativ niedrige Perplexität, weit unterhalb der Perplexität von Diktiersystemen,<br />

ja sogar unterhalb der Perplexität von einfachen Dialogsystemen wie<br />

Zugfahrplan- oder Kinoprogramm-Auskunftssystemen. Nur die Perplexität<br />

innerhalb dieser Klassen ist sehr groß. Ohne Verwendung weiteren Wissens,<br />

wäre die Perplexität innerhalb der Nachnamen-Klasse bei mehreren hunderttausend.<br />

Wenn man aber den Ort und sogar die Straße kennt, dann<br />

ist die Auswahl der möglichen Namen schon viel kleiner und bei bekannter<br />

Hausnummer in vielen Fällen sogar eindeutig. Umgekehrt kann aber auch ein<br />

erkannter Name für die Verringerung der Perplexität bei der Erkennung der<br />

Adresse hilfreich sein. Im Grunde hängen alle Komponenten einer Adresse<br />

voneinander ab.<br />

Erste Vorgehensweise:<br />

Jede Komponente wird unabhängig von den anderen Komponenten<br />

erkannt. Die Wahrscheinlichkeit, daß die beste Hypothese des Erkenners<br />

auch gleich die richtige ist, ist äußerst klein. Wenn der Erkenner für jede<br />

Komponente eine n-besten Hypothesenliste liefert, dann ist zu erwarten,<br />

daß die richtige Hypothese im Schnitt einen besseren Rang hat als der

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!