18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

27.3 Beispiel: Adressenerkennung 441<br />

Bekannte Komponenten Anzahl möglicher restlicher Adressen<br />

keine 38114 164<br />

Postleitzahl 11006<br />

Postleitzahl + Hausnummer 3930<br />

Nachnahme 14097<br />

Tabelle 27.1. Perplexitätsreduktion durch vorgegebene Adressenkomponenten<br />

Durchschnitt, also in der besseren Hälfte der n-besten Liste zu finden ist.<br />

Wenn pi(j) die Wahrscheinlichkeit dafür ist, daß das Vokabularwort wj<br />

die Hypothese für die i-te Adreßkompontente ist, dann erhalten wir für die<br />

aus k Komponenten bestehende Gesamthypothese<br />

argmax<br />

j1,j2,...,jk i=1<br />

k<br />

pi(ji) (27.1)<br />

Da es sich bei den pi(j) meistens um Dichten handelt bietet es sich an,<br />

alternativ statt der Dichtewerte den Rang ri(j) für das Wort wj innerhalb<br />

der n-besten Liste der i-ten Komponente zu verwenden und dann<br />

argmin<br />

j1,j2,...,jk i=1<br />

oder<br />

argmin<br />

j1,j2,...,jk<br />

k<br />

ri(ji) (27.2)<br />

k<br />

ri(ji) (27.3)<br />

i=1<br />

oder eine ähnliche Formulierung für die Gesamthypothese zu verwenden.<br />

Zweite Vorgehensweise:<br />

Eine zweite Vorgehensweise ist möglich, insbesondere dann, wenn die<br />

Menge der in Frage kommenden Adressen vor der Erkennung deutlich eingeschränkt<br />

werden kann. Dann ist es möglich, eine kontextfreie Grammatik zu<br />

definieren, die alle erwarteten Adressen abdeckt. Für alle ca. 40 Millionen<br />

Adressen aus allen deutschen Telefonbüchern würde diese Grammatik riesige<br />

Ausmaße annehmen. Wenn es aber möglich ist, weitere Hilfsmittel zu Rate<br />

zu ziehen, wie zum Beispiel die automatisch ermittelbare Rufnummer des<br />

Anrufers, oder zumindest die Vorwahl, oder wenn durch die Natur des angebotenen<br />

Telefondienstes nicht alle möglichen Adressen in Frage kommen, so<br />

daß die zu erzeugende kontextfreie Grammatik ausreichend kompakt ausfällt,<br />

dann kann man einen reinen HMM-Erkenner auf dem durch die Grammatik

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!