18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

442 27. Entwicklung von Anwendungen<br />

definierten Zustandsraum laufen lassen. Je größer dieser Zustandsraum<br />

ist, umso mehr wird es nötig sein, diesen zu beschneiden. Ein geeigneter<br />

Kompromiß zwischen dem Anteil der zuverlässig erkannten Adressen und<br />

dem dafür benötigten Zeitaufwand muß dann je nach Anwendung gefunden<br />

werden.<br />

Dritte Vorgehensweise:<br />

Es ist möglich verschiedene Spezialerkenner neben einem gewöhnlichen<br />

allgemeinen HMM-Erkenner für kontinuierliche Sprache einzusetzen. So<br />

bietet es sich gerade für Adressenerkennung an, besondere Systeme für das<br />

Verstehen von Buchstabiersequenzen [?] und Zahlen zu verwenden. In einem<br />

ersten Schritt müssen in der Aufnahme die Passagen detektiert werden, in<br />

denen buchstabiert wird oder Zahlen gesprochen werden. Dies kann zum<br />

Beispiel durch Vergleich der Konfidenzmaße des Allgemeinerkenners mit<br />

den entsprechenden Maßen der Spezialerkenner geschehen. Wir erwarten<br />

dann auf den Passagen, in denen Zahlen gesprochen werden ein besonders<br />

gutes Verhältnis der Konfidenz des Zahlenerkenners zur Konfidenz des<br />

Allgemeinerkenners. Ähnlich ist es auch bei Buchtabiersequenzen. Die<br />

Erkennungsleistung spezialisierter Erkenner auf den für sie vorgesehenen<br />

Daten ist meist deutlich besser als die eines allgemeinen Erkenners. Wenn<br />

erst einmal auf diese Art die Postleitzahl einer Adresse erkannt ist, kann<br />

dann der Suchraum für die restlichen Komponenten einer Adresse drastisch<br />

reduziert werden. Dabei können auch erkannte Buchstabensequenzen zu<br />

Hilfe genommen werden.<br />

Diese schrittweise Reduzierung des Suchraums kann auf unterschiedlichen<br />

Wegen geschehen. So kann, wenn statt der Postleitzahl der Nachname oder<br />

eine andere Komponente konfident erkannt wurde diese zur Verkleinerung<br />

des Suchraums verwendet werden und die weniger konfidenten Komponenten<br />

dann später bei kleinerem Suchraum mit weniger Verwechslungsgefahr<br />

erkannt werden.<br />

Schließlich bietet es sich an, mehrere der oben aufgeführten Vorgehensweisen<br />

parallel zu verwenden und so eine weitere Quelle zur Konfidenzsteigerung<br />

zu haben. Nur solche Aufnahmen, die nicht durch mindestens zwei Vorgehensweisen<br />

zu identischen Adressen erkannt werden, werden zur manuellen<br />

Transkription weitergereicht.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!