18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

15.2 One Stage Dynamic Programming 251<br />

streiten. Darüber hinaus gibt es das Problem, daß eine Folge von Silben<br />

oft auf verschiedene Arten zu Wortfolgen zusammengefaßt werden kann.<br />

So wird für silbenbasierte Sprachen neben der Wortfehlerrate oft auch die<br />

Silbenfehlerrate mit angegeben.<br />

Ähnliche Probleme gibt es im Deutschen. Es ist dafür bekannt, daß es<br />

die Zusammensetzung von sehr langen komplexen Wörtern erlaubt. Aus rein<br />

akustischer Sicht ist es meist überhaupt nicht möglich und aus der Sicht<br />

der stochastischen Wortfolgemodellierung in vielen Fällen kaum möglich zu<br />

entscheiden, ob zwei aufeinanderfolgende Wörter ein oder zwei Wörter sind.<br />

Wie schwer ist der Fehler eines Spracherkenners, der Norddeutschland mit<br />

Nord Deutschland verwechselt? Ein derartiger Fehler kann im Englischen<br />

kaum vorkommen.<br />

Bei offiziellen Evaluationen deutschsprachiger Erkenner (gelegentlich<br />

auch für andere Sprachen) werden gerne vor dem Messen der Fehlerrate<br />

Normierungen durchgeführt. Selbst bei genauem Hinhören können oft nicht<br />

einmal <strong>Mensch</strong>en Wie geht’s? von Wie geht es? unterscheiden. Würde ein<br />

Spracherkenner diese Verwechslung machen, so würde das gleich zu einer<br />

Wortfehlerrate von 67% bzw. 100% führen, je nachdem welche Version<br />

die Referenz und welche die Hypothese ist. Daher normiert man vorher<br />

Apostroph-S-Anhängsel sowohl in der Referenz als auch in der Hypothese<br />

zu einem eigenständigen Wort es. Ähnlich geht man vor bei Wortpaaren wie<br />

gerne und gern, oder habe und hab’ vor [?].<br />

Bei Systemen, die über die reine Erkennung hinaus gehen, zum Beispiel<br />

Sprach-zu-Sprach-Übersetzungssysteme oder Dialog- und Auskunftssysteme,<br />

bietet es sich an, ein so genanntes End-to-End-Fehlermaß anzuwenden. Dabei<br />

wird nicht die Wortfehlerrate als wichtigstes Qualitätsmerkmal sondern der<br />

Anteil der korrekt übersetzten Äußerungen oder der Anteil der korrekten<br />

Dialogreaktionen gemessen. Dieses Maß abstrahiert dann automatisch von<br />

weniger wichtigen Fehlern, die durch die nachgeschaltete Übersetzung oder<br />

die Dialogsteuerung wieder problemlos ausgebügelt werden können.<br />

15.2 One Stage Dynamic Programming<br />

Es ist nicht weiter schwierig, den DTW-Algorithmus, wie wir ihn für die Einzelworterkennung<br />

kennengelernt haben, so zu erweitern, daß kontinuierliche<br />

Sprache erkannt werden kann (vgl. Abb. 15.1). Während bei der Verarbeitung<br />

isolierter Wörter für jedes Wort völlig unabhängig von den anderen<br />

ein DTW-Pfad und die dazugehörige Distanz berechet wird, kann man für<br />

kontinuierliche Sprache die ” vielen Referenzachsen“ zu einer Referenzachse

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!