18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

14. Das akustische Modell<br />

In der Spracherkennung sowie in anderen Mustererkennungsproblemen werden<br />

oft mathematische Modelle der realen Welt entwickelt. Typischerweise<br />

werden bei derart komplexen Problemen selten Modelle verwendet, die das<br />

gesamte Problem auf einmal erfassen. Vielmehr wird das Problem in verschiedene<br />

Teilprobleme unterteilt, von denen man annehmen kann, daß sie<br />

einigermaßen orthogonal sind und getrennt modelliert werden können. Eine<br />

solche Aufteilung ist die in die getrennte Modellierung der Akustik und der<br />

Linguistik. In diesem Kapitel wird die Modellierung der Akustik detailliert<br />

behandelt.<br />

14.1 Die Fundamentalformel der Spracherkennung<br />

Die geeignetste mathematische Darstellung des Problems der Spracherkennung<br />

ist die so genannten Fundamentalformel der Spracherkennung:<br />

ˆW = argmaxp(W|X)<br />

(14.1)<br />

W<br />

= argmax<br />

W<br />

= argmax<br />

W<br />

p(X|W) · p(W)<br />

p(X)<br />

(14.2)<br />

p(X|W) · p(W) (14.3)<br />

Die Formel sagt aus, daß die gesuchte Wortfolge ˆ W diejenige ist, deren<br />

Wahrscheinlichkeit bei gegebener Beobachtung X maximal ist. Nach<br />

Umformung mit der Bayes-Regel stellt man fest, daß der Nenner in Gl.<br />

14.2 der Nenner p(X) , also die A-priori-Wahrscheinlichkeit dafür, daß X<br />

überhaupt beobachtet wird, für das Maximieren unerheblich ist. So bleiben<br />

nur noch zwei Faktoren, die gemeinhin als das akustische Modell p(X|W)<br />

und das Sprachmodell p(W) bezeichnet werden. Das Sprachmodell berechnet<br />

die Wahrscheinlichkeit dafür, daß eine Wortfolge W gesprochen wird, unabhängig<br />

davon, wie sie letztendlich artikuliert wird und wie das produzierte<br />

Signal aussieht. Das akustische Modell berechnet die Wahrscheinlichkeit<br />

dafür, daß eine Beobachtung so aussieht wie das beobachtete Signal, wenn<br />

eine gegebene Wortfolge gesprochen wurde.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!