18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

als die der Silben.<br />

17.1 Suche nach der optimalen Spracheinheit 291<br />

Die gleiche zeitliche Ausdehnung wie Monophone haben auch Diphone<br />

(oft auch fälschlicherweise Biphone genannt). Allerdings nehmen diese<br />

einen kleineren Bereich des Merkmalsraums ein. Man kann Diphone als<br />

phon-indizierte Monophone betrachten. Sie gehören zu den einfachsten<br />

Kontextabhängigen Modellen. Je nachdem, ob ein Monophon von seinem<br />

linken oder rechten Nachbarn abhängt spricht man von Links- oder Rechts-<br />

Diphonen. Links-Diphone Das Wort ” Hallo“ kann beispielsweise mit 4<br />

Rechts-Diphonen modelliert werden. Das erste davon wäre der H-Laut, aber<br />

nicht der allgemeine, sondern derjenige H-Laut, der von einem A gefolgt<br />

wird. Danach kommt derjenige A-Laut, der von einem L-Laut gefolgt wird,<br />

und so weiter. Alle Diphone X(. . .) eines Monophons X nehmen denselben<br />

Teil des Merkmalsraumes ein wie das Monophon X.<br />

Triphone sind kontextabhängige Phone, die sowohl vom linken als auch<br />

vom rechten Nachbarn abhängen. Auch sie haben die gleiche Zeitliche<br />

Ausdehnung wie Monophone und Diphone, unterteilen den Merkmalsraum<br />

aber in noch kleinere Teile. Lange Zeit gehörten Triphone zu den beliebtesten<br />

Kontextbreiten. Erst Mitte, Ende der neunziger Jahre wurde vermehrt noch<br />

breitere Kontexte Verwendet.<br />

Der Begriff Quintphon sollte eher Pentaphon heißen, allerdings hat sich<br />

im Amerikanischen die lateinisch-griechische Mischform eingebürgert und<br />

wurde meistens auch so im Deutschen verwendet. Je breiter der Kontext<br />

wird, umso eher kommt es vor, daß er bis über das Ende des Wortes hinausreicht.<br />

Modelliert man das Wort ” Hallo“ wie in Tab. 17.1 kommt in jedem<br />

Quintphon ein Kontext, der jenseits des Wortes liegt, vor. Solche Kontexte<br />

bedürfen meist einer besonderen Behandlung. Es wäre nicht korrekt an<br />

diesen Stellen anzunehmen, daß dort der Stille-Laut steht. Korrekterweise<br />

müßte man den an dieser Stelle stehenden Laut des Nachbarwortes oder<br />

gar des übernächsten Wortes betrachten. In der Praxis ist die vollständig<br />

korrekte Implementierung so breiter Kontexte viel zu aufwendig um damit<br />

noch in akzeptabler Zeit HMM-Spracherkennung machen zu können. Daher<br />

werden meistens Einschränkungen in kauf genommen, wie zum Beispiel<br />

die Beschränkung der Nachbarwortabhängigkeit auf das erste oder letzte<br />

Phonem eines Wortes. Und dieses wird dann meist auch nur von dem unmittelbaren<br />

Nachbarn im angrenzenden Wort abhängig gemacht. Natürlich sieht<br />

das Erkennungs-HMM bei Berücksichtigung von Wortübergangskontexten<br />

wesentlich komplizierter.<br />

Mit Polyphonen bezeichnet man Phone mit unbegrenztem Kontext.<br />

Praktisch heißt dies bis an die Wortgrenzen. In diesem Fall entspricht die<br />

Aufteilung des Merkmalsraumes demjenigen, den wir auch haben, wenn

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!