Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2.2. ERZEUGUNG DER MENSCHLICHEN SPRACHE 25<br />
Anregungsquelle Vokaltrakt<br />
Impulsgenerator<br />
Rauschgenerator<br />
stimmhaft<br />
stimmlos<br />
Verstärkungsfaktor<br />
Filter Sprachsignal<br />
Abbildung 2.5: Blockschaltbild eines einfachen technischen Systems <strong>für</strong> die Sprachsynthese<br />
schrieben werden, wie dies bei Vokalen geschieht. Trotzdem sind bei Konsonaten in höheren<br />
Frequenzbereichen bestimmte Frequenzbänder stärker vertreten, die ähnlich wie Formanten wirken.<br />
Bei stimmhaften Konsonanten tritt auch die Grundfrequenz auf, allerdings ist sie gegenüber<br />
den Frequenzanteilen des Rauschens vergleichsweise schwach ausgeprägt.<br />
2.2.4 Modellvorstellung der Spracherzeugung<br />
Die vorangegangenen Abschnitte beschrieben den physiologischen Aufbau des menschlichen<br />
Sprechapparates und der Lautbildung. Es wurde deutlich, daß sowohl der Sprechvorgang als<br />
auch der Aufbau des Sprechapparats sehr komplex ist. Zur Sprachverarbeitung ist es sinnvoll, die<br />
Spracherzeugung durch ein physikalisches Modell zu beschreiben. Hierzu muß ein vereinfachtes<br />
Modell gefunden werden, das technisch nachgebildet werden kann. Ein Modell, das Quelle-<br />
Filter-Modell, wird kurz vorgestellt.<br />
Die Lautanregung geschieht durch den Kehlkopf und die Stimmbänder. Sie erzeugen im Falle<br />
eines stimmhaften Lauts ein periodisches Signal und bei stimmlosen Lauten ein rauschähnliches<br />
Signal. Dieser Teil kann deshalb als Signalquelle, dargestellt durch einen Impulsgenerator, angesehen<br />
werden. Der Vokaltrakt verändert durch seine Widerstands- und Resonanzeigenschaften<br />
das Anregungssignal. Auch die Mundabstrahlung hat Einfluß auf das Anregungssignal und trägt<br />
zu den Eigenschaften des Sprachsignals bei. Diese Beeinflussung des Anregungssignals kann<br />
durch ein variables, akustisches Filter dargestellt werden. Dieses Filter dämpft bestimmte<br />
Frequenzen und verstärkt andere durch Resonanz, abhängig vom gesprochenen Laut.<br />
Das Quelle-Filter-Modell besteht im wesentlichen aus der Anregungsquelle und dem<br />
akustischen Filter. Der Einfluß der Mundabstrahlung wird durch einen Verstärker und durch<br />
die Eigenschaften des Filters nachgebildet (vergleiche Abbildung 2.5). Die Anregungsquelle<br />
dient der Erzeugung stimmhafter sowie stimmloser Laute. Da stimmlose Laute rauschähnliche<br />
Signale sind, werden diese durch einen Rauschgenerator erzeugt. Im Fall stimmhafter Laute<br />
wird ein Signalgenerator eingesetzt, der ein periodisches, sägezahnförmiges Signal erzeugt. Ein<br />
Spracherzeugungssystem enthält je eine Quelle <strong>für</strong> stimmhafte und <strong>für</strong> stimmlose Laute. Es gibt<br />
aber Laute, die gleichzeitig stimmhafte wie stimmlose Anregung erfahren. Um diese erzeugen zu