Kann man mit dem Bauch reden? Eine physikalische ... - JavaPsi
Kann man mit dem Bauch reden? Eine physikalische ... - JavaPsi
Kann man mit dem Bauch reden? Eine physikalische ... - JavaPsi
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
4 MODELLGESTÜTZTE SIMULATION DER ERSATZLAUTE 9<br />
For<strong>man</strong>ten zu einer etwas höheren Frequenz. Dieses Ergebnis stimmt <strong>mit</strong> den von [10] in Abb.<br />
10(d) angegebenen For<strong>man</strong>tsprüngen überein.<br />
[b’] substituiert<br />
Das Schließen der Lippen versucht ein <strong>Bauch</strong>redner durch einen Ersatzlaut [b’] zu umgehen. Um<br />
die explosive Charakteristik zu ersetzen, wird die Zungenspitze zunächst ähnlich wie beim [d]<br />
an die vorderen Zähne gepresst (vgl. Abb. 11), bis die Zunge <strong>mit</strong> einer plötzlichen Bewegung<br />
zurückschnellt [15]. Der ansonsten <strong>dem</strong> [b] ähnelnde Sprachtrakt wird so<strong>mit</strong> um den Abstand von<br />
der Lippe bis zu den Zähnen verkürzt, siehe Abb. 9(a). Dies führt wie in Abb. 9(c) zu sehen ist zu<br />
einer sehr guten Annäherung der ersten beiden For<strong>man</strong>ten, die wieder bei ca. F [b′ ]<br />
1 = 500 Hz und<br />
F [b′ ]<br />
2<br />
= 1100 Hz liegen, wobei die zweite deutlich unterhalb der ersten For<strong>man</strong>te anzutreffen ist.<br />
Das Spektrogramm für [b’a] ist in Abb. 10(b) gezeigt. Die ersten beiden For<strong>man</strong>ten liegen etwa<br />
in den ersten 0.06 Zeiteinheiten bei den im Spektrum ebenfalls errechneten 500 Hz bzw. 1000 Hz.<br />
Bei ca. 0.06 Zeiteinheiten verschieben sich die For<strong>man</strong>ten zu etwas höheren Frequenzen und bilden<br />
ebenfalls die in Abb. 10(d) gezeigte typische For<strong>man</strong>tenverschiebung. Im Gegensatz zu [ba] weicht<br />
der dritte For<strong>man</strong>t von [b’a] jedoch von <strong>dem</strong> Muster in Abb. 10(d), nach <strong>dem</strong> eigentlich ein Knick<br />
nach oben statt nach unten erfolgen müsste. Da perzeptiv kaum ein Unterschied zwischen [ba] und<br />
[b’a] auszumachen ist, lässt sich bestätigen, dass für die Lauterkennung <strong>mit</strong> <strong>dem</strong> menschlichen<br />
Gehör lediglich der untere Spektralbereich wesentlich ist.<br />
Vergleich von [b’a] <strong>mit</strong> [ba]<br />
Die beiden For<strong>man</strong>tenbilder Abb. 9(c) und Abb. 8(c) für die Ausgangsstellungen von [b] und [b’]<br />
weisen große Ähnlichkeiten <strong>mit</strong>einander auf. Die ersten beiden For<strong>man</strong>ten haben nahezu die gleiche<br />
Ausprägung und Position, denn F [b′ ] [b]<br />
1 − F 1 = 50 Hz und F [b′ ]<br />
2 − 2[b] 1 = 50 Hz. Auch über den<br />
Zeitverlauf betrachtet sind die ersten beiden For<strong>man</strong>ten von [b’a] und [ba] zueinander nahezu identisch,<br />
da sie in den Spektrogrammen beide etwa an der selben Stelle eine gleich stark ausgeprägte<br />
Sprungstelle nach oben aufweisen und so<strong>mit</strong> beide die Eigenschaften eines [ba] Lautes aufweisen.<br />
Der Ersatzlaut [b’a] bzw. [b’] unterscheidet sich also lediglich im dritten For<strong>man</strong>ten wesentlich vom<br />
nachzubildenden [ba] bzw. [b]. Da für die Lauterkennung jedoch nahezu ausschließlich die ersten<br />
beiden For<strong>man</strong>ten entscheidend sind und dritte und spätere For<strong>man</strong>ten kaum eine Rolle spielen<br />
(vgl. Abschnitt 2.4), werden [b’a] und [ba] als nahezu identische, vom menschlichen Gehör nicht<br />
mehr unterscheidbare Laute wahrgenommen. D.h. es konnte an Hand des Modells tatsächlich der<br />
von <strong>Bauch</strong>rednern verwendete Ersatzlaut für das [b] nachgebildet und als authentisch nachgewiesen<br />
werden.<br />
Vergleich von [b’a] <strong>mit</strong> [da]<br />
Abb. 11 für die Stellungen von [b’] und [d] laut [15], sowie die Vokaltraktstellung für [b’] in Abb.<br />
9(a) könnten den Verdacht entstehen lassen, dass [b’] schlichtweg einem normalen [d] entspräche.<br />
Um dies zu widerlegen wurde <strong>mit</strong> tractsyn und Matlab ein [da] <strong>mit</strong> zugehörigem Spektrogramm<br />
erzeugt, vgl. Abb. 10(c). Die For<strong>man</strong>ten stimmen in etwa <strong>mit</strong> den von [10] in Abb. 10(e) er<strong>mit</strong>telten<br />
For<strong>man</strong>ten für ein [da] überein. Während sich [da] und [b’a] beim ersten For<strong>man</strong>ten noch ähneln,<br />
vollzieht [da] nach ca. 0.05 Zeiteinheiten beim zweiten und dritten For<strong>man</strong>t einen deutlichen Knick<br />
nach unten, während beim [b’a] der zweite For<strong>man</strong>t einen Knick nach oben (wie [ba]) und der dritte<br />
einen Knick nach unten besitzt. Da <strong>dem</strong> zweiten For<strong>man</strong>t eine sehr viel größere Bedeutung für die<br />
Lautcharakteristik zukommt, ähnelt [b’a] einem [ba] also sicherlich wesentlich mehr als einem [da].<br />
4.2 Der Nasal [m]<br />
Beim [m] handelt es sich um einen Nasal <strong>mit</strong> bilabialem Verschluss, d.h. die Lippen müssen geschlossen<br />
sein und der Ton entweicht im Gegensatz zu den Plosivlauten durch den Nasaltrakt, in<br />
den die Luft durch das geöffnete Velum gelangt. Das Schließen der Lippen versucht ein <strong>Bauch</strong>redner<br />
durch einen Ersatzlaut zu umgehen. Für diese Ersatzlaute sind für das [m] in [15] zwei