11.08.2013 Aufrufe

Kann man mit dem Bauch reden? Eine physikalische ... - JavaPsi

Kann man mit dem Bauch reden? Eine physikalische ... - JavaPsi

Kann man mit dem Bauch reden? Eine physikalische ... - JavaPsi

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4 MODELLGESTÜTZTE SIMULATION DER ERSATZLAUTE 9<br />

For<strong>man</strong>ten zu einer etwas höheren Frequenz. Dieses Ergebnis stimmt <strong>mit</strong> den von [10] in Abb.<br />

10(d) angegebenen For<strong>man</strong>tsprüngen überein.<br />

[b’] substituiert<br />

Das Schließen der Lippen versucht ein <strong>Bauch</strong>redner durch einen Ersatzlaut [b’] zu umgehen. Um<br />

die explosive Charakteristik zu ersetzen, wird die Zungenspitze zunächst ähnlich wie beim [d]<br />

an die vorderen Zähne gepresst (vgl. Abb. 11), bis die Zunge <strong>mit</strong> einer plötzlichen Bewegung<br />

zurückschnellt [15]. Der ansonsten <strong>dem</strong> [b] ähnelnde Sprachtrakt wird so<strong>mit</strong> um den Abstand von<br />

der Lippe bis zu den Zähnen verkürzt, siehe Abb. 9(a). Dies führt wie in Abb. 9(c) zu sehen ist zu<br />

einer sehr guten Annäherung der ersten beiden For<strong>man</strong>ten, die wieder bei ca. F [b′ ]<br />

1 = 500 Hz und<br />

F [b′ ]<br />

2<br />

= 1100 Hz liegen, wobei die zweite deutlich unterhalb der ersten For<strong>man</strong>te anzutreffen ist.<br />

Das Spektrogramm für [b’a] ist in Abb. 10(b) gezeigt. Die ersten beiden For<strong>man</strong>ten liegen etwa<br />

in den ersten 0.06 Zeiteinheiten bei den im Spektrum ebenfalls errechneten 500 Hz bzw. 1000 Hz.<br />

Bei ca. 0.06 Zeiteinheiten verschieben sich die For<strong>man</strong>ten zu etwas höheren Frequenzen und bilden<br />

ebenfalls die in Abb. 10(d) gezeigte typische For<strong>man</strong>tenverschiebung. Im Gegensatz zu [ba] weicht<br />

der dritte For<strong>man</strong>t von [b’a] jedoch von <strong>dem</strong> Muster in Abb. 10(d), nach <strong>dem</strong> eigentlich ein Knick<br />

nach oben statt nach unten erfolgen müsste. Da perzeptiv kaum ein Unterschied zwischen [ba] und<br />

[b’a] auszumachen ist, lässt sich bestätigen, dass für die Lauterkennung <strong>mit</strong> <strong>dem</strong> menschlichen<br />

Gehör lediglich der untere Spektralbereich wesentlich ist.<br />

Vergleich von [b’a] <strong>mit</strong> [ba]<br />

Die beiden For<strong>man</strong>tenbilder Abb. 9(c) und Abb. 8(c) für die Ausgangsstellungen von [b] und [b’]<br />

weisen große Ähnlichkeiten <strong>mit</strong>einander auf. Die ersten beiden For<strong>man</strong>ten haben nahezu die gleiche<br />

Ausprägung und Position, denn F [b′ ] [b]<br />

1 − F 1 = 50 Hz und F [b′ ]<br />

2 − 2[b] 1 = 50 Hz. Auch über den<br />

Zeitverlauf betrachtet sind die ersten beiden For<strong>man</strong>ten von [b’a] und [ba] zueinander nahezu identisch,<br />

da sie in den Spektrogrammen beide etwa an der selben Stelle eine gleich stark ausgeprägte<br />

Sprungstelle nach oben aufweisen und so<strong>mit</strong> beide die Eigenschaften eines [ba] Lautes aufweisen.<br />

Der Ersatzlaut [b’a] bzw. [b’] unterscheidet sich also lediglich im dritten For<strong>man</strong>ten wesentlich vom<br />

nachzubildenden [ba] bzw. [b]. Da für die Lauterkennung jedoch nahezu ausschließlich die ersten<br />

beiden For<strong>man</strong>ten entscheidend sind und dritte und spätere For<strong>man</strong>ten kaum eine Rolle spielen<br />

(vgl. Abschnitt 2.4), werden [b’a] und [ba] als nahezu identische, vom menschlichen Gehör nicht<br />

mehr unterscheidbare Laute wahrgenommen. D.h. es konnte an Hand des Modells tatsächlich der<br />

von <strong>Bauch</strong>rednern verwendete Ersatzlaut für das [b] nachgebildet und als authentisch nachgewiesen<br />

werden.<br />

Vergleich von [b’a] <strong>mit</strong> [da]<br />

Abb. 11 für die Stellungen von [b’] und [d] laut [15], sowie die Vokaltraktstellung für [b’] in Abb.<br />

9(a) könnten den Verdacht entstehen lassen, dass [b’] schlichtweg einem normalen [d] entspräche.<br />

Um dies zu widerlegen wurde <strong>mit</strong> tractsyn und Matlab ein [da] <strong>mit</strong> zugehörigem Spektrogramm<br />

erzeugt, vgl. Abb. 10(c). Die For<strong>man</strong>ten stimmen in etwa <strong>mit</strong> den von [10] in Abb. 10(e) er<strong>mit</strong>telten<br />

For<strong>man</strong>ten für ein [da] überein. Während sich [da] und [b’a] beim ersten For<strong>man</strong>ten noch ähneln,<br />

vollzieht [da] nach ca. 0.05 Zeiteinheiten beim zweiten und dritten For<strong>man</strong>t einen deutlichen Knick<br />

nach unten, während beim [b’a] der zweite For<strong>man</strong>t einen Knick nach oben (wie [ba]) und der dritte<br />

einen Knick nach unten besitzt. Da <strong>dem</strong> zweiten For<strong>man</strong>t eine sehr viel größere Bedeutung für die<br />

Lautcharakteristik zukommt, ähnelt [b’a] einem [ba] also sicherlich wesentlich mehr als einem [da].<br />

4.2 Der Nasal [m]<br />

Beim [m] handelt es sich um einen Nasal <strong>mit</strong> bilabialem Verschluss, d.h. die Lippen müssen geschlossen<br />

sein und der Ton entweicht im Gegensatz zu den Plosivlauten durch den Nasaltrakt, in<br />

den die Luft durch das geöffnete Velum gelangt. Das Schließen der Lippen versucht ein <strong>Bauch</strong>redner<br />

durch einen Ersatzlaut zu umgehen. Für diese Ersatzlaute sind für das [m] in [15] zwei

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!