Kann man mit dem Bauch reden? Eine physikalische ... - JavaPsi

Weitere Magazine

Empfehlungen

Info

4 MODELLGESTÜTZTE SIMULATION DER ERSATZLAUTE 9 Formanten zu einer etwas höheren Frequenz. Dieses Ergebnis stimmt mit den von [10] in Abb. 10(d) angegebenen Formantsprüngen überein. [b’] substituiert Das Schließen der Lippen versucht ein Bauchredner durch einen Ersatzlaut [b’] zu umgehen. Um die explosive Charakteristik zu ersetzen, wird die Zungenspitze zunächst ähnlich wie beim [d] an die vorderen Zähne gepresst (vgl. Abb. 11), bis die Zunge mit einer plötzlichen Bewegung zurückschnellt [15]. Der ansonsten dem [b] ähnelnde Sprachtrakt wird somit um den Abstand von der Lippe bis zu den Zähnen verkürzt, siehe Abb. 9(a). Dies führt wie in Abb. 9(c) zu sehen ist zu einer sehr guten Annäherung der ersten beiden Formanten, die wieder bei ca. F [b′ ] 1 = 500 Hz und F [b′ ] 2 = 1100 Hz liegen, wobei die zweite deutlich unterhalb der ersten Formante anzutreffen ist. Das Spektrogramm für [b’a] ist in Abb. 10(b) gezeigt. Die ersten beiden Formanten liegen etwa in den ersten 0.06 Zeiteinheiten bei den im Spektrum ebenfalls errechneten 500 Hz bzw. 1000 Hz. Bei ca. 0.06 Zeiteinheiten verschieben sich die Formanten zu etwas höheren Frequenzen und bilden ebenfalls die in Abb. 10(d) gezeigte typische Formantenverschiebung. Im Gegensatz zu [ba] weicht der dritte Formant von [b’a] jedoch von dem Muster in Abb. 10(d), nach dem eigentlich ein Knick nach oben statt nach unten erfolgen müsste. Da perzeptiv kaum ein Unterschied zwischen [ba] und [b’a] auszumachen ist, lässt sich bestätigen, dass für die Lauterkennung mit dem menschlichen Gehör lediglich der untere Spektralbereich wesentlich ist. Vergleich von [b’a] mit [ba] Die beiden Formantenbilder Abb. 9(c) und Abb. 8(c) für die Ausgangsstellungen von [b] und [b’] weisen große Ähnlichkeiten miteinander auf. Die ersten beiden Formanten haben nahezu die gleiche Ausprägung und Position, denn F [b′ ] [b] 1 − F 1 = 50 Hz und F [b′ ] 2 − 2[b] 1 = 50 Hz. Auch über den Zeitverlauf betrachtet sind die ersten beiden Formanten von [b’a] und [ba] zueinander nahezu identisch, da sie in den Spektrogrammen beide etwa an der selben Stelle eine gleich stark ausgeprägte Sprungstelle nach oben aufweisen und somit beide die Eigenschaften eines [ba] Lautes aufweisen. Der Ersatzlaut [b’a] bzw. [b’] unterscheidet sich also lediglich im dritten Formanten wesentlich vom nachzubildenden [ba] bzw. [b]. Da für die Lauterkennung jedoch nahezu ausschließlich die ersten beiden Formanten entscheidend sind und dritte und spätere Formanten kaum eine Rolle spielen (vgl. Abschnitt 2.4), werden [b’a] und [ba] als nahezu identische, vom menschlichen Gehör nicht mehr unterscheidbare Laute wahrgenommen. D.h. es konnte an Hand des Modells tatsächlich der von Bauchrednern verwendete Ersatzlaut für das [b] nachgebildet und als authentisch nachgewiesen werden. Vergleich von [b’a] mit [da] Abb. 11 für die Stellungen von [b’] und [d] laut [15], sowie die Vokaltraktstellung für [b’] in Abb. 9(a) könnten den Verdacht entstehen lassen, dass [b’] schlichtweg einem normalen [d] entspräche. Um dies zu widerlegen wurde mit tractsyn und Matlab ein [da] mit zugehörigem Spektrogramm erzeugt, vgl. Abb. 10(c). Die Formanten stimmen in etwa mit den von [10] in Abb. 10(e) ermittelten Formanten für ein [da] überein. Während sich [da] und [b’a] beim ersten Formanten noch ähneln, vollzieht [da] nach ca. 0.05 Zeiteinheiten beim zweiten und dritten Formant einen deutlichen Knick nach unten, während beim [b’a] der zweite Formant einen Knick nach oben (wie [ba]) und der dritte einen Knick nach unten besitzt. Da dem zweiten Formant eine sehr viel größere Bedeutung für die Lautcharakteristik zukommt, ähnelt [b’a] einem [ba] also sicherlich wesentlich mehr als einem [da]. 4.2 Der Nasal [m] Beim [m] handelt es sich um einen Nasal mit bilabialem Verschluss, d.h. die Lippen müssen geschlossen sein und der Ton entweicht im Gegensatz zu den Plosivlauten durch den Nasaltrakt, in den die Luft durch das geöffnete Velum gelangt. Das Schließen der Lippen versucht ein Bauchredner durch einen Ersatzlaut zu umgehen. Für diese Ersatzlaute sind für das [m] in [15] zwei
4 MODELLGESTÜTZTE SIMULATION DER ERSATZLAUTE 10 Varianten angegeben. In der ersten Variante, im Folgenden [m’] genannt, wird die Lippenschließung dadurch ersetzt, dass die Zunge zunächst kurzzeitig möglichst nahe an die vorderen Zähne gepresst wird, so dass die Schallwellen ausschließlich durch den Nasaltrakt entweichen können. Anschließend wird die Zunge wieder von den Zähnen gelöst. (Vgl. Abb. 11(c)) Die zweite Variante [m”] besteht darin, den hinteren Teil der Zunge gegen das Velum zu drücken und somit die Schallwellen ausschließlich in den Nasaltrakt zu zwingen (vgl. Abb. 11(d)). Der Mundbereich wird bei Nasallauten als Resonanzkörper benutzt. Nun unterscheiden sich [m] und [n] in der Größe (insbesondere Länge) dieses Resonanzkörpers. Schallwellen, die von der Glottis kommen, gelangen zu einem Teil direkt in den Nasaltrakt und zu einem anderen Teil in den Resonanzraum, wo sie reflektiert und zurückgestrahlt werden. Treffen sie auf das Velum, wo sich Nasal- und Mundraum trennen, so kommt es zu einer Überlagerung (vgl. Modell in Abb. B). Dies erkennt man daran, dass es im Spektrum sogenannte Nullstellen, auch Antiresonanzen genannt gibt, d.h. dass bestimmte Frequenzen in dem Signal kaum auftreten. Bei den Wellenlängen, die den Frequenzen dieser Nullstellen entsprechen, kommt es also zu einer destruktiven Interferenz. Dies bedeutet, dass die zurückgestrahlte Welle gegenphasig schwingt. Auf der anderen Seite kommt es auch zu konstruktiver Interferenz, wenn sich die Wellen positiv überlagern. Es gilt hierbei für die Wellenlänge λ: λ = c . (4.1) f Man muss also zwei Faktoren beachten, die das Spektrum von Nasallauten bestimmen. Auf der einen Seite die Geometrie des Vokaltrakts von der Glottis bis zum Velum und dem Nasaltrakt und auf der anderen Seite die Länge des Resonanzkörpers. Die genaue Geometrie des als Resonanzkörper fungierenden Mundraums ist dabei vernachlässigbar, da die für die Lautbildung wesentliche Reflexion erst am Verschluss des Mundraums entsteht und somit nur der Länge des Mundraums eine entscheidende Bedeutung zukommt. Auch durch die Nasennebenhöhlen entstehen Antiformanten, 6 die aufgrund ihrer geringeren Länge jedoch nur die höheren Frequenzen betreffen und bei allen Lauten gleich auftreten. Es wird deshalb nun lediglich die Länge des Mundraums als Resonanzkörper betrachtet. Die Länge des Resonanzkörpers ergibt sich aus der Differenz der gesamten Vokaltraktlänge und dem Abstand zwischen Glottis und Velum, der laut denen für die Simulation verwendeten Daten von [3] ungefähr 8 cm beträgt. Aus den Daten für die gesamte Länge des Vokaltrakts, die aus der Simulation hervorgehen (vgl. Abb. 13(c) und 14(c)), lässt sich nun berechnen: lm = 15, 53 cm − 8 cm = 7, 53 cm l ′ m = 14, 89 cm − 8 cm = 6, 89 cm Bei m ′′ ist die Angabe von l ′′ m irrelevant, da der Abschluss bereits direkt am Velum erfolgt. Die Ähnlichkeit mit dem zu ersetzenden Laut [m] kann hier nur rein perzeptiv über die Sprachausgabe bestätigt werden. Da die Welle in den beiden anderen Fällen zurückreflektiert wird, hat sie die doppelte Weglänge zurückzulegen, wo durch sich als Voraussetzung für eine Nullstelle folgendes ergibt: Durch (4.1) ergibt sich daraus 1 + 2n · λ 2 = l, n ∈ N (4.2) 1 + 2n · λ 2 = 2 · lm, n ∈ N (4.3) 1 + 2n 2 · c f = 2 · lm, n ∈ N f = (1 + 2n) · c , n ∈ N (4.4) 4 · lm Es lässt sich nun die ungefähre Frequenzlage der Antiresonanzen von [m] und [m’] berechnen: f [m] = {1160, 3480, 5800, . . . } Hz, f [m ′ ] = {1270, 3700, 6240, . . . } Hz. 6 Dies erkennt man daran, dass man beim phonetisch korrekten Aussprechen von Nasallauten ein Vibrieren fest- stellen kann, wenn man eine Hand auf den Kopf legt.
Seite 1 und 2: Inhaltsverzeichnis Kann man mit dem
Seite 3 und 4: 2 LAUTENTSTEHUNG BEIM MENSCHEN 2 zu
Seite 5 und 6: 3 VOKALTRAKTMODELLE 4 3 Vokaltraktm
Seite 7 und 8: 3 VOKALTRAKTMODELLE 6 links verscho
Seite 9: 4 MODELLGESTÜTZTE SIMULATION DER E
Seite 13 und 14: 6 ANALYSE VON BAUCHREDNER-AUFNAHMEN
Seite 15 und 16: LITERATUR 14 Benutzung der Lippen i
Seite 17 und 18: A PHONETIK 16 A Phonetik In der Pho
Seite 19 und 20: B ABBILDUNGEN 18 dB 30 20 10 0 -10
Seite 21 und 22: B ABBILDUNGEN 20 (a) ba Spektrogram
Seite 23 und 24: B ABBILDUNGEN 22 (a) Vokaltrakt (b)
Seite 25: B ABBILDUNGEN 24 (a) fa Spektrogram

Kann man mit dem Bauch reden? Eine physikalische ... - JavaPsi

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?