Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Weitere Magazine

Empfehlungen

Info

$(LMS\) an der Universität Freiburg - Lehrstuhl Algorithmen ...$

78 KAPITEL 4. SEGMENTIERUNGSVERFAHREN 4.2.1 Der Emphasis-Detection-Algorithmus Der Algorithmus läßt sich in fünf Schritte zerlegen, die nun beschrieben werden sollen: 1. Die zu untersuchende Sprachdatei wird mittels Windowing (vergleiche Kap. ¥ 3.1) in Frames mit einer Länge von ¥ ¢ unterteilt, die sich um jeweils ¢ überlappen. Die Frames werden also in einem Zeitabstand von ©¡ ¢ ¢ erzeugt. In der Original- © gewählt. Allerdings wurde dort ¢ ein Arbeit von ARONS wurde eine Framelänge von anderer PDA verwendet. 2. Für jeden dieser Frames ¥ ermittelt ein PDA die Pitch . 3. Da der Pitch-Umfang für jeden Sprecher unterschiedlich ist, muß ein sprecherunabhängiger Schwellwert ermittelt werden, anhand dessen die Pitch-Aktivität gemessen werden kann. Hierzu wird aus den ermittelten Pitch-Werten ein Histogramm erstellt, das die Variabilität des Sprechers normalisiert. Anhand dieses Histogramms wird ein ¥ ¢£¢ ¢ ¥ Pitch-Schwellwert definiert, der die ¤ obersten der Pitch-Werte auswählt. Genauer: Man beginnt am oberen Ende des Histogramms die Anzahl der Pitch-Werte zu zählen, bis ¤ aller Pitch-Werte erfaßt wurden. Aus dem erreichten "Behälter" des Histogramms wird dann die zugehörige Frequenz und damit der Schwellwert ermittelt. Dieser Schwellwert stellt einen Ausgangspunkt für Experimente dar und kann variiert werden, um eine größere oder kleinere Anzahl von betonten Segmenten zu finden. Abbildung 4.6 zeigt Pitch-Histogramme für Dozenten beiderlei Geschlechts. Der geschlechtsspezifisch unterschiedliche Frequenzbereich ist in den Abbildungen sehr gut zu sehen. 4. In einem Superframe ¢ mit einer Länge von ¥¤ wird nun die Pitch-Aktivität bestimmt. Es wird vereinfachend angenommen, daß die Länge eines Superframes immer ein ganzzahliger Wert ist. Definition 4.1 Ein Superframe ¢ ¡ von Pitch-Werten mit ¡ ¢ ¡ der § £ £¡ ¡ ¦¤ © ¢ ©¡ ¡ Länge ¦¤ ist eine endliche Folge £ ¤ ¡ und ¤ ¢ §¤ © ¢ ©¡ ¡ die Anzahl der Superframes, die sich aus einer Sprachdatei bilden lassen. Pitch-Aktivität©¨ bezeichnet Definition 4.2 Die innerhalb eines Superframes der Länge ¤ ¢ ¢¢ ¥ ¥ ist gleich der Anzahl der Pitch-Werte innerhalb des Superframes, die größer als ein Pitch- Schwellwert sind. bezeichnet ¢£¢ ¢ ¥ ¤ ¢ ¢ ¥ ¨ die Anzahl der Superframes, die sich aus einer Sprachdatei bilden lassen. © ¨ ¤ ¤ ¤
4.2. EMPHASIS-DETECTION-BASIERTE SEGMENTIERUNG (EDBS) 79 0.03 0.025 0.02 0.015 0.01 0.005 0 0.035 0.03 0.025 0.02 0.015 0.01 0.005 0 0 50 100 150 200 250 300 Pitch F0 [Hz] (a) männlich, aus [24] 0 50 100 150 200 250 300 Pitch F0 [Hz] (c) männlich, aus [24] 0.035 0.03 0.025 0.02 0.015 0.01 0.005 0 0.035 0.03 0.025 0.02 0.015 0.01 0.005 0 0 50 100 150 200 250 300 Pitch F0 [Hz] (b) männlich, aus [24] 0 50 100 150 200 250 300 350 Pitch F0 [Hz] (d) weiblich, aus [23] Abbildung 4.6: Pitch-Histogramme für Dozenten (a) männlichen, (b) weiblichen Geschlechts
Seite 1 und 2:
ALBERT-LUDWIGS-UNIVERSITÄT FREIBUR
Seite 3:
Vorwort Ich möchte mich bei Prof.
Seite 6 und 7:
6 INHALTSVERZEICHNIS 3 Extraktion v
Seite 8 und 9:
Abbildungsverzeichnis 1.1 Story Seg
Seite 10 und 11:
Tabellenverzeichnis 3.1 Mathematisc
Seite 12 und 13:
12 KAPITEL 1. EINLEITUNG, MOTIVATIO
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Kapitel 2 Grundlagen der Sprachanal
Seite 22 und 23:
22 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 24 und 25:
Seite 26 und 27:
Seite 28 und 29: 28 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 40 und 41: Kapitel 3 Extraktion von Audio-Feat
Seite 42 und 43: 42 KAPITEL 3. EXTRAKTION VON AUDIO-
Seite 70 und 71: Kapitel 4 Segmentierungsverfahren I
Seite 72 und 73: 72 KAPITEL 4. SEGMENTIERUNGSVERFAHR
Seite 86 und 87: 86 KAPITEL 5. EVALUATION grobe Segm
Seite 88 und 89: 88 KAPITEL 5. EVALUATION Topic Begi
Seite 90 und 91: 90 KAPITEL 5. EVALUATION Die folgen
Seite 92 und 93: 92 KAPITEL 5. EVALUATION Datei: ga7
Seite 94 und 95: 94 KAPITEL 5. EVALUATION Analyse Ei
Seite 96 und 97: 96 KAPITEL 5. EVALUATION dsaas §
Seite 98 und 99: 98 KAPITEL 5. EVALUATION Präferenz
Seite 100 und 101: 100 KAPITEL 5. EVALUATION Segment-L
Seite 102 und 103: 102 KAPITEL 5. EVALUATION Precision
Seite 104 und 105: Kapitel 6 Zusammenfassung und Ausbl
Seite 106 und 107: Anhang A Beispiel einer Text-Transk
Seite 108 und 109: 108 ANHANG A. BEISPIEL EINER TEXT-T
Seite 110 und 111: Anhang B Segmentierung am Beispiel
Seite 112 und 113: 112ANHANG B. SEGMENTIERUNG AM BEISP
Seite 114 und 115: 114ANHANG B. SEGMENTIERUNG AM BEISP
Seite 116 und 117: Literaturverzeichnis [1] AOF - Auth
Seite 118 und 119: 118 LITERATURVERZEICHNIS [23] OTTMA
Alle anzeigen

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?