Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Weitere Magazine

Empfehlungen

Info

$(LMS\) an der Universität Freiburg - Lehrstuhl Algorithmen ...$

72 KAPITEL 4. SEGMENTIERUNGSVERFAHREN berechne short-term energy erstelle und glätte Histogramm ermittle Schwellwert Sprachsignal Windowing berechne short-term ZCR erstelle Histogramm ermittle Schwellwert Endpunkt-Detektion und 1. Segmentierung entferne zu kurze Lücken (
4.1. PAUSENBASIERTE SEGMENTIERUNG (PBS) 73 % Frames 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 Offset Schwellwert 0 0 5 10 15 20 0.5 * x [dB] 25 30 35 40 (a) Energie-Histogramm für ein Sprachsignal mit hohem Rauschanteil und insgesamt hoher Aussteuerung % Frames 0.3 0.25 0.2 0.15 0.1 0.05 Offset Schwellwert 0 0 5 10 15 20 25 30 35 40 45 0.5 * x [dB] (b) Energie-Histogramm für ein Sprachsignal mit niedrigem Rauschanteil und insgesamt hoher Aussteuerung Abbildung 4.2: Energie-Histogramme für verschiedene Sprecher rechnet, welches mit einem 3-Punkt FIR-Average-Filter geglättet wird. Das resultierende Histogramm hat im allgemeinen eine bimodale Verteilung; es besitzt zwei mehr oder weniger weit auseinander liegende Spitzenwerte. Abbildung 4.2 zeigt Beispiele von Energie-Histogrammen, die für zwei verschiedene Sprecher ermittelt wurden. Der erste (am weitesten links liegende) Spitzenwert korrespondiert zu den Hintergrundgeräuschen, der zweite Spitzenwert zur Sprache. Der erste Spitzenwert wird aus dem Histogramm ermittelt und dient fortan zur Festlegung eines Schwellwertes, der Hintergrundgeräusche und Sprache trennt. In Abhängigkeit der Stärke der Hintergrundgeräusche wird ein Offset zum ermittelten Hintergrundgeräuschpegel addiert. Ist dieser Pegel hoch ), wird ein Offset von addiert, andernfalls ein Offset von . ¨¢ ¡ Anhand dieses Schwellwertes und der ¨ ¥ des Frames wird nun entschieden, ob der Frame ¨¢ ¨¢ (¤ Sprache oder Hintergrundgeräusche enthält. Hier setzt nun die oben erwähnte Modifikation des Ansatzes an. In der Arbeit von ARONS wird als Schwellwert für die Nulldurchgangsrate ein fester Wert von 2500 zcr/s verwendet [4]. Da der Hintergrundgeräuschpegel von Aufnahme zu Aufnahme stark variieren kann und der Schwellwert für die Nulldurchgangsrate nicht von mal zu mal manuell angepasst werden soll, wurde der Algorithmus für diese Arbeit modifiziert. Aus ¡ ¥ den -Werten aller Frames wird ein Histogramm erstellt. Dieses Histogramm hat nur einen, ¨ dafür aber sehr ausgeprägten Spitzenwert. Dieser Spitzenwert und die hiermit korrespondierende Nulldurchgangsrate wird zur Schwellwertbestimmung herangezogen. Zu diesem Wert wird noch ein Offset von hinzuaddiert. Dieses Verfahren hat den Vorteil, daß es adaptiv ist. Es ist nicht nötig, den Schwellwert für die Nulldurchgangsrate manuell an das Sprachsignal anzupassen. ¡ Abbildung 4.3 zeigt Beispiele ¨ ¥ von -Histogramme, die für zwei verschiedene Sprecher ermittelt wurden. ¨¢
Seite 1 und 2:
ALBERT-LUDWIGS-UNIVERSITÄT FREIBUR
Seite 3:
Vorwort Ich möchte mich bei Prof.
Seite 6 und 7:
6 INHALTSVERZEICHNIS 3 Extraktion v
Seite 8 und 9:
Abbildungsverzeichnis 1.1 Story Seg
Seite 10 und 11:
Tabellenverzeichnis 3.1 Mathematisc
Seite 12 und 13:
12 KAPITEL 1. EINLEITUNG, MOTIVATIO
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Kapitel 2 Grundlagen der Sprachanal
Seite 22 und 23: 22 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 40 und 41: Kapitel 3 Extraktion von Audio-Feat
Seite 42 und 43: 42 KAPITEL 3. EXTRAKTION VON AUDIO-
Seite 70 und 71: Kapitel 4 Segmentierungsverfahren I
Seite 74 und 75: 74 KAPITEL 4. SEGMENTIERUNGSVERFAHR
Seite 86 und 87: 86 KAPITEL 5. EVALUATION grobe Segm
Seite 88 und 89: 88 KAPITEL 5. EVALUATION Topic Begi
Seite 90 und 91: 90 KAPITEL 5. EVALUATION Die folgen
Seite 92 und 93: 92 KAPITEL 5. EVALUATION Datei: ga7
Seite 94 und 95: 94 KAPITEL 5. EVALUATION Analyse Ei
Seite 96 und 97: 96 KAPITEL 5. EVALUATION dsaas §
Seite 98 und 99: 98 KAPITEL 5. EVALUATION Präferenz
Seite 100 und 101: 100 KAPITEL 5. EVALUATION Segment-L
Seite 102 und 103: 102 KAPITEL 5. EVALUATION Precision
Seite 104 und 105: Kapitel 6 Zusammenfassung und Ausbl
Seite 106 und 107: Anhang A Beispiel einer Text-Transk
Seite 108 und 109: 108 ANHANG A. BEISPIEL EINER TEXT-T
Seite 110 und 111: Anhang B Segmentierung am Beispiel
Seite 112 und 113: 112ANHANG B. SEGMENTIERUNG AM BEISP
Seite 114 und 115: 114ANHANG B. SEGMENTIERUNG AM BEISP
Seite 116 und 117: Literaturverzeichnis [1] AOF - Auth
Seite 118 und 119: 118 LITERATURVERZEICHNIS [23] OTTMA
Alle anzeigen

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?