Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Weitere Magazine

Empfehlungen

Info

$(LMS\) an der Universität Freiburg - Lehrstuhl Algorithmen ...$

74 KAPITEL 4. SEGMENTIERUNGSVERFAHREN % Frames 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 5 10 15 20 25 [dB] Offset Schwellwert ¢¡¢£ (a) -Histogramm für ein Sprachsignal mit hohem Rauschanteil und insgesamt hoher Aussteuerung % Frames 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 5 10 15 20 25 [dB] Offset Schwellwert ¢¡¢£ (b) -Histogramm für ein Sprachsignal mit niedrigem Rauschanteil und insgesamt hoher Aussteuerung Abbildung 4.3: ¢¡¦£ ¥ -Histogramme für verschiedene Sprecher Dieser erste Durchgang liefert nun eine sehr feine Segmentierung. Selbst bei sehr sorgfältiger Wahl der Schwellwerte macht dieses Verfahren jedoch noch Klassifikationsfehler: 1. Es bleiben kurze Lücken ( ¢ ¢ ) innerhalb von längeren Sprachsegmenten, die eigent- lich als Sprache klassifiziert werden müßten. 2. Es verbleiben Sprachsegmente ( ¢£¢ ), die zu kurz sind, um Wörter zu enthalten. 3. Sprachsegmente werden versehentlich zu spät oder zu früh abgeschnitten. Deshalb wird die zuvor gewonnene Segmentierung in den Durchgängen 2–4 von diesen Klassifikationsfehlern befreit. Im Durchgang 2 werden zu kurze Lücken zwischen Sprachsegmenten entfernt, Durchgang 3 beseitigt zu kurze Sprachsegmente und Durchgang 4 erweitert die verbleibenden Sprachsegmente um jeweils¦ ¢ in beide Richtungen. Dadurch ergeben sich größere Pausen- bzw. Sprachsegmente. Die Ausgabe des PBS-Algorithmus enthält für jedes gefundene Segment den Beginn (in Sek.), die Dauer (in Sek.) und die Klassifikation (0=Pause, 1=Sprache). Die Abbildungen 4.4 und 4.5 verdeutlichen den Ablauf der PBS anhand von Beispieldaten.
4.1. PAUSENBASIERTE SEGMENTIERUNG (PBS) 75 short−term energy Häufigkeit 0.7 0.6 0.5 0.4 0.3 0.2 0.1 Amplitude 1 0.8 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 Sprachsignal −1 0 0.5 1 1.5 2 Zeit (Samples) Windowing und Berechnung der Audio-Features Energie−Verlauf 0 0 500 1000 1500 Frames 400 350 300 250 200 150 100 50 Schwellwert short−term ZCR 0.7 0.6 0.5 0.4 0.3 0.2 0.1 ZCR−Verlauf x 10 5 0 0 500 1000 1500 Frames Schwellwertbestimmung für Endpunkt-Detektion Energie−Histogramm 0 0 5 10 15 20 25 30 35 40 short−term energy [dB] Häufigkeit 120 100 80 60 40 20 ZCR−Histogramm Schwellwert 0 0 5 10 15 20 25 30 35 40 short−term zero crossing rate [dB] Abbildung 4.4: Beispiel für den Ablauf der PBS (Teil 1)
Seite 1 und 2:
ALBERT-LUDWIGS-UNIVERSITÄT FREIBUR
Seite 3:
Vorwort Ich möchte mich bei Prof.
Seite 6 und 7:
6 INHALTSVERZEICHNIS 3 Extraktion v
Seite 8 und 9:
Abbildungsverzeichnis 1.1 Story Seg
Seite 10 und 11:
Tabellenverzeichnis 3.1 Mathematisc
Seite 12 und 13:
12 KAPITEL 1. EINLEITUNG, MOTIVATIO
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Kapitel 2 Grundlagen der Sprachanal
Seite 22 und 23:
22 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 24 und 25: 24 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 40 und 41: Kapitel 3 Extraktion von Audio-Feat
Seite 42 und 43: 42 KAPITEL 3. EXTRAKTION VON AUDIO-
Seite 70 und 71: Kapitel 4 Segmentierungsverfahren I
Seite 72 und 73: 72 KAPITEL 4. SEGMENTIERUNGSVERFAHR
Seite 86 und 87: 86 KAPITEL 5. EVALUATION grobe Segm
Seite 88 und 89: 88 KAPITEL 5. EVALUATION Topic Begi
Seite 90 und 91: 90 KAPITEL 5. EVALUATION Die folgen
Seite 92 und 93: 92 KAPITEL 5. EVALUATION Datei: ga7
Seite 94 und 95: 94 KAPITEL 5. EVALUATION Analyse Ei
Seite 96 und 97: 96 KAPITEL 5. EVALUATION dsaas §
Seite 98 und 99: 98 KAPITEL 5. EVALUATION Präferenz
Seite 100 und 101: 100 KAPITEL 5. EVALUATION Segment-L
Seite 102 und 103: 102 KAPITEL 5. EVALUATION Precision
Seite 104 und 105: Kapitel 6 Zusammenfassung und Ausbl
Seite 106 und 107: Anhang A Beispiel einer Text-Transk
Seite 108 und 109: 108 ANHANG A. BEISPIEL EINER TEXT-T
Seite 110 und 111: Anhang B Segmentierung am Beispiel
Seite 112 und 113: 112ANHANG B. SEGMENTIERUNG AM BEISP
Seite 114 und 115: 114ANHANG B. SEGMENTIERUNG AM BEISP
Seite 116 und 117: Literaturverzeichnis [1] AOF - Auth
Seite 118 und 119: 118 LITERATURVERZEICHNIS [23] OTTMA
Alle anzeigen

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?