Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Weitere Magazine

Empfehlungen

Info

$(LMS\) an der Universität Freiburg - Lehrstuhl Algorithmen ...$

68 KAPITEL 3. EXTRAKTION VON AUDIO-FEATURES Aus dieser Definition ¢ ¡ ¥ folgt, daß eine periodische Version der "wahren" ¡ ¥ Größe ist, die bestimmt werden soll. Das Sprachsignal wird im ersten Schritt mittels Windowing in Frames zerlegt. Nun wird der entstandene Frame ¥ künstlich verlängert und mit Nullen aufgefüllt, diesen Vorgang nennt man Zero Padding. Da das short-term real cepstrum unendliche Dauer hat, ist Aliasing unvermeidbar [9]. Es ist aber möglich, die Artefakte klein zu halten. Dies kann bei der Berechnung mit Hilfe der DFT durch das obengenannte Zero Padding erreicht werden. Der nächste Schritt besteht nun darin, die short-term DFT für diesen Frame zu berechnen. Nun wird der Absolutbetrag des entstehenden Spektrums gebildet und anschließend logarithmiert. Das Ergebnis dieser Operation wird nun mittels inverser DFT in den Zeitbereich zurücktransformiert (vergleiche Abbildung 3.17). Das short-term real cepstrum läßt sich effizient mit Hilfe der FFT berechnen. s(n) w(m-n) Zero- padding ¢¡¤£¦¥¤§¨¥ stDFT IDFT Abbildung 3.17: Berechnung der stRC mittels DFT ¤ © Abbildung 3.18 zeigt das Blockdiagramm eines auf dem short-term real cepstrum basierenden Pitch-Detektions-Algorithmus. 3.4.4 Zusammenfassung Dieses Kapitel stellte verschiedene Ansätze zur Bestimmung der Pitch eines Sprachsignals vor. Keiner dieser Ansätze kann perfekte Ergebnisse liefern. In der Einführung dieses Kapitels wurden die Probleme angedeutet. Die tatsächlichen Implementationen beinhalten in der Regel einen erheblichen Nachverarbeitungsaufwand, um die berechneten Pitch-Verläufe den tatsächlichen Verläufen anzugleichen. Es handelt sich bei der Bestimmung der Pitch mit diesen Mitteln also um eine mehr oder weniger gute Schätzung der tatsächlichen vorhandenen Werte. Für die Berechnung der Pitch im Rahmen des pitchbasierten Segmentierungsalgorithmus (vergleiche Kapitel 4.2) kommt der ModifiedACF-PDA zur Anwendung. Da das Postprocessing der in der Literatur beschriebenen Algorithmen sehr aufwendig ist, wurde ein einfacheres Verfahren für diesen PDA entwickelt, das ausreichend gute Resultate erzielt. Der Pitch-Detektions- Algorithmus als Ganzes ergab sich durch das Studium der in der Literatur vorhandenen PDAs und lieferte (subjektiv) die besten Werte. Da keine Referenzdaten vorlagen, kann aber keine genaue Aussage über die Genauigkeit des Verfahrens gemacht werden.
3.4. FUNDAMENTALFREQUENZ (PITCH) ¢¡ Windowing (Hamming) 512 Punkt DFT Log|x| 512 Punkt IDFT Peak- Detektor IPK IPOS V/U basierend auf cepstralem Peak u. short-term ZCR x(n) Segmentierung in Frames short-term ZCR stimmlos stimmhaft, Periode= IPOS Stille-Detektor Stille Abbildung 3.18: Blockdiagramm eines CEP Pitch-Detektors [28] 69
Seite 1 und 2:
ALBERT-LUDWIGS-UNIVERSITÄT FREIBUR
Seite 3:
Vorwort Ich möchte mich bei Prof.
Seite 6 und 7:
6 INHALTSVERZEICHNIS 3 Extraktion v
Seite 8 und 9:
Abbildungsverzeichnis 1.1 Story Seg
Seite 10 und 11:
Tabellenverzeichnis 3.1 Mathematisc
Seite 12 und 13:
12 KAPITEL 1. EINLEITUNG, MOTIVATIO
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19: 18 KAPITEL 1. EINLEITUNG, MOTIVATIO
Seite 20 und 21: Kapitel 2 Grundlagen der Sprachanal
Seite 22 und 23: 22 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 40 und 41: Kapitel 3 Extraktion von Audio-Feat
Seite 42 und 43: 42 KAPITEL 3. EXTRAKTION VON AUDIO-
Seite 70 und 71: Kapitel 4 Segmentierungsverfahren I
Seite 72 und 73: 72 KAPITEL 4. SEGMENTIERUNGSVERFAHR
Seite 86 und 87: 86 KAPITEL 5. EVALUATION grobe Segm
Seite 88 und 89: 88 KAPITEL 5. EVALUATION Topic Begi
Seite 90 und 91: 90 KAPITEL 5. EVALUATION Die folgen
Seite 92 und 93: 92 KAPITEL 5. EVALUATION Datei: ga7
Seite 94 und 95: 94 KAPITEL 5. EVALUATION Analyse Ei
Seite 96 und 97: 96 KAPITEL 5. EVALUATION dsaas §
Seite 98 und 99: 98 KAPITEL 5. EVALUATION Präferenz
Seite 100 und 101: 100 KAPITEL 5. EVALUATION Segment-L
Seite 102 und 103: 102 KAPITEL 5. EVALUATION Precision
Seite 104 und 105: Kapitel 6 Zusammenfassung und Ausbl
Seite 106 und 107: Anhang A Beispiel einer Text-Transk
Seite 108 und 109: 108 ANHANG A. BEISPIEL EINER TEXT-T
Seite 110 und 111: Anhang B Segmentierung am Beispiel
Seite 112 und 113: 112ANHANG B. SEGMENTIERUNG AM BEISP
Seite 114 und 115: 114ANHANG B. SEGMENTIERUNG AM BEISP
Seite 116 und 117: Literaturverzeichnis [1] AOF - Auth
Seite 118 und 119:
118 LITERATURVERZEICHNIS [23] OTTMA
Alle anzeigen

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?