28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3.4. FUNDAMENTALFREQUENZ (PITCH) ¢¡<br />

Peak bei ¡ besitzen, aber aufgrund der Zufallseigenschaften wird <br />

¡ ¡ ¢¡<br />

sehr schnell<br />

¢<br />

gegen Null gehen. ©© ¢¡<br />

Nur wird große Peaks<br />

¡<br />

<strong>für</strong><br />

¢<br />

enthalten. Dieses Verhalten erlaubt die<br />

Bestimmung der Präsenz und der Periode des periodischen Signals ¤ , welches von<br />

einem Interferenzsignal gestört ist. Im Fall von Sprachsignalen ist die Bestimmung der<br />

Periode aufgrund der oben genannten Probleme leider nicht so einfach möglich.<br />

Die naive Berechnung der short-term autocorrelation hat quadratische Laufzeit, weshalb die<br />

FFT zur Beschleunigung eingesetzt wird. Dies ist möglich, weil die short-term autocorrelation<br />

der Signalfolge als Faltung angesehen werden kann (vergleiche Kapitel 2.3.4). Zusätzlich<br />

kann bei der Berechnung mittels der FFT eine weitere Eigenschaft der AKF ausgenutzt werden<br />

– die AKF ist symmetrisch zum Ursprung ¡ ¢ , es gilt also ©© ¢¡ <br />

müssen nur positive Verschiebungen betrachtet werden. Abbildung 3.9 verdeutlicht die effiziente<br />

Berechnung der short-term autocorrelation mittles FFT.<br />

FFT IFFT<br />

£ ¡ ££¢ § ¤ ¡ ££¢ §¥¤ ¤ ¡ £¦¢ §§¤ ¨ £<br />

¤©¤ §<br />

§<br />

¥¨§ ©<br />

Abbildung 3.9: Effiziente Berechnung der AKF mittels FFT<br />

Der AUTOC-Pitch-Detektions-Algorithmus<br />

57<br />

©© ¡ <strong>für</strong> alle ¡ . Somit<br />

Abbildung 3.10 zeigt das Blockdiagramm des AUTOC-PDAs [28]. Das Eingangssignal wird zunächst<br />

einem Tiefpaßfilter mit einer Grenzfrequenz von 900 Hz zugeführt. Dieser Filter kann<br />

durch ein FIR- oder IIR-Filter realisiert werden (vergleiche Kapitel 2.3.4). Die zu Testzwecken<br />

implementierte Version dieses PDAs verwendet hier ein IIR-Butterworth-Filter. Die Besonderheiten<br />

dieses Filters zu beschreiben, würde den Rahmen dieser Arbeit sprengen und ist <strong>für</strong> das<br />

Verständnis des PDAs nicht von Bedeutung. Das gefilterte Signal wird mittels Windowing in sich<br />

überlappende Frames mit einer Länge von jeweils <br />

werden nun untersucht. Der Stille-Detektor überprüft, ob die short-term energy innerhalb dieses<br />

Frames einen bestimmten Schwellwert überschreitet. Tut sie dies nicht, so wird dieser Frame als<br />

Stille klassifiziert. Andernfalls wird mit Hilfe der short-term autocorrelation die Pitch-Detektion<br />

durchgeführt. Das Center-Clipping dient der Fokussierung auf die Pitch und stellt einen nichtlinearen<br />

Operator dar. Der verwendete Operator geht auf SONDHI (1968) zurück. Nun wird<br />

in einem bestimmten Bereich der AKF der größte Autokorrelationswert und dessen Position<br />

bestimmt. Die Position des größten Autokorrelationswertes ergibt die Periode des zugrundeliegenden<br />

Signals. Anschließend wird der Peak-Wert mit einem Schwellwert verglichen, anhand<br />

dessen entschieden wird, ob der Frame als stimmhaft oder stimmlos klassifiziert wird. Abbildung<br />

3.11 zeigt einen Ausschnitt aus einem Pitch-Verlauf, der mit diesem PDA berechnet wurde.<br />

¢ aufgeteilt. Die entstehenden Frames

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!