Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3.4. FUNDAMENTALFREQUENZ (PITCH) ¢¡<br />
Peak bei ¡ besitzen, aber aufgrund der Zufallseigenschaften wird <br />
¡ ¡ ¢¡<br />
sehr schnell<br />
¢<br />
gegen Null gehen. ©© ¢¡<br />
Nur wird große Peaks<br />
¡<br />
<strong>für</strong><br />
¢<br />
enthalten. Dieses Verhalten erlaubt die<br />
Bestimmung der Präsenz und der Periode des periodischen Signals ¤ , welches von<br />
einem Interferenzsignal gestört ist. Im Fall von Sprachsignalen ist die Bestimmung der<br />
Periode aufgrund der oben genannten Probleme leider nicht so einfach möglich.<br />
Die naive Berechnung der short-term autocorrelation hat quadratische Laufzeit, weshalb die<br />
FFT zur Beschleunigung eingesetzt wird. Dies ist möglich, weil die short-term autocorrelation<br />
der Signalfolge als Faltung angesehen werden kann (vergleiche Kapitel 2.3.4). Zusätzlich<br />
kann bei der Berechnung mittels der FFT eine weitere Eigenschaft der AKF ausgenutzt werden<br />
– die AKF ist symmetrisch zum Ursprung ¡ ¢ , es gilt also ©© ¢¡ <br />
müssen nur positive Verschiebungen betrachtet werden. Abbildung 3.9 verdeutlicht die effiziente<br />
Berechnung der short-term autocorrelation mittles FFT.<br />
FFT IFFT<br />
£ ¡ ££¢ § ¤ ¡ ££¢ §¥¤ ¤ ¡ £¦¢ §§¤ ¨ £<br />
¤©¤ §<br />
§<br />
¥¨§ ©<br />
Abbildung 3.9: Effiziente Berechnung der AKF mittels FFT<br />
Der AUTOC-Pitch-Detektions-Algorithmus<br />
57<br />
©© ¡ <strong>für</strong> alle ¡ . Somit<br />
Abbildung 3.10 zeigt das Blockdiagramm des AUTOC-PDAs [28]. Das Eingangssignal wird zunächst<br />
einem Tiefpaßfilter mit einer Grenzfrequenz von 900 Hz zugeführt. Dieser Filter kann<br />
durch ein FIR- oder IIR-Filter realisiert werden (vergleiche Kapitel 2.3.4). Die zu Testzwecken<br />
implementierte Version dieses PDAs verwendet hier ein IIR-Butterworth-Filter. Die Besonderheiten<br />
dieses Filters zu beschreiben, würde den Rahmen dieser Arbeit sprengen und ist <strong>für</strong> das<br />
Verständnis des PDAs nicht von Bedeutung. Das gefilterte Signal wird mittels Windowing in sich<br />
überlappende Frames mit einer Länge von jeweils <br />
werden nun untersucht. Der Stille-Detektor überprüft, ob die short-term energy innerhalb dieses<br />
Frames einen bestimmten Schwellwert überschreitet. Tut sie dies nicht, so wird dieser Frame als<br />
Stille klassifiziert. Andernfalls wird mit Hilfe der short-term autocorrelation die Pitch-Detektion<br />
durchgeführt. Das Center-Clipping dient der Fokussierung auf die Pitch und stellt einen nichtlinearen<br />
Operator dar. Der verwendete Operator geht auf SONDHI (1968) zurück. Nun wird<br />
in einem bestimmten Bereich der AKF der größte Autokorrelationswert und dessen Position<br />
bestimmt. Die Position des größten Autokorrelationswertes ergibt die Periode des zugrundeliegenden<br />
Signals. Anschließend wird der Peak-Wert mit einem Schwellwert verglichen, anhand<br />
dessen entschieden wird, ob der Frame als stimmhaft oder stimmlos klassifiziert wird. Abbildung<br />
3.11 zeigt einen Ausschnitt aus einem Pitch-Verlauf, der mit diesem PDA berechnet wurde.<br />
¢ aufgeteilt. Die entstehenden Frames