Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
3.4. FUNDAMENTALFREQUENZ (PITCH) ¢¡<br />
Pitch F0<br />
300<br />
250<br />
200<br />
150<br />
100<br />
50<br />
0<br />
1000 1200 1400 1600 1800 2000<br />
Frame-Index<br />
Abbildung 3.11: Ausschnitt aus einem Pitch-Verlauf, der mit dem AUTOC-PDA berechnet wurde.<br />
Der Pitch-Detektions-Algorithmus nach BOERSMA<br />
Ein zweiter Ansatz zur Bestimmung der Pitch stammt von BOERSMA [5] und wird durch Abbildung<br />
3.12 verdeutlicht. Er beschreibt einen PDA, der verschiedene Kritikpunkte an Verfahren<br />
basierend auf der Autokorrelation beseitigen soll. Zunächst wird die Abtastfrequenz verdoppelt<br />
(Upsampling). Mit Hilfe dieser Operation sollen die sidelobes (vergleiche Abschnitt 3.1) der<br />
Fouriertransformation des Hanning-Fensters <strong>für</strong> Signalkomponenten nahe der Nyquistfrequenz<br />
entfernt werden. Hierzu wird das Signal mit einer N-Punkt FFT in den Frequenzbereich transformiert.<br />
Im Frequenzbereich wird nun ein linearer (Tiefpaß-)Filter angewendet. Der nächste<br />
Schritt besteht dann darin, eine 2N-Punkt inverse FFT durchzuführen. Es folgt das Windowing<br />
mit Hilfe eines Hanning-Fensters, bei dem das Sprachsignal in Frames zerlegt wird. Im Anschluß<br />
daran wird die short-term autocorrelation des entstandenen Frames berechnet, normalisiert und<br />
durch die (normalisierte) AKF des Hanning-Fensters dividiert. Durch die Division wird dem abfallenden<br />
Charakter der AKF entgegengewirkt. Zudem wird nicht nur ein einzelner Peak-Wert<br />
und die daraus resultierende Pitch berechnet, sondern mehrere Kandidaten. Diese werden nach<br />
bestimmten Gesichtspunkten gewichtet. Dies bedeutet, daß es zu jedem Frame mehrere Pitch-<br />
Kandidaten gibt. In einem Postprocessing wird dann mit Hilfe von dynamischer Programmierung<br />
ein günstigster Pfad durch die Menge der Kandidaten bestimmt. Das Verfahren soll um mehrere<br />
Ordnungen genauer sein als übliche PDAs und zudem wesentlich flexibler und robuster.<br />
Der ModifiedACF-Pitch-Detektions-Algorithmus<br />
Der im folgenden beschriebene PDA basiert auch auf der in diesem Kapitel beschriebenen shortterm<br />
autocorrelation und soll fortan ModifiedACF-PDA genannt werden. Er stellt eine Vereinfachung<br />
des oben erläuterten PDAs von BOERSMA dar. Dies ist auch der Algorithmus, der<br />
später bei der Emphasis-Detektion (siehe Kapitel 4.2) eingesetzt wird. Abbildung 3.13 zeigt<br />
59