28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

3.4. FUNDAMENTALFREQUENZ (PITCH) ¢¡<br />

Pitch F0<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

0<br />

1000 1200 1400 1600 1800 2000<br />

Frame-Index<br />

Abbildung 3.11: Ausschnitt aus einem Pitch-Verlauf, der mit dem AUTOC-PDA berechnet wurde.<br />

Der Pitch-Detektions-Algorithmus nach BOERSMA<br />

Ein zweiter Ansatz zur Bestimmung der Pitch stammt von BOERSMA [5] und wird durch Abbildung<br />

3.12 verdeutlicht. Er beschreibt einen PDA, der verschiedene Kritikpunkte an Verfahren<br />

basierend auf der Autokorrelation beseitigen soll. Zunächst wird die Abtastfrequenz verdoppelt<br />

(Upsampling). Mit Hilfe dieser Operation sollen die sidelobes (vergleiche Abschnitt 3.1) der<br />

Fouriertransformation des Hanning-Fensters <strong>für</strong> Signalkomponenten nahe der Nyquistfrequenz<br />

entfernt werden. Hierzu wird das Signal mit einer N-Punkt FFT in den Frequenzbereich transformiert.<br />

Im Frequenzbereich wird nun ein linearer (Tiefpaß-)Filter angewendet. Der nächste<br />

Schritt besteht dann darin, eine 2N-Punkt inverse FFT durchzuführen. Es folgt das Windowing<br />

mit Hilfe eines Hanning-Fensters, bei dem das Sprachsignal in Frames zerlegt wird. Im Anschluß<br />

daran wird die short-term autocorrelation des entstandenen Frames berechnet, normalisiert und<br />

durch die (normalisierte) AKF des Hanning-Fensters dividiert. Durch die Division wird dem abfallenden<br />

Charakter der AKF entgegengewirkt. Zudem wird nicht nur ein einzelner Peak-Wert<br />

und die daraus resultierende Pitch berechnet, sondern mehrere Kandidaten. Diese werden nach<br />

bestimmten Gesichtspunkten gewichtet. Dies bedeutet, daß es zu jedem Frame mehrere Pitch-<br />

Kandidaten gibt. In einem Postprocessing wird dann mit Hilfe von dynamischer Programmierung<br />

ein günstigster Pfad durch die Menge der Kandidaten bestimmt. Das Verfahren soll um mehrere<br />

Ordnungen genauer sein als übliche PDAs und zudem wesentlich flexibler und robuster.<br />

Der ModifiedACF-Pitch-Detektions-Algorithmus<br />

Der im folgenden beschriebene PDA basiert auch auf der in diesem Kapitel beschriebenen shortterm<br />

autocorrelation und soll fortan ModifiedACF-PDA genannt werden. Er stellt eine Vereinfachung<br />

des oben erläuterten PDAs von BOERSMA dar. Dies ist auch der Algorithmus, der<br />

später bei der Emphasis-Detektion (siehe Kapitel 4.2) eingesetzt wird. Abbildung 3.13 zeigt<br />

59

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!