28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

3.4. FUNDAMENTALFREQUENZ (PITCH) ¢¡<br />

Sprache/Pause<br />

Sprachsignal<br />

Windowing des Signals<br />

Ermittlung der short-term energy<br />

und der short-term zero crossing rate<br />

Sprache/Pause-Entscheidung<br />

Verfahren zur Bestimmung der<br />

Pitch<br />

Entscheidung stimmhaft / stimmlos<br />

stimmhaft / stimmlos<br />

Abbildung 3.6: System zur Pitch-Detektion [12]<br />

Pitch F0<br />

beinhaltet. Im Falle eines stimmhaften Lautes wird die Pitch berechnet und ausgeben, andernfalls<br />

wird in der Regel die Pitch gleich Null gesetzt. Die Bestimmung, ob ein Frame einen<br />

stimmhaften oder einen stimmlosen Laut enthält, geschieht in den einzelnen <strong>Algorithmen</strong> auf<br />

unterschiedliche Art und Weise. Oft wird die Klassifikation aus einer bestimmten Kombination<br />

von ¢¡ , £¥¤§¦¨¡ und Spitzenwert der Periodenberechnungsfunktion ermittelt. Beispielsweise verwenden<br />

ROSS, ET AL. [30] eine ausgeklügelte Logik im Anschluß an die Periodenbestimmung.<br />

BOERSMA [5] bestimmt <strong>für</strong> jeden Frame eine Menge von möglichen Kandidaten, die durch<br />

eine Gewichtungsfunktion bewertet werden. Daran anschließend wird mit Hilfe von dynamischer<br />

Programmierung ein günstigster Pfad durch die Menge der Kandidaten bestimmt. Als Nebenprodukt<br />

der Bestimmung der Pitch erhält man durch die Klassifikation in stimmhafte, stimmlose<br />

und stille Segmente eine (einfache) Pausendetektion. Zur Verdeutlichung, wie ein Pitch-Verlauf<br />

aussehen kann, zeigt die Abbildung 3.7 Ausschnitte aus Pitch-Verläufen verschiedener Sprecher,<br />

die [23] und [24] entstammen. Es ist gut erkennbar, daß der Pitch-Verlauf der Dozentin insgesamt<br />

höher angesiedelt ist, als der der männlichen Vortragenden.<br />

Für die Bestimmung der Pitch gibt es eine Vielzahl verschiedener Ansätze. Im Rahmen<br />

dieser Arbeit werden nur Pitch-Detektions-<strong>Algorithmen</strong> (PDA) vorgestellt, die versuchen, die<br />

Periode des Signals zu bestimmen. Hierzu wird idealisierend angenommen, das Sprachsignal<br />

sei ein Zufallsprozeß und <strong>für</strong> eine gewisse Zeit von etwa © stationär. Fünf Ansätze<br />

zur Bestimmung der Pitch, die auch (teilweise vereinfacht) zu Versuchszwecken implementiert<br />

wurden, werden in den folgenden Kapiteln genauer beschrieben, wobei nur die dahinterstehende<br />

Idee vermittelt werden soll. Es wird sich zeigen, daß die Pitch allein mit Ausführung der jeweiligen<br />

Funktion nicht zufriedenstellend bestimmt werden kann. In der Regel muß sich noch<br />

53

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!