28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Kapitel 3<br />

Extraktion von Audio-Features<br />

Auf den ersten Blick beinhalten Audiosignale nur eine Information: die Amplitude über die<br />

Zeit (die Wellenform des Signals). Es gibt aber noch eine Vielzahl von anderen Eigenschaften,<br />

die sich aus dem zeitlichen Verlauf des Signals ermitteln lassen. Hierzu gehören beispielsweise<br />

der Verlauf der Energie und der Nulldurchgangsrate, das Frequenzspektrum sowie im Falle von<br />

Sprachsignalen der Pitch-Verlauf.<br />

Zunächst wird in Kapitel 3.1 das sogenannte Windowing eingeführt. Dieses Konzept ist<br />

elementar und Voraussetzung <strong>für</strong> alle Analysetechniken, die in diesem Kapitel verwendet<br />

werden. Die Kapitel 3.2, 3.3 und 3.4 stellen drei sogenannte Audio-Features des Audiosignals<br />

vor, die extrahiert werden können, um hiermit high level-Informationen zu erzeugen. Die ersten<br />

zwei Signaleigenschaften, short-term energy und short-term zero crossing rate, sind sehr einfach<br />

zu ermittelnde Features, während die dritte Eigenschaft, Pitch (Fundamentalfrequenz), einen<br />

höheren Aufwand erfordert. Die einzelnen, mittels Windowing, extrahierten Audio-Features<br />

werden dann geeignet kombiniert, um Informationen auf höherem Level zu generieren.<br />

3.1 Windowing / Frames<br />

In allen praktischen Signalverarbeitungsanwendungen muß mit kurzen Ausschnitten des zu verarbeitenden<br />

Signals gearbeitet werden. Dies trifft vor allen Dingen dann zu, wenn herkömmliche<br />

Analysetechniken auf nichtstationäre Signale angewendet werden sollen. Beispielsweise sind<br />

Sprachsignale solche nichtstationären Signale. In diesem Fall muß ein Teil des Signals ausgewählt<br />

werden, der berechtigterweise als stationär angenommen werden kann.<br />

3.1.1 Windowing<br />

Ein Fenster (engl.:<br />

<br />

Window) ist eine reelle, endliche Folge, die benutzt wird, um einen<br />

gewünschten Ausschnitt aus dem Originalsignal auszuwählen. Dies geschieht durch eine<br />

40

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!