28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Kapitel 1<br />

Einleitung, Motivation<br />

Per Definition stellen Multimedia-Dokumente eine Kombination von zeitunabhängigen- und<br />

zeitabhängigen Medien dar, wobei zu einem echten Multimedia-Dokument immer mindestens<br />

ein zeitunabhängiges- und ein zeitabhängiges Medium gehört [34]. Zu den zeitunabhängigen<br />

Medien zählen beispielsweise Text, Zeichnungen (Vektorgrafik) und Pixel-Bilder. Zeitabhängige<br />

Medien sind zum Beispiel Audio- und Videoströme und Animationen. Als Datenbasis <strong>für</strong><br />

diese Arbeit wird nur ein zeitabhängiges Medium betrachtet: der Audiostrom eines Multimedia-<br />

Dokuments. Es wird angenommen, daß die Audio-Daten nicht in Echtzeit zu verarbeiten sind,<br />

der Audiostrom liegt als Audio-Datei vor. Das Speicherformat spielt hierbei prinzipiell keine<br />

Rolle, auch wenn auf die einzelnen Daten innerhalb der Datei beliebiger Zugriff möglich sein<br />

muß.<br />

Um gewisse Informationen aus einem Satz von Daten zu extrahieren, muß zunächst eine<br />

Analyse der Daten erfolgen. Im Fall von Audiosignalen werden diverse Eigenschaften des<br />

Signals bestimmt, von denen man annimmt, daß sie <strong>für</strong> die Problemlösung relevant sein<br />

könnten. Solche Eigenschaften eines Audiosignals können beispielsweise der zeitliche Verlauf<br />

der Energie, der Nulldurchgangsrate, des Frequenzspektrums oder im speziellen Fall von Sprachsignalen<br />

der Fundamentalfrequenz sein. Die einzelnen, berechneten Audio-Features<br />

werden verwendet, um Informationen auf einer höheren Ebene zu gewinnen. Die ermittelten<br />

Indizien 1 sind beispielsweise Sprechpausen und Betonungen eines Sprechers. Sie können zur<br />

Indizierung der Audio-Datei genutzt werden.<br />

Ziel der Analyse und Indizierung von Audioströmen, insbesondere von Audio-Dateien aus AOF-<br />

Dokumenten (siehe Kapitel 1.4), ist die Informationssuche (Information Retrieval) in diesen<br />

Audio-Dateien. Im allgemeinen verbindet man Informationssuche mit der Suche nach Wörtern<br />

oder Sätzen in einem Text. Dies kann beispielsweise die Suche nach bestimmten Begriffen in<br />

einer Literaturdatenbank sein oder die Suche im World-Wide-Web mit Hilfe von Suchmaschinen,<br />

die die indizierten HTML-Dokumente nach den gewünschten Begriffen absuchen. Für dieses<br />

1 Indizien [lat. zu index „Anzeiger”], Tatsachen, aus denen das Vorliegen eines bestimmten Sachverhalts geschlossen<br />

werden kann, ... . (Meyers großes Taschenlexikon: in 24 Bänden, B.I. Taschenbuchverlag, Mannheim;1995.)<br />

11

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!