Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Kapitel 1<br />
Einleitung, Motivation<br />
Per Definition stellen Multimedia-Dokumente eine Kombination von zeitunabhängigen- und<br />
zeitabhängigen Medien dar, wobei zu einem echten Multimedia-Dokument immer mindestens<br />
ein zeitunabhängiges- und ein zeitabhängiges Medium gehört [34]. Zu den zeitunabhängigen<br />
Medien zählen beispielsweise Text, Zeichnungen (Vektorgrafik) und Pixel-Bilder. Zeitabhängige<br />
Medien sind zum Beispiel Audio- und Videoströme und Animationen. Als Datenbasis <strong>für</strong><br />
diese Arbeit wird nur ein zeitabhängiges Medium betrachtet: der Audiostrom eines Multimedia-<br />
Dokuments. Es wird angenommen, daß die Audio-Daten nicht in Echtzeit zu verarbeiten sind,<br />
der Audiostrom liegt als Audio-Datei vor. Das Speicherformat spielt hierbei prinzipiell keine<br />
Rolle, auch wenn auf die einzelnen Daten innerhalb der Datei beliebiger Zugriff möglich sein<br />
muß.<br />
Um gewisse Informationen aus einem Satz von Daten zu extrahieren, muß zunächst eine<br />
Analyse der Daten erfolgen. Im Fall von Audiosignalen werden diverse Eigenschaften des<br />
Signals bestimmt, von denen man annimmt, daß sie <strong>für</strong> die Problemlösung relevant sein<br />
könnten. Solche Eigenschaften eines Audiosignals können beispielsweise der zeitliche Verlauf<br />
der Energie, der Nulldurchgangsrate, des Frequenzspektrums oder im speziellen Fall von Sprachsignalen<br />
der Fundamentalfrequenz sein. Die einzelnen, berechneten Audio-Features<br />
werden verwendet, um Informationen auf einer höheren Ebene zu gewinnen. Die ermittelten<br />
Indizien 1 sind beispielsweise Sprechpausen und Betonungen eines Sprechers. Sie können zur<br />
Indizierung der Audio-Datei genutzt werden.<br />
Ziel der Analyse und Indizierung von Audioströmen, insbesondere von Audio-Dateien aus AOF-<br />
Dokumenten (siehe Kapitel 1.4), ist die Informationssuche (Information Retrieval) in diesen<br />
Audio-Dateien. Im allgemeinen verbindet man Informationssuche mit der Suche nach Wörtern<br />
oder Sätzen in einem Text. Dies kann beispielsweise die Suche nach bestimmten Begriffen in<br />
einer Literaturdatenbank sein oder die Suche im World-Wide-Web mit Hilfe von Suchmaschinen,<br />
die die indizierten HTML-Dokumente nach den gewünschten Begriffen absuchen. Für dieses<br />
1 Indizien [lat. zu index „Anzeiger”], Tatsachen, aus denen das Vorliegen eines bestimmten Sachverhalts geschlossen<br />
werden kann, ... . (Meyers großes Taschenlexikon: in 24 Bänden, B.I. Taschenbuchverlag, Mannheim;1995.)<br />
11