28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

12 KAPITEL 1. EINLEITUNG, MOTIVATION<br />

Anwendungsgebiet gibt es mächtige <strong>Algorithmen</strong>, die aber <strong>für</strong> die Suche in Audio-Dateien und<br />

Multimedia-Dokumenten im allgemeinen nicht anwendbar sind. Des weiteren könnte versuchen<br />

werden, die untersuchte Audio-Datei anhand der oben genannten Indizien zu segmentieren, so<br />

daß beispielweise ein schnelles Navigieren innerhalb des Dokuments erleichtert wird.<br />

Diese einleitenden Worte verdeutlichen, aus welchen Begriffen sich der Titel dieser Arbeit zusammensetzt<br />

und in welchem Kontext sie zu sehen sind.<br />

1.1 Einleitung<br />

1.1.1 Das Problem: Suche in Audio-Dateien<br />

Das Problem der Suche in Audio-Dateien ist jedem bekannt, der einen Anrufbeantworter sein<br />

Eigen nennt. Wurde er eine längere Zeit nicht abgehört, so finden sich (möglicherweise) eine<br />

Vielzahl von Nachrichten auf dem Band. Viele davon sind unwichtig. Trotzdem müssen alle<br />

Nachrichten angehört werden und wenn man Pech hat, ist erst die letzte Nachricht auf dem Band<br />

die einzig wichtige. Angenehm wäre eine Art Suchmaschine, wie sie es <strong>für</strong> Textdokumente im<br />

WWW gibt. Dies ist Ziel verschiedener Forschungsarbeiten, auf die im nächsten Abschnitt kurz<br />

eingegangen wird.<br />

Das klassische Informationssuche-Problem besteht in der Auffindung eines Textdokuments,<br />

indem eine Suchanfrage, bestehend aus einem oder mehreren Schlüsselwörtern, an eine<br />

Menge von Textdokumenten gestellt wird. In der Regel werden die relevanten Dokumente<br />

dadurch gefunden, daß die Schlüsselwörter innerhalb dieser Textdokumente lokalisiert werden.<br />

Ein Dokument, in dem die Schlüsselwörter häufiger vorkommen als in anderen Dokumenten,<br />

wird dann als relevanter angesehen. Die Textdokumente können dem Benutzer daraufhin<br />

bezüglich ihrer Relevanz sortiert präsentiert werden. Die Informationssuche-<strong>Algorithmen</strong> <strong>für</strong><br />

Textdokumente basieren auf Pattern-Matching. Wenn man davon ausgeht, daß es keine Text-<br />

Transkription einer Sprachdatei 2 durch ein Spracherkennungssystem gibt, so läßt sich der Pattern-<br />

Matching-Ansatz nicht so einfach auf diese Art von Dateien übertragen. Dies liegt am Fehlen von<br />

identifizierbaren Wörtern oder vergleichbaren Einheiten in der Sprachdatei. Noch schwieriger<br />

wird das Problem, wenn die Audio-Dateien außer Sprache beispielsweise Musik enthalten.<br />

Bislang wurde die Verarbeitung und die Problematik von Suchanfragen betrachtet. Auch das<br />

Navigieren und das schnelle Browsen in Audio-Dateien ist ungleich problematischer als in<br />

reinen Text-Dateien. Audio-Dateien müssen vollständig durchgehört werden, wenn man sicher<br />

gehen will, daß alle wichtigen Informationen gefunden werden. Dies liegt an der Linearität von<br />

Audioströmen. Allerdings benötigt das Abhören von Audio-Dateien unter Umständen sehr viel<br />

Zeit. Die Text-Transkription einer minutenlangen Nachricht kann hingegen mit dem Auge in<br />

wenigen Sekunden überflogen werden.<br />

2 Der Begriff Sprachdatei steht <strong>für</strong> eine Audio-Datei, die nur Sprache enthält.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!