Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
1.4. DIE DATENBASIS 17<br />
erläutert, welche Sprachdateien im einzelnen <strong>für</strong> diese Arbeit zur Evaluation herangezogen<br />
wurden.<br />
Im letzten Kapitel werden die Ergebnisse dieser Arbeit zusammengefaßt und bewertet.<br />
1.4 Die Datenbasis<br />
Diese Arbeit beschäftigt sich ausschließlich mit der Informationssuche in aufgezeichneten Audio-<br />
Dateien. Es ist also keine Echtzeitverarbeitung nötig, da sie off-line bearbeitet werden. Allgemein<br />
können Audio-Dateien Sprache, Musik und andere Geräusche enthalten. Hier soll mit Dateien<br />
gearbeitet werden, die ausschließlich Sprache enthalten. Sprachdateien können vielseitiger Natur<br />
sein; sie können beispielsweise von aufgezeichneten Meetings, Vorlesungen, Vorträgen, Telefongesprächen<br />
oder Nachrichtensendungen stammen. Dementsprechend sind auch die Ziele einer<br />
Suche in diesen Dateien sehr unterschiedlich. Im Falle von Meetings könnten die verschiedenen<br />
Sprecher ermittelt werden, während in aufgezeichneten Telefongesprächen nach bestimmten verwendeten<br />
Begriffen gesucht werden könnte. Im Falle von Vorlesungen oder Vorträgen ist man<br />
möglicherweise daran interessiert, besonders wichtige Stellen im Vortrag zu ermitteln, so daß<br />
später leicht auf diese Stellen zugegriffen werden kann.<br />
Aufgezeichnete Vorlesungen dienen in dieser Arbeit als Beobachtungsgrundlage. Sie haben die<br />
folgenden Eigenschaften:<br />
plus0.5exSie sind typischerweise Monologe. (Allerdings sind Zuhörer anwesend, die möglicherweise<br />
Zwischenfragen stellen. Die untersuchten Sprachdateien enthielten aber nur in<br />
einem Fall Zwischenbemerkungen der Zuhörer, die aber aufgrund ihrer niedrigen Lautstärke<br />
nur noch sehr schwer herauszuhören waren. Sie wurden deshalb vernachlässigt.)<br />
Vorlesungen sind bzw. sollten strukturiert sein.<br />
Der erste Punkt hat den Vorteil, daß keine Sprecheridentifikation nötig ist. Eine gute Strukturierung<br />
während des Vortrags läßt darauf hoffen, daß eine Segmentierung relativ einfach möglich<br />
ist.<br />
Die Aufzeichnungen wurden im Sommersemester 1999 im Rahmen einer Vorlesungsreihe zum<br />
Thema Geometrische <strong>Algorithmen</strong> erstellt [24]. Diese Veranstaltungen wurden mit Hilfe der<br />
Authoring-on-the-fly (AOF)-Tools aufgezeichnet, die in der Abteilung <strong>Algorithmen</strong> und <strong>Datenstrukturen</strong>,<br />
Multimedia, Teleteaching und Elektronisches Publizieren am <strong>Institut</strong> <strong>für</strong> Informatik<br />
der Albert-Ludwigs-Universität Freiburg unter der Leitung von Prof. Dr. Thomas Ottman entwickelt<br />
wurden. Die zugrundeliegende Idee ist,<br />
„. . . auf den ersten Blick so verschiedene Tätigkeiten, wie das Halten einer Vorlesung<br />
im Hörsaal, das Teleteaching und das Erstellen multimedialer, <strong>für</strong> Unterrichtszwecke<br />
geeigneter Dokumente, zusammenwachsen zu lassen. Die in Freiburg