28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

14 KAPITEL 1. EINLEITUNG, MOTIVATION<br />

¡ ¡ ¢¡¢¡¢<br />

¢¡¢¡¢ ¡ ¡<br />

Story Segmentation<br />

disjunkte, homogene Bereiche (Stories)<br />

Topic Identification<br />

neues Ereignis<br />

Topic Tracking<br />

£¡£¡£ ¤¡¤¡¤<br />

¥¡¥¡¥<br />

¦¡¦<br />

§¡§<br />

¦¡¦<br />

§¡§ ¨¡¨<br />

¨¡¨<br />

¥¡¥¡¥<br />

¤¡¤¡¤ £¡£¡£<br />

mehr Stories zum<br />

vorhergehenden Ereignis<br />

Abbildung 1.1: Story Segmentation, Topic Detection und Topic Tracking<br />

of Standards and Technology) unterstützt. Hierbei gibt es drei verschiedene Aufgaben zu<br />

lösen [10][37] (vergleiche Abbildung 1.1):<br />

Story Segmentation Der Datenstrom muß in einzelne Stories zerlegt werden und kann<br />

sowohl ein Audiosignal als auch ein Textdokument sein. Im Falle eines Audiostroms<br />

kann die Segmentierung direkt auf dem Signal ausgeführt werden, sie kann aber auch<br />

über eine Text-Transkription ermittelt werden.<br />

Topic Identification Die Topic Identification-Aufgabe ist definiert als die Aufgabe der<br />

Erkennung und Weiterverfolgung von Topics, die dem System noch nicht bekannt<br />

sind. Das System hat noch kein Wissen darüber, was das Topic ist. Es muß also ein<br />

Verständnis davon haben, was ein Topic ausmacht und dieses Verständnis muß unabhängig<br />

von spezifischen Topics sein.<br />

Topic Tracking Neue Stories müssen bekannten Topics zugeordnet werden. Ein Topic<br />

ist bekannt durch die Assoziationen mit Stories, die dieses Topic diskutieren. Die<br />

Aufgabe besteht also in der Klassifikation aller neuen Stories, dahingehend ob sie ein<br />

bekanntes Topic diskutieren oder nicht.<br />

Es existieren zudem Systeme, die die angesprochenen Teilgebiete vereinen. Hierzu gehören das<br />

in den AT&T-Labs entwickelte Sprach-Retrieval-System SCAN (Spoken Content-Based Audio<br />

Navigation) [8] und MAESTRO (Multimedia Annotation and Enhancement via a Synergy<br />

of Technologies and Reviewing Operators) [29].<br />

1.2 Ziel dieser Diplomarbeit<br />

Im vorangehenden Abschnitt wurden verschiedene Möglichkeiten zur Informationssuche in<br />

Audio-Dokumenten vorgestellt. Die vorliegende Diplomarbeit beschäftigt sich mit der

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!