Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
86 KAPITEL 5. EVALUATION<br />
grobe Segmentierung feine Segmentierung<br />
1.) Kapitel 1 1.) Kapitel<br />
2.) Kapitel 2 1.1.) Abschnitt 1<br />
3.) Kapitel 3 1.2.) Abschnitt 2<br />
4.) Kapitel 4 2.) Kapitel 2<br />
2.1.) Abschnitt 1<br />
2.1.1.) Absatz 1<br />
2.1.2.) Absatz 2 ...<br />
Tabelle 5.1: Beispiele <strong>für</strong> Segmentierungsmöglichkeiten<br />
was der Sprecher sagt. Aus dem Audiostrom lassen sich Informationen allenfalls darüber extrahieren,<br />
wie der Vortragende spricht. Diese prosodischen Merkmale 1 können lediglich Hinweise<br />
bezüglich einer feineren Segmentierung liefern. Aus diesem Grund wurde bei der Evaluation der<br />
Verfahren bis zu einer Tiefe von 7 gegliedert; die feinste Gliederungseinheit ist beispielsweise<br />
4.4.4.2.7.2.2 Nachweis. Diese Tiefe hat sich als feinste Auflösung bei den vorliegenden Daten<br />
herausgestellt.<br />
Erstellung der Referenzsegmentierung<br />
Zur Erstellung der Referenzsegmentierungen wurden die untersuchten Vorträge vollständig von<br />
Hand transkribiert. Es wurden (möglichst) wortwörtliche textuelle Abbilder dieser Vorträge geschaffen,<br />
inklusive von Füllauten wie „...äh...“ u.ä. Diese Texte wurden anschließend manuell<br />
und unabhängig vom Audiostrom segmentiert. Die manuelle Segmentierung orientiert sich an<br />
einem Beispiel aus [35]. Sie beruht ausschließlich auf dem inhaltlichen Zusammenhang, der sich<br />
aus dem Text ergibt. Hierzu ist natürlich ein gewisses Grundwissen über den Inhalt des Vortrages<br />
nötig, so daß Zusammenhänge erkannt werden können. Anhand dieser manuellen Segmentierung<br />
wurde wieder die Audio-Datei herangezogen und die Startzeitpunkte zu dieser Gliederung ermittelt.<br />
Tabelle 5.2 zeigt einen Auszug aus einer manuellen Segmentierung eines Vortrages aus<br />
[24]. Anhang A enthält eine Text-Transkription zu diesem Beispiel. Die Startzeitpunkte werden<br />
nun zur Evaluation der Segmentierungsverfahren herangezogen.<br />
1 Prosodem [grie.](prosdisches Merkmal), in der Linguistik lautl.-phonologisches Merkmal (Akzent, Intonation,<br />
Sprechtempo u.ä); relevant <strong>für</strong> die Bildung sprachlicher Einheiten, die größer als ein Laut bzw. Phonem sind.<br />
(Meyers großes Taschenlexikon: in 24 Bänden, B.I. Taschenbuchverlag, Mannheim;1995.)