28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

86 KAPITEL 5. EVALUATION<br />

grobe Segmentierung feine Segmentierung<br />

1.) Kapitel 1 1.) Kapitel<br />

2.) Kapitel 2 1.1.) Abschnitt 1<br />

3.) Kapitel 3 1.2.) Abschnitt 2<br />

4.) Kapitel 4 2.) Kapitel 2<br />

2.1.) Abschnitt 1<br />

2.1.1.) Absatz 1<br />

2.1.2.) Absatz 2 ...<br />

Tabelle 5.1: Beispiele <strong>für</strong> Segmentierungsmöglichkeiten<br />

was der Sprecher sagt. Aus dem Audiostrom lassen sich Informationen allenfalls darüber extrahieren,<br />

wie der Vortragende spricht. Diese prosodischen Merkmale 1 können lediglich Hinweise<br />

bezüglich einer feineren Segmentierung liefern. Aus diesem Grund wurde bei der Evaluation der<br />

Verfahren bis zu einer Tiefe von 7 gegliedert; die feinste Gliederungseinheit ist beispielsweise<br />

4.4.4.2.7.2.2 Nachweis. Diese Tiefe hat sich als feinste Auflösung bei den vorliegenden Daten<br />

herausgestellt.<br />

Erstellung der Referenzsegmentierung<br />

Zur Erstellung der Referenzsegmentierungen wurden die untersuchten Vorträge vollständig von<br />

Hand transkribiert. Es wurden (möglichst) wortwörtliche textuelle Abbilder dieser Vorträge geschaffen,<br />

inklusive von Füllauten wie „...äh...“ u.ä. Diese Texte wurden anschließend manuell<br />

und unabhängig vom Audiostrom segmentiert. Die manuelle Segmentierung orientiert sich an<br />

einem Beispiel aus [35]. Sie beruht ausschließlich auf dem inhaltlichen Zusammenhang, der sich<br />

aus dem Text ergibt. Hierzu ist natürlich ein gewisses Grundwissen über den Inhalt des Vortrages<br />

nötig, so daß Zusammenhänge erkannt werden können. Anhand dieser manuellen Segmentierung<br />

wurde wieder die Audio-Datei herangezogen und die Startzeitpunkte zu dieser Gliederung ermittelt.<br />

Tabelle 5.2 zeigt einen Auszug aus einer manuellen Segmentierung eines Vortrages aus<br />

[24]. Anhang A enthält eine Text-Transkription zu diesem Beispiel. Die Startzeitpunkte werden<br />

nun zur Evaluation der Segmentierungsverfahren herangezogen.<br />

1 Prosodem [grie.](prosdisches Merkmal), in der Linguistik lautl.-phonologisches Merkmal (Akzent, Intonation,<br />

Sprechtempo u.ä); relevant <strong>für</strong> die Bildung sprachlicher Einheiten, die größer als ein Laut bzw. Phonem sind.<br />

(Meyers großes Taschenlexikon: in 24 Bänden, B.I. Taschenbuchverlag, Mannheim;1995.)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!