Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
90 KAPITEL 5. EVALUATION<br />
Die folgenden Abschnitte beschäftigen sich mit der Auswertung der Ergebnisse der zu untersuchenden<br />
Verfahren. Jeder Abschnitt beginnt damit, die Begriffe Recall und Precision <strong>für</strong> das jeweilige<br />
Verfahren zu präzisieren. Im Anschluß daran werden die Auswertungsergebnisse<br />
präsentiert und interpretiert.<br />
5.2 Pausenbasierte Segmentierung<br />
Es werden nun die Ergebnisse der Auswertung des pausenbasierten Segmentierungsverfahrens<br />
PBS (vergleiche Kapitel 4.1) präsentiert. Die ausgewählten Sprachdateien wurden von diesem<br />
Verfahren <strong>für</strong> vier verschiedene ¥<br />
¢£¢ <br />
Pausen-Schwellwerte ¥<br />
¢ <br />
(keine Einschränkung,<br />
¢£¢£¢<br />
,<br />
<br />
und ) bearbeitet. Der erste Wert dient lediglich dazu, herauszufinden, ob das <br />
Verfahren<br />
überhaupt alle Topic Beginnings finden kann, unabhängig davon wie hoch die Precision ausfällt.<br />
Die drei letzten Werte fallen in den Bereich der sogenannten Juncture-Pausen, also solchen<br />
Pausen, die unter der Kontrolle des Sprechers<br />
¢£¢ <br />
<br />
liegen. Atempausen ( ) und Pausen, die<br />
durch ein (kurzes) Zögern (Hesitation) des<br />
¢£¢ ¥<br />
Sprechers<br />
¢ <br />
entstehen ), sollten ausgeschlossen<br />
werden. Ein Segment wurde genau dann als korrektes Topic Beginning angesehen,<br />
wenn die vorangehende Pausenlänge größer oder gleich dem Pausen-Schwellwert war und der<br />
¦ (¦<br />
Startzeitpunkt des Segments um maximal<br />
Beginnings gemäß der Referenzsegmentierung abwich. Andernfalls wurde das gerade betrachtete<br />
Segment als False Alarm gewertet.<br />
¥<br />
¢ vom vorgegebenen Startzeitpunkt des Topic<br />
Die Vorträge 3 und 4 (Dateien: ga300_15m.aif und ga700_15m.aif) wurden einer Nachbehandlung<br />
unterzogen, da sich beim ersten Testlauf herausstellte, daß die Aufnahmequalität dieser Aufzeichnungen<br />
sehr schlecht ist und das Segmentierungsverfahren dadurch nur ¦<br />
¤<br />
aller<br />
Topic Beginnings im Vortrag 3 fand. Im unbearbeiteten Vortrag 4 entdeckte das Verfahren nur<br />
¡§¤<br />
aller Topic Beginnings. Dies liefert einen Hinweis darauf, daß das Segmentierungsverfahren<br />
noch Schwierigkeiten mit ungünstigen Nutz- zu Rauschsignal-Verhältnissen hat.<br />
¦<br />
¦<br />
5.2.1 Ergebnisse<br />
In diesem Abschnitt werden die Resultate der Testläufe aufgeführt. Sie werden in Tabellenform<br />
präsentiert, wobei die nachfolgenden Tabellen alle nach dem selben Schema aufgebaut sind:<br />
Zeile1 enthält den Dateinamen der untersuchten Audio-Datei. Der Dateiname setzt sich<br />
aus der Abkürzung des Namens der Vorlesungsreihe, der Nummer der Vorlesung und der<br />
Länge der Audio-Datei zusammen.<br />
Beispiel: ga100_15m.aif steht <strong>für</strong> einen 15 minütigen Ausschnitt der ersten Vorlesung aus<br />
der Vorlesungsreihe Geometrische <strong>Algorithmen</strong>. Das Dateiformat ist AIFF. (Der Dateiname<br />
des Originals lautete: ga100.aif)<br />
Spalte 1 enthält einen Pausen-Schwellwert, der angibt, wie lange die zu berücksichtigende<br />
Pause mindestens sein muß. In Spalte 2 findet sich die Gesamtzahl der Topic Beginnings