28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

90 KAPITEL 5. EVALUATION<br />

Die folgenden Abschnitte beschäftigen sich mit der Auswertung der Ergebnisse der zu untersuchenden<br />

Verfahren. Jeder Abschnitt beginnt damit, die Begriffe Recall und Precision <strong>für</strong> das jeweilige<br />

Verfahren zu präzisieren. Im Anschluß daran werden die Auswertungsergebnisse<br />

präsentiert und interpretiert.<br />

5.2 Pausenbasierte Segmentierung<br />

Es werden nun die Ergebnisse der Auswertung des pausenbasierten Segmentierungsverfahrens<br />

PBS (vergleiche Kapitel 4.1) präsentiert. Die ausgewählten Sprachdateien wurden von diesem<br />

Verfahren <strong>für</strong> vier verschiedene ¥<br />

¢£¢ <br />

Pausen-Schwellwerte ¥<br />

¢ <br />

(keine Einschränkung,<br />

¢£¢£¢<br />

,<br />

<br />

und ) bearbeitet. Der erste Wert dient lediglich dazu, herauszufinden, ob das <br />

Verfahren<br />

überhaupt alle Topic Beginnings finden kann, unabhängig davon wie hoch die Precision ausfällt.<br />

Die drei letzten Werte fallen in den Bereich der sogenannten Juncture-Pausen, also solchen<br />

Pausen, die unter der Kontrolle des Sprechers<br />

¢£¢ <br />

<br />

liegen. Atempausen ( ) und Pausen, die<br />

durch ein (kurzes) Zögern (Hesitation) des<br />

¢£¢ ¥<br />

Sprechers<br />

¢ <br />

entstehen ), sollten ausgeschlossen<br />

werden. Ein Segment wurde genau dann als korrektes Topic Beginning angesehen,<br />

wenn die vorangehende Pausenlänge größer oder gleich dem Pausen-Schwellwert war und der<br />

¦ (¦<br />

Startzeitpunkt des Segments um maximal<br />

Beginnings gemäß der Referenzsegmentierung abwich. Andernfalls wurde das gerade betrachtete<br />

Segment als False Alarm gewertet.<br />

¥<br />

¢ vom vorgegebenen Startzeitpunkt des Topic<br />

Die Vorträge 3 und 4 (Dateien: ga300_15m.aif und ga700_15m.aif) wurden einer Nachbehandlung<br />

unterzogen, da sich beim ersten Testlauf herausstellte, daß die Aufnahmequalität dieser Aufzeichnungen<br />

sehr schlecht ist und das Segmentierungsverfahren dadurch nur ¦<br />

¤<br />

aller<br />

Topic Beginnings im Vortrag 3 fand. Im unbearbeiteten Vortrag 4 entdeckte das Verfahren nur<br />

¡§¤<br />

aller Topic Beginnings. Dies liefert einen Hinweis darauf, daß das Segmentierungsverfahren<br />

noch Schwierigkeiten mit ungünstigen Nutz- zu Rauschsignal-Verhältnissen hat.<br />

¦<br />

¦<br />

5.2.1 Ergebnisse<br />

In diesem Abschnitt werden die Resultate der Testläufe aufgeführt. Sie werden in Tabellenform<br />

präsentiert, wobei die nachfolgenden Tabellen alle nach dem selben Schema aufgebaut sind:<br />

Zeile1 enthält den Dateinamen der untersuchten Audio-Datei. Der Dateiname setzt sich<br />

aus der Abkürzung des Namens der Vorlesungsreihe, der Nummer der Vorlesung und der<br />

Länge der Audio-Datei zusammen.<br />

Beispiel: ga100_15m.aif steht <strong>für</strong> einen 15 minütigen Ausschnitt der ersten Vorlesung aus<br />

der Vorlesungsreihe Geometrische <strong>Algorithmen</strong>. Das Dateiformat ist AIFF. (Der Dateiname<br />

des Originals lautete: ga100.aif)<br />

Spalte 1 enthält einen Pausen-Schwellwert, der angibt, wie lange die zu berücksichtigende<br />

Pause mindestens sein muß. In Spalte 2 findet sich die Gesamtzahl der Topic Beginnings

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!