Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Weitere Magazine

Empfehlungen

Info

$(LMS\) an der Universität Freiburg - Lehrstuhl Algorithmen ...$

90 KAPITEL 5. EVALUATION Die folgenden Abschnitte beschäftigen sich mit der Auswertung der Ergebnisse der zu untersuchenden Verfahren. Jeder Abschnitt beginnt damit, die Begriffe Recall und Precision für das jeweilige Verfahren zu präzisieren. Im Anschluß daran werden die Auswertungsergebnisse präsentiert und interpretiert. 5.2 Pausenbasierte Segmentierung Es werden nun die Ergebnisse der Auswertung des pausenbasierten Segmentierungsverfahrens PBS (vergleiche Kapitel 4.1) präsentiert. Die ausgewählten Sprachdateien wurden von diesem Verfahren für vier verschiedene ¥ ¢£¢ Pausen-Schwellwerte ¥ ¢ (keine Einschränkung, ¢£¢£¢ , und ) bearbeitet. Der erste Wert dient lediglich dazu, herauszufinden, ob das Verfahren überhaupt alle Topic Beginnings finden kann, unabhängig davon wie hoch die Precision ausfällt. Die drei letzten Werte fallen in den Bereich der sogenannten Juncture-Pausen, also solchen Pausen, die unter der Kontrolle des Sprechers ¢£¢ liegen. Atempausen ( ) und Pausen, die durch ein (kurzes) Zögern (Hesitation) des ¢£¢ ¥ Sprechers ¢ entstehen ), sollten ausgeschlossen werden. Ein Segment wurde genau dann als korrektes Topic Beginning angesehen, wenn die vorangehende Pausenlänge größer oder gleich dem Pausen-Schwellwert war und der ¦ (¦ Startzeitpunkt des Segments um maximal Beginnings gemäß der Referenzsegmentierung abwich. Andernfalls wurde das gerade betrachtete Segment als False Alarm gewertet. ¥ ¢ vom vorgegebenen Startzeitpunkt des Topic Die Vorträge 3 und 4 (Dateien: ga300_15m.aif und ga700_15m.aif) wurden einer Nachbehandlung unterzogen, da sich beim ersten Testlauf herausstellte, daß die Aufnahmequalität dieser Aufzeichnungen sehr schlecht ist und das Segmentierungsverfahren dadurch nur ¦ ¤ aller Topic Beginnings im Vortrag 3 fand. Im unbearbeiteten Vortrag 4 entdeckte das Verfahren nur ¡§¤ aller Topic Beginnings. Dies liefert einen Hinweis darauf, daß das Segmentierungsverfahren noch Schwierigkeiten mit ungünstigen Nutz- zu Rauschsignal-Verhältnissen hat. ¦ ¦ 5.2.1 Ergebnisse In diesem Abschnitt werden die Resultate der Testläufe aufgeführt. Sie werden in Tabellenform präsentiert, wobei die nachfolgenden Tabellen alle nach dem selben Schema aufgebaut sind: Zeile1 enthält den Dateinamen der untersuchten Audio-Datei. Der Dateiname setzt sich aus der Abkürzung des Namens der Vorlesungsreihe, der Nummer der Vorlesung und der Länge der Audio-Datei zusammen. Beispiel: ga100_15m.aif steht für einen 15 minütigen Ausschnitt der ersten Vorlesung aus der Vorlesungsreihe Geometrische Algorithmen. Das Dateiformat ist AIFF. (Der Dateiname des Originals lautete: ga100.aif) Spalte 1 enthält einen Pausen-Schwellwert, der angibt, wie lange die zu berücksichtigende Pause mindestens sein muß. In Spalte 2 findet sich die Gesamtzahl der Topic Beginnings
5.2. PAUSENBASIERTE SEGMENTIERUNG 91 (TB). Die Spalten 3 bis 5 geben die Anzahl der vom Segmentierungsverfahren erzielten Treffer (Hits H), die Anzahl der nicht gefunden Topic Beginnings (Misses M) und die Anzahl der falschen Alarme (False Alarms FA) wieder. In Spalte 6 findet sich der errechnete Wert für den Recall in Prozent und Spalte 7 enthält den Wert für die Precision. Beispiel: (Zeile 2) Berücksichtigt man für die Auswertung nur die Pausen, die länger als ¢ ¢ lang sind, so erreicht das Verfahren bei insgesamt 57 Topic Beginnings 37 Treffer. ¥ 20 Topic Beginnings werden nicht gefunden und 164 mal sagt der Algorithmus einen nicht vorhandenes Topic Beginning voraus. Das Verfahren erreicht in diesem Fall einen Recall ¦§¥ von und eine Precision £ ¤ von . ¤ Es ist anzumerken, daß die zu berücksichtigende Pausendauer kein beliebig veränderbarer Parameter ist. Die Erwartung ist, daß Sprecher Pausen ¥ ¢£¢ zwischen ¢£¢ ¢ und einlegen, um sowohl einzelne Sätze als auch Topics voneinander abzugrenzen (vergleiche Kapitel 4.1). Ergebnisse in Tabellenform Datei: ga100_15m.aif (Sprecher 1) Schwellwert (Sek.) TB H M FA Recall ( ) Precision ( ) 0.00 57 53 4 517 93 9 0.50 57 37 20 164 65 18 0.75 57 24 33 85 42 22 1.00 57 12 45 49 21 20 Datei: ga200_15m.aif (Sprecher 2) Schwellwert (Sek.) TB H M FA Recall ( ) Precision ( ) 0.00 37 35 2 716 95 5 0.50 37 28 9 183 76 13 0.75 37 20 17 111 54 15 1.00 37 13 24 69 35 16 Datei: ga300_15m.aif (Sprecher 1) Schwellwert (Sek.) TB H M FA Recall ( ) Precision ( ) 0.00 35 25 10 903 75 3 0.50 35 19 16 274 54 6 0.75 35 17 18 150 49 10 1.00 35 13 22 81 37 14
Seite 1 und 2:
ALBERT-LUDWIGS-UNIVERSITÄT FREIBUR
Seite 3:
Vorwort Ich möchte mich bei Prof.
Seite 6 und 7:
6 INHALTSVERZEICHNIS 3 Extraktion v
Seite 8 und 9:
Abbildungsverzeichnis 1.1 Story Seg
Seite 10 und 11:
Tabellenverzeichnis 3.1 Mathematisc
Seite 12 und 13:
12 KAPITEL 1. EINLEITUNG, MOTIVATIO
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Kapitel 2 Grundlagen der Sprachanal
Seite 22 und 23:
22 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 24 und 25:
Seite 26 und 27:
Seite 28 und 29:
Seite 30 und 31:
Seite 32 und 33:
Seite 34 und 35:
Seite 36 und 37:
Seite 38 und 39:
Seite 40 und 41: Kapitel 3 Extraktion von Audio-Feat
Seite 42 und 43: 42 KAPITEL 3. EXTRAKTION VON AUDIO-
Seite 70 und 71: Kapitel 4 Segmentierungsverfahren I
Seite 72 und 73: 72 KAPITEL 4. SEGMENTIERUNGSVERFAHR
Seite 86 und 87: 86 KAPITEL 5. EVALUATION grobe Segm
Seite 88 und 89: 88 KAPITEL 5. EVALUATION Topic Begi
Seite 92 und 93: 92 KAPITEL 5. EVALUATION Datei: ga7
Seite 94 und 95: 94 KAPITEL 5. EVALUATION Analyse Ei
Seite 96 und 97: 96 KAPITEL 5. EVALUATION dsaas §
Seite 98 und 99: 98 KAPITEL 5. EVALUATION Präferenz
Seite 100 und 101: 100 KAPITEL 5. EVALUATION Segment-L
Seite 102 und 103: 102 KAPITEL 5. EVALUATION Precision
Seite 104 und 105: Kapitel 6 Zusammenfassung und Ausbl
Seite 106 und 107: Anhang A Beispiel einer Text-Transk
Seite 108 und 109: 108 ANHANG A. BEISPIEL EINER TEXT-T
Seite 110 und 111: Anhang B Segmentierung am Beispiel
Seite 112 und 113: 112ANHANG B. SEGMENTIERUNG AM BEISP
Seite 114 und 115: 114ANHANG B. SEGMENTIERUNG AM BEISP
Seite 116 und 117: Literaturverzeichnis [1] AOF - Auth
Seite 118 und 119: 118 LITERATURVERZEICHNIS [23] OTTMA
Alle anzeigen

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?