Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Weitere Magazine

Empfehlungen

Info

$(LMS\) an der Universität Freiburg - Lehrstuhl Algorithmen ...$

86 KAPITEL 5. EVALUATION grobe Segmentierung feine Segmentierung 1.) Kapitel 1 1.) Kapitel 2.) Kapitel 2 1.1.) Abschnitt 1 3.) Kapitel 3 1.2.) Abschnitt 2 4.) Kapitel 4 2.) Kapitel 2 2.1.) Abschnitt 1 2.1.1.) Absatz 1 2.1.2.) Absatz 2 ... Tabelle 5.1: Beispiele für Segmentierungsmöglichkeiten was der Sprecher sagt. Aus dem Audiostrom lassen sich Informationen allenfalls darüber extrahieren, wie der Vortragende spricht. Diese prosodischen Merkmale 1 können lediglich Hinweise bezüglich einer feineren Segmentierung liefern. Aus diesem Grund wurde bei der Evaluation der Verfahren bis zu einer Tiefe von 7 gegliedert; die feinste Gliederungseinheit ist beispielsweise 4.4.4.2.7.2.2 Nachweis. Diese Tiefe hat sich als feinste Auflösung bei den vorliegenden Daten herausgestellt. Erstellung der Referenzsegmentierung Zur Erstellung der Referenzsegmentierungen wurden die untersuchten Vorträge vollständig von Hand transkribiert. Es wurden (möglichst) wortwörtliche textuelle Abbilder dieser Vorträge geschaffen, inklusive von Füllauten wie „...äh...“ u.ä. Diese Texte wurden anschließend manuell und unabhängig vom Audiostrom segmentiert. Die manuelle Segmentierung orientiert sich an einem Beispiel aus [35]. Sie beruht ausschließlich auf dem inhaltlichen Zusammenhang, der sich aus dem Text ergibt. Hierzu ist natürlich ein gewisses Grundwissen über den Inhalt des Vortrages nötig, so daß Zusammenhänge erkannt werden können. Anhand dieser manuellen Segmentierung wurde wieder die Audio-Datei herangezogen und die Startzeitpunkte zu dieser Gliederung ermittelt. Tabelle 5.2 zeigt einen Auszug aus einer manuellen Segmentierung eines Vortrages aus [24]. Anhang A enthält eine Text-Transkription zu diesem Beispiel. Die Startzeitpunkte werden nun zur Evaluation der Segmentierungsverfahren herangezogen. 1 Prosodem [grie.](prosdisches Merkmal), in der Linguistik lautl.-phonologisches Merkmal (Akzent, Intonation, Sprechtempo u.ä); relevant für die Bildung sprachlicher Einheiten, die größer als ein Laut bzw. Phonem sind. (Meyers großes Taschenlexikon: in 24 Bänden, B.I. Taschenbuchverlag, Mannheim;1995.)
5.1. MESSGRÖSSEN 87 5.1 Messgrößen Gliederung Überschrift Startzeitpunkt innerhalb der Audiodatei 1. Begrüßung 0:00,00 2. Einleitung 0:08,92 3. Gliederung 0:30,41 3.1. Problemformulierung 0:36,47 3.2. Konfigurationsraum 0:45,12 3.3. Einfaches Problem 0:58,63 3.4. Minkowski-Summen 1:14,70 3.4.1. Eigenschaft von Minkowski-S. 1:28,43 3.5. Problemlösung 1:46,62 4. Problemstellung 2:05,89 4.1. Veranschaulichung 2:24,02 4.2. Beispiel 2:45,04 . . . Tabelle 5.2: Auszug aus einer manuellen Segmentierung In der Einleitung zu diesem Kapitel wurde erläutert, wie die Referenzdaten für die Evaluation zustande kommen. Es ist aber noch nicht klar, was und wie gemessen werden soll. Die manuell erstellte Segmentierung eines Vortrages liefert, wie die Tabelle 5.2 zeigt, eine Liste von Zeitpunkten, die einem Beginn eines Topics (engl.: Topic Beginning) entsprechen. Die untersuchten Verfahren sollen diese Zeitpunkte nun möglichst genau aus der Sprachdatei extrahieren. Dabei sollen sie nicht nur möglichst viele dieser Topic Beginnings finden, sondern auch so wenig wie möglich falsche Alarme (engl.: False Alarms) auslösen. Dies führt zu den Begriffen Recall und Precision. Recall und Precision Eine erste Definition dieser Begriffe könnte wie folgt sein: Der Recall liefert ein Maß für die Trefferhäufigkeit des Verfahrens; je mehr der Topic Beginnings erkannt werden, umso höher ist der Wert für den Recall. Die Precision zeigt die Genauigkeit des Verfahrens an. Je weniger False Alarms das Verfahren produziert, umso höher ist der Wert für die Precision. Es ist sehr wichtig beide Metriken zu berechnen, wie folgendes Beispiel zeigt: Ein Segmentierungsverfahren findet alle Satzanfänge und identifiziert alle Sätze als Topic Beginnings. Es erreicht damit einen Recall ¢ ¢§¤ von ; allerdings ist dann die Precision sehr niedrig, da auch Satzanfänge gefunden werden, die nicht einer Segmentgrenze entsprechen. Findet das Verfahren nur genau ein tatsächliches Topic Beginning und erzeugt keine False Alarms, so erhält man zwar eine Precision ¢£¢§¤ von , jedoch einen sehr niedrigen Recall.
Seite 1 und 2:
ALBERT-LUDWIGS-UNIVERSITÄT FREIBUR
Seite 3:
Vorwort Ich möchte mich bei Prof.
Seite 6 und 7:
6 INHALTSVERZEICHNIS 3 Extraktion v
Seite 8 und 9:
Abbildungsverzeichnis 1.1 Story Seg
Seite 10 und 11:
Tabellenverzeichnis 3.1 Mathematisc
Seite 12 und 13:
12 KAPITEL 1. EINLEITUNG, MOTIVATIO
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Kapitel 2 Grundlagen der Sprachanal
Seite 22 und 23:
22 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 24 und 25:
Seite 26 und 27:
Seite 28 und 29:
Seite 30 und 31:
Seite 32 und 33:
Seite 34 und 35:
Seite 36 und 37: 36 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 38 und 39: 38 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 40 und 41: Kapitel 3 Extraktion von Audio-Feat
Seite 42 und 43: 42 KAPITEL 3. EXTRAKTION VON AUDIO-
Seite 70 und 71: Kapitel 4 Segmentierungsverfahren I
Seite 72 und 73: 72 KAPITEL 4. SEGMENTIERUNGSVERFAHR
Seite 88 und 89: 88 KAPITEL 5. EVALUATION Topic Begi
Seite 90 und 91: 90 KAPITEL 5. EVALUATION Die folgen
Seite 92 und 93: 92 KAPITEL 5. EVALUATION Datei: ga7
Seite 94 und 95: 94 KAPITEL 5. EVALUATION Analyse Ei
Seite 96 und 97: 96 KAPITEL 5. EVALUATION dsaas §
Seite 98 und 99: 98 KAPITEL 5. EVALUATION Präferenz
Seite 100 und 101: 100 KAPITEL 5. EVALUATION Segment-L
Seite 102 und 103: 102 KAPITEL 5. EVALUATION Precision
Seite 104 und 105: Kapitel 6 Zusammenfassung und Ausbl
Seite 106 und 107: Anhang A Beispiel einer Text-Transk
Seite 108 und 109: 108 ANHANG A. BEISPIEL EINER TEXT-T
Seite 110 und 111: Anhang B Segmentierung am Beispiel
Seite 112 und 113: 112ANHANG B. SEGMENTIERUNG AM BEISP
Seite 114 und 115: 114ANHANG B. SEGMENTIERUNG AM BEISP
Seite 116 und 117: Literaturverzeichnis [1] AOF - Auth
Seite 118 und 119: 118 LITERATURVERZEICHNIS [23] OTTMA
Alle anzeigen

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?