Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Weitere Magazine

Empfehlungen

Info

$(LMS\) an der Universität Freiburg - Lehrstuhl Algorithmen ...$

Kapitel 6 Zusammenfassung und Ausblick Erklärtes Ziel dieser Arbeit war die Evaluation zweier Segmentierungsverfahren hinsichtlich ihrer Nutzbarkeit für die automatische Segmentierung vorhandener sowie zukünftiger Vorlesungsaufzeichnungen. Die untersuchten Verfahren wurden ausgewählt, weil sie nicht auf statistischen Modellen beruhen, welche beispielsweise durch neuronale Netze oder Hidden-Markov-Modelle realisiert werden können. Segmentierungsverfahren, die auf solchen Modellen beruhen, haben den entscheidenden Nachteil, daß sie trainiert werden müssen. Dazu muß zunächst eine große Menge von Trainingsdaten (von Hand) erstellt werden. Das resultierende statistische Modell kann dann wiederum mit Testdaten überprüft werden, die unter Umständen auch wieder manuell zu erstellen sind. Dies bedeutet einen großen Zeitaufwand für die Erstellung der Trainings- und Testdaten. Zudem ist die Zusammenstellung dieser Datenmengen unter Umständen kritisch, wenn nicht ausreichend große Datenmengen zur Verfügung stehen. Was man sich nun wünschen würde, wäre ein Verfahren, das ohne jegliche Vor- und Nachbearbeitung angewendet werden könnte. In Kapitel 4 wurden zwei Algorithmen vorgestellt, die ohne statistische Modelle auskommen und von anderen Projekten in ähnlicher Form erfolgreich eingesetzt wurden [4][16]. Die technischen Grundlagen für diese Algorithmen wurden in den Kapiteln 2 und 3 erläutert. Die Algorithmen wurden in der Programmiersprache C++ auf einem PC unter dem Betriebssystem LinuX implementiert. Die Implementierung wurde so vorgenommen, daß eine Portierung auf andere Betriebssysteme leicht möglich ist. Es wurde großer Wert auf Wiederverwendbarkeit gelegt, so daß bei weitergehenden Forschungen auf die vorhandenen Funktionen zurückgegriffen werden kann. Die Aus- und Bewertung der vorgestellten pausenbasierten Segmentierung (PBS) und der pitchbasierten Segmentierung (EDBS) ergab, daß die Verfahren in dieser Form und für die exakte Segmentierung von Vorlesungsaufzeichnungen nicht zu befriedigenden Ergebnissen führen (vergleiche Kapitel 5). Vor allen Dingen die mangelnde Präzision der Algorithmen verhindert die sinnvolle Nutzung dieser Segmentierungsverfahren für den angesprochenen Zweck. Dies schließt allerdings nicht aus, daß diese Verfahren nicht für andere Verwendungszwecke geeignet sein könnten. ARONS entwickelte EDBS, um Zusammenfassungen aus Sprachdateien erstellen und 104
ein schnelles Navigieren innerhalb der Sprachdatei zu ermöglichen. Hierfür ist es nicht zwingend notwendig, exakte Zeitpunkte der Topic Beginnings zu finden. STIFELMAN bescheinigte dem Verfahren in einer Untersuchung eine hohe Precision ( £¦¤ ) und einen niedrigen Recall ¥ ¤ ). Diese Ergebnisse konnten nicht nachvollzogen werden. Dies liegt vor allen Dingen an den unterschiedlichen Meßmethoden (siehe Kapitel 5.3). (¦ Die vorliegende Untersuchung zeigt, daß es mit einfachen Mitteln sehr schwierig ist, die untersuchte Klasse von Sprachdateien zu segmentieren. Die Resultate für die Radio-Nachrichtensendungen (vergleiche Anhang B) belegen, daß die untersuchten Verfahren sehr wohl eine brauchbare Segmentierung liefern können, wobei das EDBS-Verfahren auch auf diesen Daten sprecherabhängige Resultate liefert. Wie bereits mehrfach erwähnt, gibt es Forschungsansätze für die Segmentierung, die mit statistischen Modellen oder auch mit Data Mining/Machine-Learning-Techniken arbeiten. Auch diese Arbeiten verwenden als Audio-Features hauptsächlich Pausen und Informationen, die sich aus der Satzmelodie ergeben. Die Berechnung dieser Features ist mit der für diese Diplomarbeit entwickelten C++-Bibiliothek leicht möglich. Es wurde ein Programm entwickelt, das verschiedene Audio-Features wie beispielsweise Pausenlänge, Energie und diverse Pitch- Features für Sprachsegmente im ARFF-Datenformat ausgibt, welches von der WEKA-Bibiothek verarbeitet werden kann. Die WEKA-Bibliothek ist ein JAVA-Tool, das diverse Data Mining und Machine-Learning Algorithmen zur Verfügung stellt [38]. HIRSCHBERG, NAKATANI [18] sowie SHRIBERG ET. AL [32] verwenden beispielsweise erfolgreich Klassifikations- und Regressionsbäume (CART) in ihren Projekten. Allerdings muß auch hierbei wieder die von diesen Autoren verwendete Datenbasis in Betracht gezogen werden. Ob ein auf Data Mining/ Machine-Learning-Techniken basierender Ansatz für die Segmentierung von Vorlesungsaufzeichnungen zu besseren Resultaten führt, ist zwar anzuzweifeln, jedoch nicht ausgeschlossen. 105
Seite 1 und 2:
ALBERT-LUDWIGS-UNIVERSITÄT FREIBUR
Seite 3:
Vorwort Ich möchte mich bei Prof.
Seite 6 und 7:
6 INHALTSVERZEICHNIS 3 Extraktion v
Seite 8 und 9:
Abbildungsverzeichnis 1.1 Story Seg
Seite 10 und 11:
Tabellenverzeichnis 3.1 Mathematisc
Seite 12 und 13:
12 KAPITEL 1. EINLEITUNG, MOTIVATIO
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Kapitel 2 Grundlagen der Sprachanal
Seite 22 und 23:
22 KAPITEL 2. GRUNDLAGEN DER SPRACH
Seite 24 und 25:
Seite 26 und 27:
Seite 28 und 29:
Seite 30 und 31:
Seite 32 und 33:
Seite 34 und 35:
Seite 36 und 37:
Seite 38 und 39:
Seite 40 und 41:
Kapitel 3 Extraktion von Audio-Feat
Seite 42 und 43:
42 KAPITEL 3. EXTRAKTION VON AUDIO-
Seite 44 und 45:
Seite 46 und 47:
Seite 48 und 49:
Seite 50 und 51:
Seite 52 und 53:
Seite 54 und 55: 54 KAPITEL 3. EXTRAKTION VON AUDIO-
Seite 70 und 71: Kapitel 4 Segmentierungsverfahren I
Seite 72 und 73: 72 KAPITEL 4. SEGMENTIERUNGSVERFAHR
Seite 86 und 87: 86 KAPITEL 5. EVALUATION grobe Segm
Seite 88 und 89: 88 KAPITEL 5. EVALUATION Topic Begi
Seite 90 und 91: 90 KAPITEL 5. EVALUATION Die folgen
Seite 92 und 93: 92 KAPITEL 5. EVALUATION Datei: ga7
Seite 94 und 95: 94 KAPITEL 5. EVALUATION Analyse Ei
Seite 96 und 97: 96 KAPITEL 5. EVALUATION dsaas §
Seite 98 und 99: 98 KAPITEL 5. EVALUATION Präferenz
Seite 100 und 101: 100 KAPITEL 5. EVALUATION Segment-L
Seite 102 und 103: 102 KAPITEL 5. EVALUATION Precision
Seite 106 und 107: Anhang A Beispiel einer Text-Transk
Seite 108 und 109: 108 ANHANG A. BEISPIEL EINER TEXT-T
Seite 110 und 111: Anhang B Segmentierung am Beispiel
Seite 112 und 113: 112ANHANG B. SEGMENTIERUNG AM BEISP
Seite 114 und 115: 114ANHANG B. SEGMENTIERUNG AM BEISP
Seite 116 und 117: Literaturverzeichnis [1] AOF - Auth
Seite 118 und 119: 118 LITERATURVERZEICHNIS [23] OTTMA
Alle anzeigen

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?