Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
ein schnelles Navigieren innerhalb der Sprachdatei zu ermöglichen. Hier<strong>für</strong> ist es nicht<br />
zwingend notwendig, exakte Zeitpunkte der Topic Beginnings zu finden. STIFELMAN bescheinigte<br />
dem Verfahren in einer Untersuchung eine hohe Precision ( £¦¤<br />
) und einen niedrigen Recall<br />
¥<br />
¤<br />
). Diese Ergebnisse konnten nicht nachvollzogen werden. Dies liegt vor allen Dingen an<br />
den unterschiedlichen Meßmethoden (siehe Kapitel 5.3).<br />
(¦<br />
Die vorliegende Untersuchung zeigt, daß es mit einfachen Mitteln sehr schwierig ist, die untersuchte<br />
Klasse von Sprachdateien zu segmentieren. Die Resultate <strong>für</strong> die Radio-Nachrichtensendungen<br />
(vergleiche Anhang B) belegen, daß die untersuchten Verfahren sehr wohl eine brauchbare<br />
Segmentierung liefern können, wobei das EDBS-Verfahren auch auf diesen Daten sprecherabhängige<br />
Resultate liefert.<br />
Wie bereits mehrfach erwähnt, gibt es Forschungsansätze <strong>für</strong> die Segmentierung, die mit<br />
statistischen Modellen oder auch mit Data Mining/Machine-Learning-Techniken arbeiten.<br />
Auch diese Arbeiten verwenden als Audio-Features hauptsächlich Pausen und Informationen,<br />
die sich aus der Satzmelodie ergeben. Die Berechnung dieser Features ist mit der <strong>für</strong> diese<br />
Diplomarbeit entwickelten C++-Bibiliothek leicht möglich. Es wurde ein Programm entwickelt,<br />
das verschiedene Audio-Features wie beispielsweise Pausenlänge, Energie und diverse Pitch-<br />
Features <strong>für</strong> Sprachsegmente im ARFF-Datenformat ausgibt, welches von der WEKA-Bibiothek<br />
verarbeitet werden kann. Die WEKA-Bibliothek ist ein JAVA-Tool, das diverse Data Mining und<br />
Machine-Learning <strong>Algorithmen</strong> zur Verfügung stellt [38]. HIRSCHBERG, NAKATANI [18] sowie<br />
SHRIBERG ET. AL [32] verwenden beispielsweise erfolgreich Klassifikations- und<br />
Regressionsbäume (CART) in ihren Projekten. Allerdings muß auch hierbei wieder die von<br />
diesen Autoren verwendete Datenbasis in Betracht gezogen werden. Ob ein auf Data Mining/<br />
Machine-Learning-Techniken basierender Ansatz <strong>für</strong> die Segmentierung von Vorlesungsaufzeichnungen<br />
zu besseren Resultaten führt, ist zwar anzuzweifeln, jedoch nicht ausgeschlossen.<br />
105