28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

ein schnelles Navigieren innerhalb der Sprachdatei zu ermöglichen. Hier<strong>für</strong> ist es nicht<br />

zwingend notwendig, exakte Zeitpunkte der Topic Beginnings zu finden. STIFELMAN bescheinigte<br />

dem Verfahren in einer Untersuchung eine hohe Precision ( £¦¤<br />

) und einen niedrigen Recall<br />

¥<br />

¤<br />

). Diese Ergebnisse konnten nicht nachvollzogen werden. Dies liegt vor allen Dingen an<br />

den unterschiedlichen Meßmethoden (siehe Kapitel 5.3).<br />

(¦<br />

Die vorliegende Untersuchung zeigt, daß es mit einfachen Mitteln sehr schwierig ist, die untersuchte<br />

Klasse von Sprachdateien zu segmentieren. Die Resultate <strong>für</strong> die Radio-Nachrichtensendungen<br />

(vergleiche Anhang B) belegen, daß die untersuchten Verfahren sehr wohl eine brauchbare<br />

Segmentierung liefern können, wobei das EDBS-Verfahren auch auf diesen Daten sprecherabhängige<br />

Resultate liefert.<br />

Wie bereits mehrfach erwähnt, gibt es Forschungsansätze <strong>für</strong> die Segmentierung, die mit<br />

statistischen Modellen oder auch mit Data Mining/Machine-Learning-Techniken arbeiten.<br />

Auch diese Arbeiten verwenden als Audio-Features hauptsächlich Pausen und Informationen,<br />

die sich aus der Satzmelodie ergeben. Die Berechnung dieser Features ist mit der <strong>für</strong> diese<br />

Diplomarbeit entwickelten C++-Bibiliothek leicht möglich. Es wurde ein Programm entwickelt,<br />

das verschiedene Audio-Features wie beispielsweise Pausenlänge, Energie und diverse Pitch-<br />

Features <strong>für</strong> Sprachsegmente im ARFF-Datenformat ausgibt, welches von der WEKA-Bibiothek<br />

verarbeitet werden kann. Die WEKA-Bibliothek ist ein JAVA-Tool, das diverse Data Mining und<br />

Machine-Learning <strong>Algorithmen</strong> zur Verfügung stellt [38]. HIRSCHBERG, NAKATANI [18] sowie<br />

SHRIBERG ET. AL [32] verwenden beispielsweise erfolgreich Klassifikations- und<br />

Regressionsbäume (CART) in ihren Projekten. Allerdings muß auch hierbei wieder die von<br />

diesen Autoren verwendete Datenbasis in Betracht gezogen werden. Ob ein auf Data Mining/<br />

Machine-Learning-Techniken basierender Ansatz <strong>für</strong> die Segmentierung von Vorlesungsaufzeichnungen<br />

zu besseren Resultaten führt, ist zwar anzuzweifeln, jedoch nicht ausgeschlossen.<br />

105

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!