Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
16 KAPITEL 1. EINLEITUNG, MOTIVATION<br />
<strong>für</strong> diese Diplomarbeit ausgesucht, die nicht auf statistischen Modellen basieren. Das erste vorzustellende<br />
Verfahren verwendet die Dauer von Sprechpausen zur Voraussage einer möglichen<br />
Gliederung. Der zweite Algorithmus versucht Betonungen des Sprechers zu ermitteln, die anschließend<br />
Hinweise auf die Gliederung des Gesprochenen liefern sollen. Über die Hintergründe<br />
dieser Ansätze klären die Einleitungen der Kapitel 4.1 und 4.2 auf. Ziel war es nun, die angesprochenen<br />
<strong>Algorithmen</strong> auf ihre Verwendbarkeit zu überprüfen, insbesondere im Hinblick auf<br />
die speziellen Daten, die dieser Untersuchung zugrunde liegen.<br />
1.3 Inhaltlicher Aufbau dieser Arbeit<br />
Die Arbeit gliedert sich in sechs Teile:<br />
Nachdem im vorliegenden Kapitel bereits eine Einführung in die Motivationen und Ziele<br />
dieser Arbeit gegeben wurde, sowie eine Vorstellung von Arbeiten mit ähnlichem Thema<br />
erfolgt ist, wird im Rest des Kapitels die verwendete Datenbasis erläutert.<br />
Das Kapitel Grundlagen der Sprachanalyse erläutert die wichtigsten Konzepte und<br />
Begriffe der Sprachanalyse. Es gliedert sich wiederum in drei Unterkapitel. Im ersten<br />
Teil Einführung wird ein kurzer Überblick über die Sprachverarbeitung im allgemeinen<br />
gegeben. Der zweite Abschnitt beschäftigt sich mit der Erzeugung der menschlichen<br />
Sprache, und im dritten Teil werden Konzepte und Notation der digitalen Signalverarbeitung<br />
erläutert. Dieses Kapitel ist <strong>für</strong> denjenigen Leser gedacht, der sich bislang noch<br />
nicht mit dieser Materie beschäftigt hat, aber auch nicht zu tief in das Themengebiet einsteigen<br />
will. Es ersetzt nicht das Studium einschlägiger Literatur, wenn ein tieferes Verständnis<br />
erwünscht ist. Die Begriffe werden in den meisten Fällen informell erklärt, so<br />
daß auch die später folgenden Kapitel ohne tiefgreifendes Studium der digitalen Signalund<br />
Sprachverarbeitung verstanden werden können. Der Leser mit Kenntnissen auf diesen<br />
Gebieten kann das Kapitel überspringen.<br />
Das dritte Kapitel Extraktion von Audio-Features erläutert die low level-Eigenschaften,<br />
die von den in Kapitel 4 vorgestellten Verfahren verwendet werden, und wie sie aus dem<br />
Audiosignal extrahiert werden können.<br />
Im vierten Kapitel Segmentierung/Emphasis-Detection werden Verfahren vorgestellt,<br />
die daraufhin untersucht werden sollen, in wie weit sie sich zur Segmentierung bzw. zur<br />
Suche in Sprachdateien eignen. Der erste Teil dieses Kapitels stellt ein Verfahren vor,<br />
das versucht, Sprechpausen zur Berechnung einer Segmentierung heranzuziehen. Bei der<br />
Emphasis-Detection geht es darum, besonders betonte Stellen in einem Vortrag zu finden.<br />
Diese erlauben eventuell Rückschlüsse auf eine mögliche Gliederung des Vortrages.<br />
Das fünfte Kapitel Evaluation beschäftigt sich mit der Aus- und Bewertung der <strong>Algorithmen</strong><br />
bezüglich ihrer Nutzbarkeit im Rahmen des AOF-Projekts [1]. In Kapitel 1.4 wird