28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

16 KAPITEL 1. EINLEITUNG, MOTIVATION<br />

<strong>für</strong> diese Diplomarbeit ausgesucht, die nicht auf statistischen Modellen basieren. Das erste vorzustellende<br />

Verfahren verwendet die Dauer von Sprechpausen zur Voraussage einer möglichen<br />

Gliederung. Der zweite Algorithmus versucht Betonungen des Sprechers zu ermitteln, die anschließend<br />

Hinweise auf die Gliederung des Gesprochenen liefern sollen. Über die Hintergründe<br />

dieser Ansätze klären die Einleitungen der Kapitel 4.1 und 4.2 auf. Ziel war es nun, die angesprochenen<br />

<strong>Algorithmen</strong> auf ihre Verwendbarkeit zu überprüfen, insbesondere im Hinblick auf<br />

die speziellen Daten, die dieser Untersuchung zugrunde liegen.<br />

1.3 Inhaltlicher Aufbau dieser Arbeit<br />

Die Arbeit gliedert sich in sechs Teile:<br />

Nachdem im vorliegenden Kapitel bereits eine Einführung in die Motivationen und Ziele<br />

dieser Arbeit gegeben wurde, sowie eine Vorstellung von Arbeiten mit ähnlichem Thema<br />

erfolgt ist, wird im Rest des Kapitels die verwendete Datenbasis erläutert.<br />

Das Kapitel Grundlagen der Sprachanalyse erläutert die wichtigsten Konzepte und<br />

Begriffe der Sprachanalyse. Es gliedert sich wiederum in drei Unterkapitel. Im ersten<br />

Teil Einführung wird ein kurzer Überblick über die Sprachverarbeitung im allgemeinen<br />

gegeben. Der zweite Abschnitt beschäftigt sich mit der Erzeugung der menschlichen<br />

Sprache, und im dritten Teil werden Konzepte und Notation der digitalen Signalverarbeitung<br />

erläutert. Dieses Kapitel ist <strong>für</strong> denjenigen Leser gedacht, der sich bislang noch<br />

nicht mit dieser Materie beschäftigt hat, aber auch nicht zu tief in das Themengebiet einsteigen<br />

will. Es ersetzt nicht das Studium einschlägiger Literatur, wenn ein tieferes Verständnis<br />

erwünscht ist. Die Begriffe werden in den meisten Fällen informell erklärt, so<br />

daß auch die später folgenden Kapitel ohne tiefgreifendes Studium der digitalen Signalund<br />

Sprachverarbeitung verstanden werden können. Der Leser mit Kenntnissen auf diesen<br />

Gebieten kann das Kapitel überspringen.<br />

Das dritte Kapitel Extraktion von Audio-Features erläutert die low level-Eigenschaften,<br />

die von den in Kapitel 4 vorgestellten Verfahren verwendet werden, und wie sie aus dem<br />

Audiosignal extrahiert werden können.<br />

Im vierten Kapitel Segmentierung/Emphasis-Detection werden Verfahren vorgestellt,<br />

die daraufhin untersucht werden sollen, in wie weit sie sich zur Segmentierung bzw. zur<br />

Suche in Sprachdateien eignen. Der erste Teil dieses Kapitels stellt ein Verfahren vor,<br />

das versucht, Sprechpausen zur Berechnung einer Segmentierung heranzuziehen. Bei der<br />

Emphasis-Detection geht es darum, besonders betonte Stellen in einem Vortrag zu finden.<br />

Diese erlauben eventuell Rückschlüsse auf eine mögliche Gliederung des Vortrages.<br />

Das fünfte Kapitel Evaluation beschäftigt sich mit der Aus- und Bewertung der <strong>Algorithmen</strong><br />

bezüglich ihrer Nutzbarkeit im Rahmen des AOF-Projekts [1]. In Kapitel 1.4 wird

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!