Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Kapitel 6<br />
Zusammenfassung und Ausblick<br />
Erklärtes Ziel dieser Arbeit war die Evaluation zweier Segmentierungsverfahren hinsichtlich<br />
ihrer Nutzbarkeit <strong>für</strong> die automatische Segmentierung vorhandener sowie zukünftiger Vorlesungsaufzeichnungen.<br />
Die untersuchten Verfahren wurden ausgewählt, weil sie nicht auf statistischen<br />
Modellen beruhen, welche beispielsweise durch neuronale Netze oder Hidden-Markov-Modelle<br />
realisiert werden können. Segmentierungsverfahren, die auf solchen Modellen beruhen,<br />
haben den entscheidenden Nachteil, daß sie trainiert werden müssen. Dazu muß zunächst<br />
eine große Menge von Trainingsdaten (von Hand) erstellt werden. Das resultierende statistische<br />
Modell kann dann wiederum mit Testdaten überprüft werden, die unter Umständen auch wieder<br />
manuell zu erstellen sind. Dies bedeutet einen großen Zeitaufwand <strong>für</strong> die Erstellung der<br />
Trainings- und Testdaten. Zudem ist die Zusammenstellung dieser Datenmengen unter Umständen<br />
kritisch, wenn nicht ausreichend große Datenmengen zur Verfügung stehen. Was man<br />
sich nun wünschen würde, wäre ein Verfahren, das ohne jegliche Vor- und Nachbearbeitung angewendet<br />
werden könnte.<br />
In Kapitel 4 wurden zwei <strong>Algorithmen</strong> vorgestellt, die ohne statistische Modelle auskommen<br />
und von anderen Projekten in ähnlicher Form erfolgreich eingesetzt wurden [4][16]. Die technischen<br />
Grundlagen <strong>für</strong> diese <strong>Algorithmen</strong> wurden in den Kapiteln 2 und 3 erläutert. Die <strong>Algorithmen</strong><br />
wurden in der Programmiersprache C++ auf einem PC unter dem Betriebssystem LinuX<br />
implementiert. Die Implementierung wurde so vorgenommen, daß eine Portierung auf andere<br />
Betriebssysteme leicht möglich ist. Es wurde großer Wert auf Wiederverwendbarkeit gelegt, so<br />
daß bei weitergehenden Forschungen auf die vorhandenen Funktionen zurückgegriffen werden<br />
kann.<br />
Die Aus- und Bewertung der vorgestellten pausenbasierten Segmentierung (PBS) und der pitchbasierten<br />
Segmentierung (EDBS) ergab, daß die Verfahren in dieser Form und <strong>für</strong> die exakte<br />
Segmentierung von Vorlesungsaufzeichnungen nicht zu befriedigenden Ergebnissen führen (vergleiche<br />
Kapitel 5). Vor allen Dingen die mangelnde Präzision der <strong>Algorithmen</strong> verhindert die<br />
sinnvolle Nutzung dieser Segmentierungsverfahren <strong>für</strong> den angesprochenen Zweck. Dies schließt<br />
allerdings nicht aus, daß diese Verfahren nicht <strong>für</strong> andere Verwendungszwecke geeignet sein<br />
könnten. ARONS entwickelte EDBS, um Zusammenfassungen aus Sprachdateien erstellen und<br />
104