Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Kapitel 5<br />
Evaluation<br />
Im vorgangehenden Kapitel wurden Verfahren vorgestellt, mit deren Hilfe eine automatische<br />
Segmentierung einer Sprachdatei vorgenommen werden soll. Das Resultat dieser Segmentierung<br />
soll eine Folge von Zeigern in diese Sprachdatei sein, die den zeitlichen Beginn eines inhaltlichen<br />
Zusammenhangs anzeigen. Beispiel:<br />
Start (Sek.)<br />
0.00<br />
4.84<br />
35.69<br />
53.95<br />
.<br />
Hier schließt sich die Frage an, wie die Ausgaben der einzelnen Verfahren hinsichtlich ihrer<br />
Treffsicherheit bewertet werden sollen. Dazu muß man sich zunächst überlegen, zu welcher<br />
Referenz die Ergebnisse der Segmentierungsverfahren verglichen werden sollen und wie fein<br />
die Referenzsegmentierung sein soll.<br />
Granularität der Segmentierung<br />
Der zweite Punkt soll kurz an einem Beispiel verdeutlicht werden. Angenommen, der Autor eines<br />
Vortrages hat eine Unterteilung in vier Kapitel vorgesehen, die sich weiter untergliedern lassen.<br />
Nun stellt sich die Frage, bis zu welcher Tiefe (Segment-Level) der auftretenden Gliederungshierarchie<br />
(discourse structure) evaluiert werden soll. Tabelle 5.1 zeigt ein Beispiel <strong>für</strong> eine<br />
grobe und eine feine Segmentierung. Auf den ersten Blick könnte man denken, daß die grobe<br />
Segmentierung leichter zu erreichen sei, als die feine Segmentierung, da weniger Items zu detektieren<br />
sind. Dem ist aber nicht so, da die <strong>Algorithmen</strong> nicht zwischen Kapitel, Abschnitt und Absatz<br />
unterscheiden können. Dies hängt damit zusammen, daß keine Information darüber vorliegt,<br />
85