28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Kapitel 5<br />

Evaluation<br />

Im vorgangehenden Kapitel wurden Verfahren vorgestellt, mit deren Hilfe eine automatische<br />

Segmentierung einer Sprachdatei vorgenommen werden soll. Das Resultat dieser Segmentierung<br />

soll eine Folge von Zeigern in diese Sprachdatei sein, die den zeitlichen Beginn eines inhaltlichen<br />

Zusammenhangs anzeigen. Beispiel:<br />

Start (Sek.)<br />

0.00<br />

4.84<br />

35.69<br />

53.95<br />

.<br />

Hier schließt sich die Frage an, wie die Ausgaben der einzelnen Verfahren hinsichtlich ihrer<br />

Treffsicherheit bewertet werden sollen. Dazu muß man sich zunächst überlegen, zu welcher<br />

Referenz die Ergebnisse der Segmentierungsverfahren verglichen werden sollen und wie fein<br />

die Referenzsegmentierung sein soll.<br />

Granularität der Segmentierung<br />

Der zweite Punkt soll kurz an einem Beispiel verdeutlicht werden. Angenommen, der Autor eines<br />

Vortrages hat eine Unterteilung in vier Kapitel vorgesehen, die sich weiter untergliedern lassen.<br />

Nun stellt sich die Frage, bis zu welcher Tiefe (Segment-Level) der auftretenden Gliederungshierarchie<br />

(discourse structure) evaluiert werden soll. Tabelle 5.1 zeigt ein Beispiel <strong>für</strong> eine<br />

grobe und eine feine Segmentierung. Auf den ersten Blick könnte man denken, daß die grobe<br />

Segmentierung leichter zu erreichen sei, als die feine Segmentierung, da weniger Items zu detektieren<br />

sind. Dem ist aber nicht so, da die <strong>Algorithmen</strong> nicht zwischen Kapitel, Abschnitt und Absatz<br />

unterscheiden können. Dies hängt damit zusammen, daß keine Information darüber vorliegt,<br />

85

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!