Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
88 KAPITEL 5. EVALUATION<br />
Topic Beginning PBS EDBS<br />
(Sek.) (Sek.) Emphasis Zeitpunkt<br />
0:00,00 0:00,00 0 0s<br />
0 1s<br />
0 2s<br />
0:03,45 0:03,45 1 3s<br />
2 4s<br />
0:05,78 0 5s<br />
1 6s<br />
0 7s<br />
0:08,92 0:08,92 0 8s<br />
4 9s<br />
5 10s<br />
Tabelle 5.3: Beispielhafte Gegenüberstellung von tatsächlichem Topic Beginning und den Ausgaben der<br />
Segmentierungsverfahren<br />
Formal werden Recall und Precision in Anlehnung an [35] wie folgt definiert:<br />
Definition 5.1 Die Trefferhäufigkeit (Recall) und Genauigkeit (Precision) eines Segmentierungsverfahrens<br />
sind durch<br />
© ¡ ¢ ¡ ¡ ¡<br />
¡<br />
¡<br />
<br />
¡ <br />
<br />
©<br />
¡<br />
<br />
¡ <br />
<br />
gegeben, wobei ¡ die Anzahl der Treffer (Hits),<br />
<br />
Beginnings (Misses) und<br />
Problemfälle bei der Interpretation der Ausgaben<br />
(5.1)<br />
¨<br />
(5.2)<br />
<br />
die Anzahl der nicht gefunden Topic<br />
die Anzahl der falschen Alarme (False Alarms) repräsentieren.<br />
¨<br />
Aus der Definition 5.1 ist noch nicht klar ersichtlich, wie Hits, Misses und False Alarms definiert<br />
sind. Diese Begriffe sollen in Abhängigkeit des Verfahrens definiert werden. Grund hier<strong>für</strong> sind<br />
die verschiedenen Ausgaben der <strong>Algorithmen</strong>. PBS gibt beispielsweise seine Ergebnisse in Form<br />
von exakten Zeitpunkten aus, die mit Wort- bzw. Satzgrenzen zusammenfallen. Das zweite Verfahren,<br />
EDBS, welches auf der Detektion von Betonungen basiert, liefert eher grobe Information<br />
über den Zeitpunkt.<br />
Anhand eines kleinen Beispiels (siehe Tabelle 5.3) soll dies verdeutlicht werden. Das PBS-<br />
Verfahren liefert in diesem Beispiel drei Hits und einen False Alarm. Bei diesem Verfahren<br />
kommt es nicht zu Schwierigkeiten bei der Interpretation der Ausgabe, da die ausgegebenen<br />
Zeitmarken zu Wort- beziehungsweise Satzgrenzen korrespondieren. Das EDBS-Verfahren zeigt