28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

88 KAPITEL 5. EVALUATION<br />

Topic Beginning PBS EDBS<br />

(Sek.) (Sek.) Emphasis Zeitpunkt<br />

0:00,00 0:00,00 0 0s<br />

0 1s<br />

0 2s<br />

0:03,45 0:03,45 1 3s<br />

2 4s<br />

0:05,78 0 5s<br />

1 6s<br />

0 7s<br />

0:08,92 0:08,92 0 8s<br />

4 9s<br />

5 10s<br />

Tabelle 5.3: Beispielhafte Gegenüberstellung von tatsächlichem Topic Beginning und den Ausgaben der<br />

Segmentierungsverfahren<br />

Formal werden Recall und Precision in Anlehnung an [35] wie folgt definiert:<br />

Definition 5.1 Die Trefferhäufigkeit (Recall) und Genauigkeit (Precision) eines Segmentierungsverfahrens<br />

sind durch<br />

© ¡ ¢ ¡ ¡ ¡<br />

¡<br />

¡<br />

<br />

¡ <br />

<br />

©<br />

¡<br />

<br />

¡ <br />

<br />

gegeben, wobei ¡ die Anzahl der Treffer (Hits),<br />

<br />

Beginnings (Misses) und<br />

Problemfälle bei der Interpretation der Ausgaben<br />

(5.1)<br />

¨<br />

(5.2)<br />

<br />

die Anzahl der nicht gefunden Topic<br />

die Anzahl der falschen Alarme (False Alarms) repräsentieren.<br />

¨<br />

Aus der Definition 5.1 ist noch nicht klar ersichtlich, wie Hits, Misses und False Alarms definiert<br />

sind. Diese Begriffe sollen in Abhängigkeit des Verfahrens definiert werden. Grund hier<strong>für</strong> sind<br />

die verschiedenen Ausgaben der <strong>Algorithmen</strong>. PBS gibt beispielsweise seine Ergebnisse in Form<br />

von exakten Zeitpunkten aus, die mit Wort- bzw. Satzgrenzen zusammenfallen. Das zweite Verfahren,<br />

EDBS, welches auf der Detektion von Betonungen basiert, liefert eher grobe Information<br />

über den Zeitpunkt.<br />

Anhand eines kleinen Beispiels (siehe Tabelle 5.3) soll dies verdeutlicht werden. Das PBS-<br />

Verfahren liefert in diesem Beispiel drei Hits und einen False Alarm. Bei diesem Verfahren<br />

kommt es nicht zu Schwierigkeiten bei der Interpretation der Ausgabe, da die ausgegebenen<br />

Zeitmarken zu Wort- beziehungsweise Satzgrenzen korrespondieren. Das EDBS-Verfahren zeigt

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!