28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

92 KAPITEL 5. EVALUATION<br />

Datei: ga700_15m.aif (Sprecher 3)<br />

Schwellwert (Sek.) TB H M FA Recall ( ) Precision ( )<br />

0.00 45 40 5 823 89 5<br />

0.50 45 29 16 201 64 13<br />

0.75 45 20 25 91 44 18<br />

1.00 45 15 30 55 33 21<br />

Durchschnitt<br />

Schwellwert (Sek.) TB H M FA Recall ( ) Precision ( )<br />

0.00 174 153 21 2959 87.9 4.9<br />

0.50 174 113 61 822 64.9 12<br />

0.75 174 81 93 437 46.5 15.6<br />

1.00 174 53 121 254 30.4 17.2<br />

5.2.2 Interpretation der Ergebnisse<br />

Zunächst ist auffallend, daß das Segmentierungsverfahren noch nicht einmal alle Topic<br />

Beginnings findet, unabhängig von der Precision. Im Falle des dritten Vortrages erreicht das<br />

Verfahren gar nur einen Recall von ¤<br />

¤<br />

¥<br />

<br />

bei einer Precision von . Im Schnitt über alle vier<br />

untersuchten Sprachdateien ergab sich, daß nur knapp £ £ ¤<br />

¦§¥<br />

¤<br />

¦¤<br />

aller Topic Beginnings überhaupt gefunden<br />

werden konnten. Selbst wenn man sich mit einem Recall von etwa zufrieden geben<br />

könnte, muß doch angemerkt werden, daß eine Precision von nur einfach zu wenig ist, um<br />

die Ausgabe dieses Verfahrens sinnvoll nutzen zu können. Dies schließt jedoch nicht aus, daß die<br />

Daten in Kombination mit anderen Features nicht doch zu befriedigenden Ergebnissen führen<br />

könnten.<br />

Abbildung 5.2 zeigt <strong>für</strong> die vier untersuchten Sprachdateien Pausen-Histogramme. Hierzu<br />

wurde ermittelt, wie lange die Pausen vor den gefundenen, tatsächlichen Topic Beginnings sind.<br />

Es fällt auf, daß es bei keinem der Sprecher einen Wert oder Wertebereich gibt, der besonders<br />

hervorsticht. Dies macht es natürlich besonders schwierig, Topic Beginnings anhand der Pausenlänge<br />

zu bestimmen. Interessant ist ebenfalls, daß sich selbst bei gleichem Sprecher sehr unterschiedliche<br />

Häufigkeitsverteilungen ergeben (siehe Dateien: ga100_15m.aif und ga300_15m.aif).<br />

Dies drückt sich auch in den unterschiedlichen Recall- und Precision-Werte <strong>für</strong> die entsprechenden<br />

Vorträge aus.<br />

Weiterhin fällt auf, daß die Zahl der False Alarms selbst bei einer Mindestpausendauer von<br />

¢£¢ ¢ <br />

die Anzahl der Topic Beginnings weit übersteigt. Die Sprecher legen also sehr viel<br />

<br />

öfter lange Pausen ein, als man sich im Idealfall wünschen würde. Der Idealfall wäre, daß ein<br />

Sprecher nur dann lange <br />

¢£¢ ¢ <br />

) Pausen einlegt, wenn er ein neues Topic beginnt und<br />

einzelnen Sätzen eine Pause von etwa ¥ <br />

¢£¢ ¢ <br />

vorangehen läßt.<br />

(¤<br />

¢£¢

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!