Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
4.2. EMPHASIS-DETECTION-BASIERTE SEGMENTIERUNG (EDBS) 81<br />
Emphasis<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
Emphasis<br />
0<br />
0 100 200 300 400 500 600 700 800 900<br />
Zeit (Sek.)<br />
(a) Schwellwert=1%, ¢¡¤£¦¥¨§<br />
Emphasis<br />
150<br />
100<br />
50<br />
Emphasis<br />
0<br />
0 100 200 300 400 500 600 700 800 900<br />
Zeit (Sek.)<br />
(b) Schwellwert=1%, ¢¡¤£¦¥©<br />
Abbildung 4.8: Ausgabe des EDBS-Algorithmus <strong>für</strong> einen 15-minütigen Ausschnitt aus einer Sprachdatei.<br />
Allerdings verfolgten sie ein ganz anderes Ziel, die automatische Erstellung von Zusammenfassungen.<br />
Die kombinierte Pitch-Aktivität §¦ liefert in diesem Fall ein Maß<br />
<strong>für</strong> die Betonung auf Phrasen- oder Satzebene. Verkürzt man diese Zeitfenster auf © <br />
können Betonungen auf der Wortebene gefunden werden. Abbildung 4.8 zeigt das Ergebnis<br />
von Testläufen <strong>für</strong> einen 15 minütigen Ausschnitt aus einer Vorlesung, die [24] entnommen<br />
wurde. Der Schwellwert beträgt in beiden Fällen . Die Länge des Zeitfensters<br />
beträgt im Fall a) ¨ © und im Fall b) .<br />
Der gesamte Ablauf dieses Verfahrens wird durch die Abbildungen 4.9 und 4.10 nochmals anhand<br />
eines Beispiels verdeutlicht. Die oben erläuterten Schritte lassen sich dadurch sehr gut<br />
nachvollziehen.<br />
4.2.2 Anwendungsmöglichkeiten des Emphasis-Detection-Algorithmus<br />
Nun bieten sich mehrere Möglichkeiten zur weiteren Vorgehensweise an. Drei Anwendungen<br />
werden kurz erläutert:<br />
1. Es kann eine Zusammenfassung der Sprachdatei erstellt werden. Hierzu werden die Zeitfenster<br />
bezüglich ihrer Emphasis sortiert. Segmente dieser Fenster können nun nach absteigenden<br />
Emphasis-Werten zu der Zusammenfassung hinzugefügt werden, bis die sie<br />
ihre gewünschte Länge hat [16].<br />
2. Die Ergebnisse können zum schnellen Navigieren in der Sprachdatei verwendet werden.<br />
Auch hierzu werden die Zeitfenster bezüglich ihrer Emphasis sortiert. Die Segmente mit