Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
2.1. EINFÜHRUNG 21<br />
Anwendungsgebiete der Sprachverarbeitung<br />
Zu den ersten Anwendungen gehörte die Kodierung von Sprache mit möglichst geringer Bitrate.<br />
Vor allem in der Übertragungstechnik ist man stark an einer Komprimierung der anfallenden<br />
Datenmenge interessiert. Als Beispiele <strong>für</strong> mögliche Anwendungen im Bereich der Übertragungstechnik<br />
seien hier Satellitensysteme und Mobilfunk genannt. Derzeit aktuell ist das Thema Datenreduktion<br />
auch in der Unterhaltungselektronik bzw. der Übertragung von Musik via Internet.<br />
Der Begriff MP3 ist momentan in aller Munde und stellt einen Standard zur verlustbehafteten<br />
Speicherung und Übertragung von Audiodaten mit guter Qualität dar. Ein weiteres Gebiet der<br />
Sprachverarbeitung ist die Sprechererkennung, deren Aufgabe es ist, Personen anhand ihrer<br />
Stimme eindeutig zu erkennen (Sprecheridentifikation) oder zu entscheiden, ob ein<br />
Sprecher zu einem bestimmten Personenkreis gehört (Sprecherverifikation). Als Einsatzgebiet<br />
der Sprecheridentifikation könnte man sich vorstellen, automatisch zu einer gegebenen<br />
Menge von Audio-Dateien, z.B. aufgezeichnete Vorlesungen, den bzw. die Sprecher zu bestimmen,<br />
so daß eine einfache Suche nach einem bestimmten Sprecher in einer Menge der Audio-<br />
Dateien möglich ist. Mit dem Begriff der Spracherkennung verbindet man im allgemeinen die<br />
Transformation des akustischen Sprachsignals in geschriebenen Text. Schon seit geraumer Zeit<br />
existieren Systeme, die dies mit zufriedenstellenden Ergebnissen bewerkstelligen, wenn<br />
bestimmte Randbedingungen erfüllt sind. Die Spracherkennung kann aber auch zur Steuerung<br />
von und Kommunikation mit Maschinen eingesetzt werden. Sprachsynthese dient der Ausgabe<br />
von Meldungen an den Bediener technischer Einrichtungen und der Mensch-Maschine-<br />
Kommunikation bei computergesteuerten Dialogsystemen. Ein weiteres wichtiges Gebiet der<br />
Sprachverarbeitung ist die Verbesserung der Sprachqualität. Leider werden bei der Übertragung<br />
von Sprache die Signale verändert, verzerrt oder gehen verloren. Als Beispiele der<br />
Verbesserung der Sprachqualität sei die Verbesserung des Signal-Rausch-Verhältnisses oder die<br />
Wiedergewinnung verlorener Sprachsegmente genannt. Die bislang aufgeführten Anwendungsgebiete<br />
stellen klassische Beispiele der Sprachverarbeitung dar. Ein Gebiet, daß noch nicht erwähnte<br />
wurde, ist die Informationssuche in Audio-, Video- und Sprachdateien. In<br />
Kapitel 1.1.2 wurde dieses Gebiet kurz vorgestellt. Die vorliegende Arbeit beschäftigt sich ausschließlich<br />
mit der Informationssuche in aufgezeichneten Sprachdateien. Aus den physikalischen<br />
Eigenschaften des aufgezeichneten Signals sollen Informationen extrahiert werden, die die automatische<br />
Strukturierung von Multimedia-Dokumenten unterstützen. Abbildung 2.2 faßt die besprochenen<br />
Anwendungsgebiete noch einmal zusammen.<br />
Sprachkodie- Sprecherer-<br />
rung <strong>für</strong> Übertragung<br />
und<br />
Speicherung<br />
kennung und<br />
-verifizierung<br />
Anwendungen der Sprachverarbeitung<br />
Spracherkennung<br />
Sprach-<br />
synthese<br />
Verbesserung Informations-<br />
der Sprachsuche in<br />
qualität Audio- und<br />
Videodateien<br />
Abbildung 2.2: Anwendungsgebiete der Sprachverarbeitung