28.06.2013 Aufrufe

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

2.1. EINFÜHRUNG 21<br />

Anwendungsgebiete der Sprachverarbeitung<br />

Zu den ersten Anwendungen gehörte die Kodierung von Sprache mit möglichst geringer Bitrate.<br />

Vor allem in der Übertragungstechnik ist man stark an einer Komprimierung der anfallenden<br />

Datenmenge interessiert. Als Beispiele <strong>für</strong> mögliche Anwendungen im Bereich der Übertragungstechnik<br />

seien hier Satellitensysteme und Mobilfunk genannt. Derzeit aktuell ist das Thema Datenreduktion<br />

auch in der Unterhaltungselektronik bzw. der Übertragung von Musik via Internet.<br />

Der Begriff MP3 ist momentan in aller Munde und stellt einen Standard zur verlustbehafteten<br />

Speicherung und Übertragung von Audiodaten mit guter Qualität dar. Ein weiteres Gebiet der<br />

Sprachverarbeitung ist die Sprechererkennung, deren Aufgabe es ist, Personen anhand ihrer<br />

Stimme eindeutig zu erkennen (Sprecheridentifikation) oder zu entscheiden, ob ein<br />

Sprecher zu einem bestimmten Personenkreis gehört (Sprecherverifikation). Als Einsatzgebiet<br />

der Sprecheridentifikation könnte man sich vorstellen, automatisch zu einer gegebenen<br />

Menge von Audio-Dateien, z.B. aufgezeichnete Vorlesungen, den bzw. die Sprecher zu bestimmen,<br />

so daß eine einfache Suche nach einem bestimmten Sprecher in einer Menge der Audio-<br />

Dateien möglich ist. Mit dem Begriff der Spracherkennung verbindet man im allgemeinen die<br />

Transformation des akustischen Sprachsignals in geschriebenen Text. Schon seit geraumer Zeit<br />

existieren Systeme, die dies mit zufriedenstellenden Ergebnissen bewerkstelligen, wenn<br />

bestimmte Randbedingungen erfüllt sind. Die Spracherkennung kann aber auch zur Steuerung<br />

von und Kommunikation mit Maschinen eingesetzt werden. Sprachsynthese dient der Ausgabe<br />

von Meldungen an den Bediener technischer Einrichtungen und der Mensch-Maschine-<br />

Kommunikation bei computergesteuerten Dialogsystemen. Ein weiteres wichtiges Gebiet der<br />

Sprachverarbeitung ist die Verbesserung der Sprachqualität. Leider werden bei der Übertragung<br />

von Sprache die Signale verändert, verzerrt oder gehen verloren. Als Beispiele der<br />

Verbesserung der Sprachqualität sei die Verbesserung des Signal-Rausch-Verhältnisses oder die<br />

Wiedergewinnung verlorener Sprachsegmente genannt. Die bislang aufgeführten Anwendungsgebiete<br />

stellen klassische Beispiele der Sprachverarbeitung dar. Ein Gebiet, daß noch nicht erwähnte<br />

wurde, ist die Informationssuche in Audio-, Video- und Sprachdateien. In<br />

Kapitel 1.1.2 wurde dieses Gebiet kurz vorgestellt. Die vorliegende Arbeit beschäftigt sich ausschließlich<br />

mit der Informationssuche in aufgezeichneten Sprachdateien. Aus den physikalischen<br />

Eigenschaften des aufgezeichneten Signals sollen Informationen extrahiert werden, die die automatische<br />

Strukturierung von Multimedia-Dokumenten unterstützen. Abbildung 2.2 faßt die besprochenen<br />

Anwendungsgebiete noch einmal zusammen.<br />

Sprachkodie- Sprecherer-<br />

rung <strong>für</strong> Übertragung<br />

und<br />

Speicherung<br />

kennung und<br />

-verifizierung<br />

Anwendungen der Sprachverarbeitung<br />

Spracherkennung<br />

Sprach-<br />

synthese<br />

Verbesserung Informations-<br />

der Sprachsuche in<br />

qualität Audio- und<br />

Videodateien<br />

Abbildung 2.2: Anwendungsgebiete der Sprachverarbeitung

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!