Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Jürgen Dick - Lehrstuhl Algorithmen & Datenstrukturen, Institut für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
66 KAPITEL 3. EXTRAKTION VON AUDIO-FEATURES<br />
Die einzelnen Komponenten sind also nicht linear zusammengesetzt. Das Cepstrum stellt eine<br />
Transformation des Sprachsignals dar, mit deren Hilfe die Anregungsfolge © und die Impuls-<br />
<br />
antwort in gewissen Grenzen getrennt werden können. Der Begriff Cepstrum entsteht durch<br />
Umordnung der Buchstaben des Wortes "spectrum" und deutet die Umordnungen der Frequenzeigenschaften<br />
an, die bei der Bildung des Cepstrums entstehen [12]. Das Cepstrum hat zwei<br />
wichtige Eigenschaften:<br />
1. Die Repräsentanten der Komponentensignale werden im Cepstrum voneinander getrennt.<br />
2. Die Repräsentanten der Komponentensignale werden im Cepstrum linear kombiniert.<br />
Der erste Punkt ist im Zusammenhang mit der Bestimmung der Pitch von Bedeutung. Das<br />
Cepstrum trennt Anregungsfolge © und Impulsantwort des Vokaltraktes, so daß die<br />
Hoffnung besteht, daß mit seiner Hilfe die Periode des Anregungssignals relativ einfach zu bestimmen<br />
ist. Abbildung 3.16 zeigt einen Auschnitt aus einem Sprachsignal und das berechnete<br />
Cepstrum <strong>für</strong> je ein stimmhaftes Segment und ein stimmloses Segment. Für das stimmlose<br />
Segment ist kein Peak im Cepstrum vorhanden, während im Cepstrum <strong>für</strong> das stimmhafte<br />
Segment ein, wenn auch kleiner, Peak zu sehen ist. Dieser Peak enspricht der Pitch, die sich<br />
mit Hilfe des Sample-Index berechnen läßt.<br />
Cepstrale Analyse ist ein Spezialfall innerhalb einer Klasse von Methoden die als homomorphe<br />
Signalverarbeitung bekannt sind. Das aus der homomorphen Signalverarbeitung abgeleitete<br />
Cepstrum wird üblicherweise komplexes Cepstrum (CC) genannt. Das auf BOGEY-TUKEY-<br />
HEALEY (1963) zurückgehende Cepstrum wird im allgemeinen als "Cepstrum" bezeichnet. Um<br />
Konfusionen zu vermeiden, wird letzteres reelles Cepstrum (RC) genannt. Der Hauptunterschied<br />
zwischen reellem und komplexem Cepstrum besteht in der Tatsache, daß das reelle Cepstrum<br />
die Phaseninformation über das Signal entfernt, während sie beim komplexen Cepstrum<br />
erhalten bleibt.<br />
Definition 3.7 Das short-term real Cepstrum ist definiert durch<br />
¡ ¥<br />
<br />
¦<br />
¥§¦<br />
¥ £¢¥¤<br />
£<br />
£<br />
£<br />
£<br />
¤¡ ©¢¡¤£ ¥ © ¡¤£ ¨ <br />
£<br />
<br />
£<br />
¡ ¦ ¤£ §<br />
£<br />
mit ¡ <br />
<br />
<br />
und ist der Index des Frameendes.<br />
¢ ¥ <br />
steht <strong>für</strong> das "gefensterte" Eingangssignal.<br />
<br />
£<br />
£<br />
£<br />
(3.28)<br />
Aus dieser Definiton läßt sich leicht erkennen, daß das reelle Cepstrum durch die Betragsbildung<br />
nur Informationen des Amplitudenspektrums verwendet und alle Phaseninformationen<br />
verwirft. Da in der Praxis die diskrete Fourier-Transformation anstatt der zeitdiskreten Fourier-<br />
Transformation benutzt werden muß, wird das reelle Cepstrum folgendermaßen definiert:<br />
¢<br />
¡ ¥<br />
<br />
<br />
<br />
<br />
<br />
¢<br />
<br />
¡ ¥ ¦<br />
¨§ <br />
¢ <br />
andere <br />
<br />
<br />
<br />
<br />
(3.29)