Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3. ALLGEMEINER AUFBAU EINES SPRACHERKENNERS 14<br />
3 Allgemeiner Aufbau eines Spracherkenners<br />
Dieses Kapitel beschäftigt sich mit dem allgemeinen Aufbau eines Spracherkenners. Abbildung 3.1 zeigt<br />
das Grundmodell eines solchen Systems 1 .<br />
Abbildung 3.1: Allgemeiner Aufbau eines Spracherkenners<br />
In den Teilkapiteln werden die einzelnen Bestandteile näher betrachtet.<br />
Außerdem sei noch zu erwähnen, dass zwei grundlegende Ansätze existieren nach denen Erkenner funktionieren.<br />
Beim Mustererkennungsansatz (Abbildung 3.2) wird ein einzelnes Muster aus dem Signal<br />
gewonnen, dieses mit allen Referenzmustern verglichen und letztendlich das passendste Muster ausgewählt<br />
oder das Muster des Signals zurückgewiesen. Dem gegenüber steht der Akustisch-phonetische<br />
Ansatz (Abbildung 3.3). Hier wird aus dem Signal eine Menge von Merkmalen extrahiert, verknüpft und<br />
danach mit Hilfe des Hypothesentesters mit dem Vokabular verglichen.[9]<br />
1 Mit Signal ist hier bereits das digitalisierte Sprachsignal gemeint. Damit beim digitalisieren keine Informationen verloren<br />
gehen, muss die Abtastrate dabei mindestens das Doppelte der größten Frequenz des Sprachsignals entsprechen. Im Fall der<br />
menschliche Sprache sind das 8kHz, was zu einer minimalen Abtastrate von 16kHz führt. Es gibt natürlich Ausnahmefälle.<br />
Bei Telefonsignalen wird zum Beispiel nur noch ein Bereich von 0,3-3,4kHz übertragen, also wäre hier eine Abtastrate von<br />
nur 8kHz vollkommen ausreichend.[8]