Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Weitere Magazine

Empfehlungen

Info

3. ALLGEMEINER AUFBAU EINES SPRACHERKENNERS 14 3 Allgemeiner Aufbau eines Spracherkenners Dieses Kapitel beschäftigt sich mit dem allgemeinen Aufbau eines Spracherkenners. Abbildung 3.1 zeigt das Grundmodell eines solchen Systems 1 . Abbildung 3.1: Allgemeiner Aufbau eines Spracherkenners In den Teilkapiteln werden die einzelnen Bestandteile näher betrachtet. Außerdem sei noch zu erwähnen, dass zwei grundlegende Ansätze existieren nach denen Erkenner funktionieren. Beim Mustererkennungsansatz (Abbildung 3.2) wird ein einzelnes Muster aus dem Signal gewonnen, dieses mit allen Referenzmustern verglichen und letztendlich das passendste Muster ausgewählt oder das Muster des Signals zurückgewiesen. Dem gegenüber steht der Akustisch-phonetische Ansatz (Abbildung 3.3). Hier wird aus dem Signal eine Menge von Merkmalen extrahiert, verknüpft und danach mit Hilfe des Hypothesentesters mit dem Vokabular verglichen.[9] 1 Mit Signal ist hier bereits das digitalisierte Sprachsignal gemeint. Damit beim digitalisieren keine Informationen verloren gehen, muss die Abtastrate dabei mindestens das Doppelte der größten Frequenz des Sprachsignals entsprechen. Im Fall der menschliche Sprache sind das 8kHz, was zu einer minimalen Abtastrate von 16kHz führt. Es gibt natürlich Ausnahmefälle. Bei Telefonsignalen wird zum Beispiel nur noch ein Bereich von 0,3-3,4kHz übertragen, also wäre hier eine Abtastrate von nur 8kHz vollkommen ausreichend.[8]
3. ALLGEMEINER AUFBAU EINES SPRACHERKENNERS 15 Abbildung 3.2: Mustererkennungsansatz Abbildung 3.3: Akustisch-phonetischer Ansatz 3.1 Signalaufbereitung Die Signalaufbereitung ist eng mit der Analyse verbunden. Ihr Ziel besteht darin, die Schwankungen und Störungen im Signal zu reduzieren und dadurch den späteren Analyseaufwand zu minimieren. Umso besser die Aufbereitung also ist, desto besser können später die Merkmale aus dem Signal abgeleitet werden. Es existieren verschiedene Schritte der Signalaufbereitung, die sich noch einmal in die formale und die spezielle Vorverarbeitung unterteilen lassen. Abbildung 3.4 zeigt den möglichen Aufbau einer Signalaufbereitungskomponente. Abbildung 3.4: Aufbau der Signalaufbereitung 3.1.1 Formale Vorverarbeitung Vorfilterung: Die Vorfilterung unterdrückt, mit Hilfe von Bandsperren und verschiedenen Filtern, Störsignale. Da die
Seite 1 und 2: TECHNISCHE UNIVERSITÄT DRESDEN FAK
Seite 3 und 4: 1 Inhaltsverzeichnis 1 Einleitung 6
Seite 5 und 6: 3 5.3.4 Vokabular . . . . . . . . .
Seite 7 und 8: 5 Selbstständigkeitserklärung Hie
Seite 9 und 10: 2. ALLGEMEINE ANGABEN ZU SPRACHEING
Seite 15: 2. ALLGEMEINE ANGABEN ZU SPRACHEING
Seite 19 und 20: 3. ALLGEMEINER AUFBAU EINES SPRACHE
Seite 25 und 26: 4. ERHÄLTLICHE PROGRAMME 23 4 Erh
Seite 27 und 28: 4. ERHÄLTLICHE PROGRAMME 25 4.1.3
Seite 29 und 30: 4. ERHÄLTLICHE PROGRAMME 27 4.2.4
Seite 31 und 32: 5. FREI VERFÜGBARE SPRACHERKENNER
Seite 43 und 44: 6. TESTS 41 6 Tests Alle drei Syste
Seite 45 und 46: 6. TESTS 43 Menüpunkt Anzahl richt
Seite 47 und 48: 6. TESTS 45 Menüpunkt Sphinx4 JLAB
Seite 49 und 50: 7. AUSWAHL EINES SPRACHERKENNERS 47
Seite 51 und 52: 7. AUSWAHL EINES SPRACHERKENNERS 49
Seite 53 und 54: 8. ENTWICKLUNG EINER SCHNITTSTELLE
Seite 65 und 66: 9. ABSCHLIESSENDE BETRACHTUNGEN 63
Seite 67 und 68:
9. ABSCHLIESSENDE BETRACHTUNGEN 65
Seite 69 und 70:
10. GLOSSAR 67 10 Glossar Erkennung
Seite 71 und 72:
10. GLOSSAR 69 Sprache zu Sprache u
Seite 73 und 74:
10. GLOSSAR 71 []
Seite 75 und 76:
Literaturverzeichnis 73 [13] MICROS
Seite 77 und 78:
Abbildungsverzeichnis 75 Abbildungs
Alle anzeigen

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?