15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2<br />

Cap. 1. Introducere<br />

Se prezintă apoi principiile procesului de segmentare fonematică, de asociere a<br />

segmentelor semnalului vocal cu secvenţele de foneme corespunzând semanticii (reprezentării<br />

textuale) a semnalului vorbit. Au fost expuse trei metode principale de segmentare fonematică,<br />

extrase din literatura de specialitate.<br />

Sunt prezentate şi contribuţiile autorului în problematica segmentării fonematice a<br />

semnalului vocal, respectiv metoda de segmentare fonematică bazată pe reguli de asociere<br />

foneme-regiuni. S-au explicat paşii metodei, setul de reguli folosit, s-au prezentat rezultatele şi<br />

avantajele metodei. Au fost arătate aplicaţiile metodei de segmentare fonematică în procesul de<br />

construire a bazelor de date vocale.<br />

Capitolul 5 a fost dedicat prezentării domeniului sintezei vorbirii; a fost expus modelul<br />

general al sintezei vorbirii, sistemul de sinteză text-to-speech, precum şi metodele de bază<br />

folosite în sinteza text-to-speech. Au fost descrise etapele procesului sintezei vocale pornind de<br />

la text.<br />

Capitolul 6 prezintă metodele existente de sinteză a vorbirii, atât în domeniul frecvenţă<br />

cât şi în domeniul timp. Dintre metodele de sinteză în domeniul frecvenţă au fost expuse metoda<br />

formantică şi metoda LPC ( Linear Predictive Coding), iar în cadrul metodelor de sinteză în<br />

domeniul timp au fost detaliate metoda TD-PSOLA (Time Domain Pitch Synchronous Overlapp<br />

and Add) şi metoda de sinteză bazată pe corpus.<br />

Ca şi contribuţie în domeniul proiectării metodelor de sinteză vocală, s-a prezentat<br />

metoda de sinteză vocală pe bază de silabe pentru limba română. Metoda cuprinde următoarele<br />

etape: preprocesarea textului, analiza de sintaxă, determinarea unităţilor lingvistice de tipul<br />

silabelor, determinarea prozodiei intra-segmentale (accentuaţia), regăsirea unităţilor acustice din<br />

baza de date vocală, concatenarea unităţilor acustice şi sinteza propriu-zisă a rostirii.<br />

A fost descris setul de reguli pentru preprocesarea textului sursă. S-a prezentat apoi<br />

metoda de analiză de sintaxă şi setul de reguli pentru analiza formelor flexionate din limba<br />

română. Este prezentat analizorul lexical pentru despărţirea cuvintelor în silabe, precum şi setul<br />

de reguli utilizat în detectarea silabelor. Se expune apoi modul de determinare a aspectelor<br />

prozodice segmentale, prezentându-se analizorul lexical utilizat în determinarea accentelor şi<br />

setul de reguli asociat.<br />

În continuare se descrie structura şi modul de organizare a bazei de date vocale. Baza de<br />

date este alcătuită dintr-un subset al silabelor limbii române, subset alcătuit pe baza frecvenţelor<br />

de apariţie ale silabelor în limba română vorbită. Pentru a determina aceste frecvenţe de apariţie,<br />

a fost realizată o statistică utilizând un corpus de texte conţinând peste 300000 de cuvinte.<br />

Este prezentată apoi modalitatea de regăsire a unităţilor acustice din baza de date vocală.<br />

Căutarea în baza de date se face după lungimea silabei, contextul median sau final în cadrul<br />

cuvântului şi accentuare. A fost expus în continuare modul de concatenare a unităţilor acustice<br />

pentru a forma semnalul de ieşire, precum şi modul de realizare a sintezei de voce.<br />

Capitolul 7 prezintă sistemul de sinteză de voce în limba română LIGHTVOX, sistem<br />

care implementează metoda de sinteză pe bază de silabe dezvoltată de autor. S-au descris<br />

organizarea pe module a sistemului, etapele de proiectare, precum şi paşii care au fost realizaţi la<br />

fiecare etapă. Este detaliat modul de construire a bazei de date vocale şi se prezintă algoritmul de<br />

implementare al procesului de conversie text-voce. În finalul capitolului sunt arătate rezultatele<br />

obţinute cu sistemul de sinteză vocală, aplicaţiile şi dezvoltările de viitor.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!