15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

268<br />

Cap. 8. Concluzii finale<br />

11. A urmat expunerea metodelor existente de sinteză a vorbirii, atât în domeniul<br />

frecvenţă cât şi în domeniul timp. Dintre metodele de sinteză în domeniul frecvenţă au fost<br />

expuse metoda formantică şi metoda LPC (Linear Predictive Coding), iar în cadrul metodelor de<br />

sinteză în domeniul timp au fost detaliate metoda TD-PSOLA (Time Domain Pitch Synchronous<br />

Overlapp and Add) şi metoda de sinteză bazată pe corpus.<br />

12. Ca şi contribuţie în domeniul proiectării metodelor de sinteză vocală, s-a prezentat<br />

metoda autorului de sinteză de voce bazată pe silabe pentru limba română. Metoda cuprinde<br />

următoarele etape: preprocesarea textului, analiza de sintaxă, determinarea unităţilor lingvistice<br />

de tipul silabelor, determinarea prozodiei intra-segmentale (accentuaţia), regăsirea unităţilor<br />

acustice din baza de date vocală, concatenarea unităţilor acustice şi sinteza propriu-zisă a rostirii.<br />

Pentru primele patru etape au fost proiectate analizoare lexicale bazate pe reguli. Mai<br />

întâi a fost descris setul de reguli pentru preprocesarea textului sursă. A fost descrisă apoi<br />

metoda de analiză de sintaxă şi s-a prezentat setul de reguli utilizat pentru analiza formelor<br />

flexionate din limba română. În următoarea etapă, a fost prezentat analizorul sintactic pentru<br />

extragerea propoziţiilor şi a cuvintelor din textul sursă, analizorul lexical pentru despărţirea<br />

cuvintelor în silabe, precum şi setul de reguli utilizat în detectarea silabelor. S-a expus apoi<br />

modul de determinare a aspectelor prozodice intrasegmentale: accentuarea cuvintelor. Aici a fost<br />

prezentat analizorul lexical utilizat în determinarea accentelor şi setul de reguli asociat.<br />

13. În continuare s-a descris structura şi modul de organizare a bazei de date vocale. Baza<br />

de date este alcătuită dintr-un subset al silabelor limbii române, subset alcătuit pe baza<br />

frecvenţelor de apariţie ale silabelor în limba română vorbită. Pentru a determina aceste<br />

frecvenţe de apariţie, a fost realizată o statistică utilizând un corpus de texte conţinând peste<br />

300000 de cuvinte.<br />

14. S-a prezentat apoi modalitatea de regăsire a unităţilor acustice din baza de date<br />

vocală. Căutarea în baza de date se face după lungimea silabei, contextul median sau final în<br />

cadrul cuvântului şi accentuare.<br />

15. A fost expus în continuare modul de concatenare a unităţilor acustice pentru a forma<br />

semnalul de ieşire, precum şi modul de realizare a sintezei de voce.<br />

16. În ultimul capitol s-a prezentat sistemul de sinteză de voce în limba română<br />

LIGHTVOX, care implementează metoda de sinteză pe bază de silabe dezvoltată de autor. S-a<br />

descris organizarea pe module a sistemului, etapele de proiectare, precum şi paşii care au fost<br />

realizaţi la fiecare etapă. S-a detaliat modul de construire a bazei de date vocale şi s-a prezentat<br />

algoritmul de implementare al procesului de conversie text-voce. În final, s-au expus rezultatele<br />

obţinute cu sistemul de sinteză vocală, aplicaţiile şi dezvoltările de viitor.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!