15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

7.3.2. Conversia text-voce<br />

Cap. 7. Proiectarea sistemului de sinteză de voce în limba română<br />

Conversia text-voce reprezintă a doua fază, ce decurge on-line, în funcţionarea sistemului<br />

LIGHTVOX şi cuprinde toate etapele ce trebuie parcurse pentru ca dintr-un text iniţial să se<br />

genereze vorbirea sintetică asociată.<br />

Etapele componente ale acestei faze sunt următoarele :<br />

a) preprocesarea textului,<br />

b) corectarea ortografică,<br />

c) detecţia unităţilor lingvistice,<br />

d) determinarea prozodiei locale,<br />

e) regăsirea unităţilor acustice,<br />

f) îmbinarea unităţilor,<br />

g) sinteza de voce.<br />

Toate aceste etape au fost descrise pe larg în cadrul prezentării metodei de sinteză bazată<br />

pe silabe din secţiunea 6.4.<br />

a) Preprocesarea textului a fost descrisă în paragraful 6.4.2. Pe baza unor reguli de<br />

conversie fonetică, abrevierile şi numerele din textul iniţial au fost transcrise fonetic în vederea<br />

sintezei.<br />

b) Corectarea ortografică este a doua etapă necesară pentru o sinteză corectă a textului.<br />

Pentru implementarea acestei etape, a fost proiectat un analizor gramatical şi un set de reguli de<br />

analiză a sintaxei, obţinându-se o rată de recunoaştere a erorilor de 98% (paragraful 6.4.3).<br />

La intrarea analizorului se prezintă textul iniţial, ce conţine cuvinte în limba română în<br />

diferite forme flexionate. Pe baza setului de reguli proiectat, analizorul generează forma de bază,<br />

neflexionată, a fiecărui cuvânt de la intrare şi o caută într-un dicţionar. O interfaţă grafică va<br />

pune apoi în evidenţă cuvintele care au o sintaxă greşită sau care nu au fost potrivite cu setul de<br />

reguli din analizor.<br />

c) Etapa următoare o reprezintă determinarea unităţilor de bază din textul corectat<br />

ortografic. Aceste unităţi de bază sunt: propoziţiile, cuvintele şi silabele fiecărui cuvânt.<br />

Propoziţiile şi cuvintele se determină pe baza unui analizor sintactic, iar silabele printr-un<br />

analizor lexical (a se vedea paragraful 6.4.4). Analizorul lexical pentru determinarea silabelor<br />

cuprinde un set de peste 180 de reguli pentru descompunerea cuvintelor în silabe, performanţa<br />

obţinută fiind de 98% cuvinte despărţite corect.<br />

d) Determinarea prozodiei locale urmează după etapa extragerii unităţilor lingvistice din<br />

text. Prozodia locală se referă aici la determinarea accentelor din cadrul cuvintelor. Utilizarea în<br />

sinteză atât a unităţilor accentuate cât şi a unităţilor neaccentuate a dus la obţinerea unei rostiri<br />

de calitate mult mai naturală. Determinarea accentelor, prezentată în paragraful 6.4.5, s-a realizat<br />

tot prin intermediul unui analizor lexical şi a unui set de reguli fonetice. Analizorul lexical<br />

cuprinde un set de 250 de reguli pentru detectarea silabei accentuate din interiorul cuvintelor,<br />

obţinându-se o rată de detectare corectă a accentului de 94%.<br />

e) După determinarea unităţilor lingvistice din text împreună cu elementele de prozodie,<br />

urmează etapa de regăsire a unităţilor acustice din baza de date vocală. Regăsirea se face în<br />

253

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!