15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

8) Salvarea unităţilor acustice în baza de date<br />

Cap. 7. Proiectarea sistemului de sinteză de voce în limba română<br />

După detecţia silabelor dorite din semnalul vocal, acestea se salvează ca fişiere distincte<br />

în structura ierarhică a bazei de date. Aşa cum s-a prezentat în secţiunea 6.4.6, baza de date<br />

vocală este organizată în funcţie de parametrii unităţilor acustice, astfel:<br />

a) după lungimea unităţilor: silabe alcătuite din două, trei sau patru litere, precum şi<br />

foneme singulare ;<br />

b) după poziţia silabei în interiorul cuvântului: silabe iniţiale/mediane sau finale ;<br />

c) după accentuare: silabe accentuate sau neaccentuate.<br />

Ca urmare, baza de date vocală prezintă o structură arborescentă, în care unităţile acustice<br />

sunt stocate sub formă de fişiere.<br />

Pentru a implementa criteriul a), au fost create directoarele: S1, S2, S3 şi S4, în fiecare<br />

director fiind memorate doar unităţi de lungime corespunzătoare.<br />

Pentru a implementa criteriul b), în fiecare director a fost creat un subdirector Final, în<br />

care au fost memorate unităţile de tip silabă finală, în timp ce silabele acustice iniţiale/mediane<br />

au fost salvate în directorul părinte.<br />

Criteriul c) a fost rezolvat prin utilizarea unor convenţii de notaţie a numelui fişierelor;<br />

astfel silabele accentuate prezintă sufixul ‘_’ în numele fişierelor ce le conţine. De exemplu,<br />

pentru silaba neaccentuată sa avem fişierul sa.wav, iar pentru silaba accentuată sá a fost<br />

înregistrat fişierul sa_.wav (convenţiile de notaţie au fost prezentate în tabelul 6.5).<br />

Rezultă următoarea structură a colecţiei de fişiere din baza de date vocală :<br />

fF<br />

Rădăcină<br />

S1 S2 S3 S4<br />

Final Final Final Final<br />

f A F<br />

f f A<br />

ffF ff A F<br />

ff ff A<br />

fffF fff A<br />

Figura 7.8. Structura colecţiei de fişiere din baza de date vocală<br />

În figura de mai sus, notând U = unitatea acustică (U = f pentru foneme singulare, U = ff<br />

pentru silabe de două litere, U = fff pentru silabe de trei litere, U = ffff pentru silabe de patru<br />

litere), avem :<br />

- U = unitatea acustică neaccentuată în poziţie mediană ;<br />

- U A = unitatea acustică accentuată în poziţie mediană ;<br />

- UF = unitatea acustică neaccentuată în poziţie finală ;<br />

- U A F = unitatea acustică accentuată în poziţie finală.<br />

251<br />

F<br />

fff fff A<br />

ffffF ffff<br />

A F<br />

ffff ffff<br />

A

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!