15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

6.4.4. Determinarea unităţilor lingvistice: silabele<br />

203<br />

Cap. 6. Metode de sinteză de voce<br />

Următoarea etapă în analiza textului de sintetizat constă în determinarea unităţilor<br />

lingvistice de bază, şi anume: propoziţiile, cuvintele şi silabele. Dacă extragerea propoziţiilor şi a<br />

cuvintelor nu ridică probleme deosebite, aceasta efectuându-se pe baza semnelor de punctuaţie şi<br />

a caracterelor de separaţie, nu acelaşi lucru se poate spune despre stabilirea silabelor componente<br />

ale unui cuvânt. Pentru a realiza acest deziderat a fost necesară proiectarea unui set de reguli<br />

fonetice pentru despărţirea în silabe.<br />

Principiul folosit la determinarea unităţilor lingvistice este ilustrat în figura 6.17. Astfel,<br />

analizorul lingvistic are o structură pe trei nivele, corespunzător cu trei module având roluri<br />

distincte în identificarea şi tratarea unităţilor fonetice. Cele trei module sunt:<br />

- modulul de comandă şi procesare computaţională (shell procesare) ;<br />

- modulul de analiză sintactică pentru determinarea propoziţiilor şi cuvintelor;<br />

- modulul de analiză lexicală pentru determinarea silabelor.<br />

Proceduri<br />

de calcul<br />

Reguli<br />

sintactice<br />

Text<br />

Reguli<br />

lexicale<br />

Shell<br />

Procesare<br />

Analizor<br />

Sintactic<br />

Analizor<br />

Lexical<br />

Procesare<br />

unităţi<br />

Propoziţii<br />

Cuvinte<br />

Silabe<br />

Figura 6.17. Analizorul lingvistic pentru despărţirea în silabe<br />

Shell-ul program are rolul de master, apelând modulele de nivel inferior. Astfel, acesta<br />

apelează analizorul sintactic pentru a-i returna unităţile sintactice. Analizorul sintactic va apela la<br />

rândul lui analizorul lexical pentru parcurgerea efectivă a textului şi regăsirea unităţilor lexicale<br />

de bază.<br />

Analizorul lexical extrage caracterele din text şi le grupează în unităţi fonetice primare.<br />

Aici intră determinarea caracterelor alfabetice, numerice, a caracterelor speciale şi semnelor de<br />

punctuaţie. Pe baza unor reguli de producţie lexicale, caracterele alfabetice vor fi grupate în<br />

silabe, caracterele numerice în cifre şi numere, iar caracterele speciale şi semnele de punctuaţie<br />

vor fi folosite în determinarea cuvintelor şi propoziţiilor.<br />

Cifre<br />

Separatori

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!