Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică

users.utcluj.ro
from users.utcluj.ro More from this publisher
15.06.2013 Views

160 Cap. 5. Sinteza de voce Urmează apoi etapa de determinare a prozodiei pentru segmentele vocale analizate. Pe baza unor reguli prozodice specifice limbii, se va determina accentul, intonaţia şi ritmul corect pentru fiecare unitate fonematică. Regulile prozodice se aplică atât la nivelul suprasegmental al propoziţiilor, realizându-se un contur prozodic al propoziţiei, cât şi la nivel segmental, în interiorul cuvintelor. Regulile aplicate dau pentru fiecare unitate de sintetizat o anumită corecţie la nivelul parametrilor: frecvenţă fundamentală, amplitudine şi durată, în funcţie de tipul popoziţiei determinat în etapa de procesare lingvistică, de locul cuvântului în propoziţie, precum şi de locul silabei sau fonemei în cadrul cuvântului. Pe lângă prozodia lingvistică, care se determină pe baza analizei lingvistice a textului, în ultimii ani se ţine cont tot mai mult şi de prozodia emoţională, pentru a simula stările emoţionale pe care le poate avea un vorbitor (bucurie, teamă, linişte, etc.). După aceste etape de analiză a textului, urmează etapele încadrate în faza de sinteză. Prima dintre ele este etapa de generare a parametrilor acustici pentru sinteză. Pe baza simbolurilor fonematice care provin din etapa de transcriere fonetică şi a modificărilor prozodice determinate pe baza regulilor privind intonaţia şi ritmul, se generează secvenţa de parametrii corespunzătoare textului de sintetizat. Text Simboluri fonetice ( a b c ...) Prozodie Cunoştinţe Secvenţă de parametri ( a1 a2 a3 ...) Figura 5.8. Etapa de generare a parmetrilor acustici [Bur97] Baza de date vocală În această etapă se folosesc cunoştinţele înmagazinate în baza de date vocală, de unde se regăsesc parametrii de bază pentru fiecare unitate fonetică. Parametrii de bază se vor modifica în urma alterărilor prozodice, şi apoi se vor concatena pentru a genera secvenţa parametrică pentru întregul context propoziţional. În continuare urmează faza de sinteză propriu-zisă, în care secvenţele de parametri se transformă în forme de undă care pot fi redate sonor prin intermediul unui dispozitiv audio. Constituirea formelor de undă din secvenţa de parametri se realizează pe baza unor reguli de sinteză bine determinate.

Etapele procesuale ale sintezei TTS sunt ilustrate în figura 5.9: Text Preprocesare lingvistică Text în formă normalizată Analiză sintactică Text corect gramatical Determinare unităţi lexicale Figura 5.9. Etapele procesuale ale sintezei TTS [Bur97] 161 Propoziţii, cuvinte, foneme Transcriere fonetică Simboluri fonetice Determinarea prozodiei Parametrii prozodici Generare parametri acustici Parametrii de sinteză Sinteza Forme de undă Rostire Cap. 5. Sinteza de voce

160<br />

Cap. 5. Sinteza de voce<br />

Urmează apoi etapa de determinare a prozodiei pentru segmentele vocale analizate. Pe<br />

baza unor reguli prozodice specifice limbii, se va determina accentul, intonaţia şi ritmul corect<br />

pentru fiecare unitate fonematică. Regulile prozodice se aplică atât la nivelul suprasegmental al<br />

propoziţiilor, realizându-se un contur prozodic al propoziţiei, cât şi la nivel segmental, în<br />

interiorul cuvintelor.<br />

Regulile aplicate dau pentru fiecare unitate de sintetizat o anumită corecţie la nivelul<br />

parametrilor: frecvenţă fundamentală, amplitudine şi durată, în funcţie de tipul popoziţiei<br />

determinat în etapa de procesare lingvistică, de locul cuvântului în propoziţie, precum şi de locul<br />

silabei sau fonemei în cadrul cuvântului.<br />

Pe lângă prozodia lingvistică, care se determină pe baza analizei lingvistice a textului, în<br />

ultimii ani se ţine cont tot mai mult şi de prozodia emoţională, pentru a simula stările emoţionale<br />

pe care le poate avea un vorbitor (bucurie, teamă, linişte, etc.).<br />

După aceste etape de analiză a textului, urmează etapele încadrate în faza de sinteză.<br />

Prima dintre ele este etapa de generare a parametrilor acustici pentru sinteză. Pe baza<br />

simbolurilor fonematice care provin din etapa de transcriere fonetică şi a modificărilor prozodice<br />

determinate pe baza regulilor privind intonaţia şi ritmul, se generează secvenţa de parametrii<br />

corespunzătoare textului de sintetizat.<br />

Text<br />

Simboluri fonetice<br />

( a b c ...)<br />

Prozodie Cunoştinţe<br />

Secvenţă de parametri<br />

( a1 a2 a3 ...)<br />

Figura 5.8. Etapa de generare a parmetrilor acustici [Bur97]<br />

Baza de<br />

date<br />

vocală<br />

În această etapă se folosesc cunoştinţele înmagazinate în baza de date vocală, de unde se<br />

regăsesc parametrii de bază pentru fiecare unitate fonetică. Parametrii de bază se vor modifica în<br />

urma alterărilor prozodice, şi apoi se vor concatena pentru a genera secvenţa parametrică pentru<br />

întregul context propoziţional.<br />

În continuare urmează faza de sinteză propriu-zisă, în care secvenţele de parametri se<br />

transformă în forme de undă care pot fi redate sonor prin intermediul unui dispozitiv audio.<br />

Constituirea formelor de undă din secvenţa de parametri se realizează pe baza unor reguli de<br />

sinteză bine determinate.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!