15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

3<br />

Cap. 1. Introducere<br />

Capitolul 8 prezintă concluziile finale, sinteza cercetărilor efectuate în cadrul tezei şi sunt<br />

detaliate contribuţiile aduse de autor la dezvoltarea domeniului de cercetare.<br />

În continuare este prezentată bibliografia selectată de autor ce include titlurile citate.<br />

Anexa 1 prezintă notaţiile folosite în cadrul gramaticii LEX pentru construirea<br />

analizoarelor lexicale. Anexele 2, 3 şi 4 prezintă seturile de silabe alcătuite din două, trei şi<br />

respectiv patru foneme, obţinute pe baza statisticii realizate de către autor asupra frecvenţelor de<br />

apariţie a silabelor în limba română. Anexa 5 prezintă activitatea ştiinţifică a autorului, lucrările<br />

ştiinţifice şi proiectele de cercetare la care a participat, iar în anexa 6 sunt prezentate în extenso<br />

două articole publicate de autor în reviste recunoscute pe plan internaţional.<br />

1.3. Problematica sintezei de voce<br />

Odată cu dezvoltarea tot mai accentuată a tehnologiilor şi sistemelor informatice s-a pus<br />

problema comunicării cât mai naturale dintre om şi calculator. Comunicarea pe bază de voce,<br />

atât de obişnuită omului, s-a dovedit a fi o sarcină dificil de realizat pentru sistemul automat.<br />

Interacţiunea pe bază de voce presupune mai multe etape: recunoaşterea cuvintelor pe<br />

care le rosteşte interlocutorul, recunoaşterea semanticii vorbirii sau a informaţiei transmise,<br />

procesarea informaţiei, elaborarea unui răspuns şi conversia acestuia din nou în formă vocală.<br />

Sinteza automată de voce constituie o etapă distinctă a acestui proces de interacţiune<br />

vocală cu utilizatorul uman. Sinteza vorbirii porneşte de la un text (răspunsul care trebuie rostit),<br />

îl descompune în unităţi lingvistice de bază (foneme sau grupuri de foneme), generează<br />

parametrii acustici corespunzători fiecărei unităţi lingvistice, şi apoi foloseşte aceşti parametrii<br />

pentru comanda procesorului audio ce va genera secvenţa acustică dorită. Cu cât parametrii<br />

acustici generaţi de calculator sunt mai apropiaţi de parametrii rostirii umane, cu atât vorbirea<br />

sintetizată va fi mai naturală, mai plăcută interlocutorului şi mai uşor de înţeles.<br />

În continuare se pune problema găsirii unor metode de generare a parametrilor astfel<br />

încât pe de o parte aceste metode să asigure complexitatea generării unor parametrii apropiaţi de<br />

vorbirea umană reală, şi pe de altă parte să fie suficient de versatile pentru a permite modularea<br />

intonaţiei vorbirii prin modificarea parametrilor acustici.<br />

Aceste două caracteristici: claritatea rostirii şi realizarea intonaţiei definesc indicatorii de<br />

calitate ai vorbirii produse prin sinteză. Diferite abordări ale procesului de sinteză a semnalului<br />

vocal, atât în domeniul frecvenţei, cât şi în domeniul timp, au urmărit aducerea celor doi<br />

indicatori la valori cât mai ridicate. Acesta este şi scopul cercetărilor în domeniul producerii<br />

vorbirii la ora actuală.<br />

1.4. Oportunitatea temei alese<br />

În decursul timpului au fost proiectate mai multe metode pentru generarea parametrilor<br />

acustici necesari pentru sinteză. În ultimii ani s-a dovedit că metodele cu cele mai bune rezultate<br />

sunt cele care memorează forma de undă reală, rostită de un vorbitor uman, pentru fiecare unitate<br />

lingvistică în parte. Aceste metode realizează sinteza vorbirii prin concatenarea unităţilor<br />

acustice memorate într-o bază de date vocală.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!