Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică

users.utcluj.ro
from users.utcluj.ro More from this publisher
15.06.2013 Views

240 Cap. 6. Metode de sinteză de voce Avantajele metodei de sinteză a vorbirii pe bază de silabe dezvoltată de autor Metoda de sinteză bazată pe concatenarea silabelor prezentată în acest capitol are următoarele avantaje: a) Prezintă o abordare unitară în toate fazele de proiectare, fiind bazată pe reguli în cele mai importante etape ale sale. b) Foloseşte reguli organizate într-o gramatică de tip LEX, rezultând astfel separarea modulului de analiză lingvistică faţă de fluxul de prelucrare a datelor. c) Asigură o capacitate mărită de extensibilitate şi adaptabilitate datorită faptului că regulile sunt accesibile şi se pot edita de către utilizator. d) Asigură reducerea semnificativă a costului şi timpului alocat procesului de proiectare, datorită utilizării regulilor (cel mult de ordinul sutelor), faţă de metodele ce utilizează dicţionare sau lexicoane (conţinând definiţii de ordinul zecilor sau sutelor de mii). e) Prezintă un grad mai mare de versatilitate, datorită utilizării gramaticilor regulate specifice LEX, faţă de alte metode ce folosesc reprezentări interne ale regulilor sau chiar formatul XML. Utilizarea seturilor bazate pe expresii regulate permite specificarea de tipare pentru unităţile lingvistice şi contextele în care ele apar, rezultând astfel şi un grad mai mare de corectitudine în analiza finală a textului. f) Necesită un efort mai mic de construire şi întreţinere a bazei de date vocale decât în cazul metodei bazate pe corpus. Astfel, în cazul metodei bazate pe silabe, numărul unităţilor acustice este cu cel puţin două ordine de mărime mai mic decât în cazul metodei bazate pe corpus. g) Păstrează eficienţa şi calitatea metodelor de sinteză prin concatenare, în raport cu metodele parametrice de sinteză. Astfel, în cazul concatenării, semnalul sintetizat păstrează calitatea unităţilor înregistrate în baza de date vocală, pe când în cazul metodele parametrice, semnalul de ieşire este aproximat. h) Prezintă o calitate mai înaltă a sintezei faţă de metodele bazate pe foneme sau difoneme, din cauza unui număr mai redus de puncte de concatenare, la nivelul silabei. Aplicaţii şi dezvoltări de viitor Pentru mărirea performanţelor metodei de sinteză prezentate, se au în vedere următoarele dezvoltări de viitor: - mărirea gradului de completitudine a seturilor de reguli pentru silabisire şi accentuare, prin adăugarea de noi reguli; - îmbunătăţirea ratei de detectare corectă a accentuării prin folosirea unui dicţionar morfologic al limbii române. Astfel, gradul de completitudine al unor reguli stabilite pentru cuvinte cu aceeaşi terminaţie poate fi mărit prin preluarea cuvintelor din dicţionar. Aceasta va duce la creşterea ratei de detecţie corectă a analizorului, chiar fără a introduce noi reguli de accentuare; - în faza de analiză a sintaxei, determinarea părţilor de propoziţie (subiect, predicat) pe baza părţilor de vorbire detectate deja (substantiv, verb, etc.) va duce la determinarea semanticii frazei, cu aplicaţii importante în dialogul om-calculator;

241 Cap. 6. Metode de sinteză de voce - analiza contextului în care apar părţile de vorbire detectate prin analizorul de sintaxă proiectat, precum şi stabilirea modului corect de flexionare, sunt aspecte importante care se vor putea aplica la construirea unor traducătoare automate de limbaj de înaltă fidelitate. - mărirea numărului de unităţi stocate în baza de date vocală, de la 600 în prezent la 2- 3000, în conformitate cu statistica prezentată a silabelor din limba română, fapt ce va avea ca rezultat îmbunătăţirea semnificativă a calităţii semnalului sintetizat; - luarea în considerare a implementării prozodiei suprasegmentale, de tipul intonaţiei, prin intermediul tehnicii TD_PSOLA, crescându-se astfel naturaleţea vorbirii sintetizate. Aici, metoda proiectată de autor de detectare automată a perioadelor fundamentale din semnal (metodă prezentată în secţiunea 4.6) va fi foarte utilă în momentul aplicării PSOLA. Contribuţiile autorului Contribuţiile autorului prezentate în capitolul curent au fost următoarele: - dezvoltarea unei metode complete de sinteză de vorbire pornind de la text pentru limba română, metodă bazată pe concatenarea de silabe; - dezvoltarea unei metode bazată pe reguli pentru preprocesarea textului; - dezvoltarea unei metode bazată pe reguli pentru analiza sintaxei unui text în limba română şi a unui set de reguli pentru flexionarea cuvintelor din limba română; - realizarea unui analizor sintactic pentru extragerea propoziţiilor şi a cuvintelor ; - realizarea unui analizor lexical şi a unui set de reguli pentru despărţirea în silabe a cuvintelor din limba română; - realizarea unui analizor lexical şi a unui set de reguli pentru determinarea silabei accentuate din cadrul cuvintelor; - realizarea unei statistici a silabelor limbii române pentru determinarea frecvenţelor de apariţie ale silabelor din limba română; - realizarea unei baze de date acustice de silabe, în care unităţile au fost înregistrate în diferite contexte şi moduri de pronunţie, incluzând aspectele prozodice intrasegmentale; - proiectarea unui algoritm de regăsire în baza de date a unităţilor acustice în funcţie de caracteristicile acestora: lungime, context şi accentuare; - realizarea unei aplicaţii de test pentru validarea rezultatelor.

240<br />

Cap. 6. Metode de sinteză de voce<br />

Avantajele metodei de sinteză a vorbirii pe bază de silabe dezvoltată de autor<br />

Metoda de sinteză bazată pe concatenarea silabelor prezentată în acest capitol are<br />

următoarele avantaje:<br />

a) Prezintă o abordare unitară în toate fazele de proiectare, fiind bazată pe reguli în cele<br />

mai importante etape ale sale.<br />

b) Foloseşte reguli organizate într-o gramatică de tip LEX, rezultând astfel separarea<br />

modulului de analiză lingvistică faţă de fluxul de prelucrare a datelor.<br />

c) Asigură o capacitate mărită de extensibilitate şi adaptabilitate datorită faptului că<br />

regulile sunt accesibile şi se pot edita de către utilizator.<br />

d) Asigură reducerea semnificativă a costului şi timpului alocat procesului de proiectare,<br />

datorită utilizării regulilor (cel mult de ordinul sutelor), faţă de metodele ce utilizează dicţionare<br />

sau lexicoane (conţinând definiţii de ordinul zecilor sau sutelor de mii).<br />

e) Prezintă un grad mai mare de versatilitate, datorită utilizării gramaticilor regulate<br />

specifice LEX, faţă de alte metode ce folosesc reprezentări interne ale regulilor sau chiar<br />

formatul XML. Utilizarea seturilor bazate pe expresii regulate permite specificarea de tipare<br />

pentru unităţile lingvistice şi contextele în care ele apar, rezultând astfel şi un grad mai mare de<br />

corectitudine în analiza finală a textului.<br />

f) Necesită un efort mai mic de construire şi întreţinere a bazei de date vocale decât în<br />

cazul metodei bazate pe corpus. Astfel, în cazul metodei bazate pe silabe, numărul unităţilor<br />

acustice este cu cel puţin două ordine de mărime mai mic decât în cazul metodei bazate pe<br />

corpus.<br />

g) Păstrează eficienţa şi calitatea metodelor de sinteză prin concatenare, în raport cu<br />

metodele parametrice de sinteză. Astfel, în cazul concatenării, semnalul sintetizat păstrează<br />

calitatea unităţilor înregistrate în baza de date vocală, pe când în cazul metodele parametrice,<br />

semnalul de ieşire este aproximat.<br />

h) Prezintă o calitate mai înaltă a sintezei faţă de metodele bazate pe foneme sau<br />

difoneme, din cauza unui număr mai redus de puncte de concatenare, la nivelul silabei.<br />

Aplicaţii şi dezvoltări de viitor<br />

Pentru mărirea performanţelor metodei de sinteză prezentate, se au în vedere următoarele<br />

dezvoltări de viitor:<br />

- mărirea gradului de completitudine a seturilor de reguli pentru silabisire şi accentuare,<br />

prin adăugarea de noi reguli;<br />

- îmbunătăţirea ratei de detectare corectă a accentuării prin folosirea unui dicţionar<br />

morfologic al limbii române. Astfel, gradul de completitudine al unor reguli stabilite pentru<br />

cuvinte cu aceeaşi terminaţie poate fi mărit prin preluarea cuvintelor din dicţionar. Aceasta va<br />

duce la creşterea ratei de detecţie corectă a analizorului, chiar fără a introduce noi reguli de<br />

accentuare;<br />

- în faza de analiză a sintaxei, determinarea părţilor de propoziţie (subiect, predicat) pe<br />

baza părţilor de vorbire detectate deja (substantiv, verb, etc.) va duce la determinarea semanticii<br />

frazei, cu aplicaţii importante în dialogul om-calculator;

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!