15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

6.3.2.5. Algoritmul metodei de sinteză bazată pe corpus vocal<br />

182<br />

Cap. 6. Metode de sinteză de voce<br />

Paşii algoritmului metodei bazată pe corpus vocal sunt prezentaţi în cele ce urmează<br />

(pentru abordarea Context Clustering) :<br />

A. Faza de analiză :<br />

1. Se înregistrează baza de date vocală.<br />

2. Baza de date este segmentată în unităţi acustice de diferite lungimi.<br />

3. Baza de date se adnotează cu informaţiile contextuale, prozodice şi de semnal,<br />

calculându-se vectorii de trăsături ai unităţi acustice.<br />

4. Se construiesc arborii de decizie bazaţi pe clasele de echivalenţă.<br />

5. Se calculează costurile Target Cost, Concatenation Cost şi se introduc în arborii de<br />

decizie.<br />

B. Faza de sinteză :<br />

1. Se preia textul de la intrare şi se determină unităţile lexicale (propoziţii, cuvinte,<br />

silabe şi foneme).<br />

2. Se determină toate posibilităţile de construire a propoziţiilor pe baza unităţilor<br />

lexicale componente.<br />

3. Pentru fiecare secvenţă de unităţi lexicale se determină informaţia de context şi<br />

caracteristicile prozodice.<br />

4. Se caută în arborii de decizie secvenţa optimă de unităţi acustice corespun-<br />

zătoare contextului lexical.<br />

5. Se sintetizează rostirea prin concatenarea unităţilor acustice din baza de date.<br />

6.3.2.6. Avantajele şi dezavantajele metodei bazate pe corpus<br />

Metoda bazată pe corpus este o metodă performantă de sinteză a vorbirii, ce utilizează<br />

concatenarea unităţilor acustice maximale care se găsesc înregistrate într-un corpus vocal.<br />

Calculul vectorilor de trăsături ale unităţilor în faza de analiză ce se realizează off-line, definirea<br />

unor ponderi care să asigure concatenarea unităţilor optime, includerea trăsăturilor prozodice în<br />

calculul costurilor, reducerea sau chiar anularea nevoii de procesare a semnalului vocal, toate<br />

acestea reprezintă caracteristicile şi totodată avantajele cele mai importante ale metodei.<br />

Ca dezavantaje sunt de menţionat necesitatea înregistrării şi întreţinerii unui corpus vocal<br />

de dimensiuni mari, precum şi faza de analiză laborioasă necesară adnotării bazei de date cu<br />

caracteristici prozodice şi segmentale. Aceste aspecte pot reprezenta provocări majore pentru cei<br />

care vor să abordeze metoda bazată pe corpus.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!