15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

5.2. Sistemul de sinteză text-to-speech<br />

157<br />

Cap. 5. Sinteza de voce<br />

5.2.1. Caracteristicile unui sistem text-to-speech. Metode de bază folosite<br />

Sistemul text-to-speech este sistemul care asigură realizarea unui proces complet de<br />

conversie a unui text în vorbire continuă. În cadrul acestui proces sunt prezente două faze<br />

distincte: faza de analiză lingvistică şi faza de generare a parametrilor acustici, aşa cum se<br />

prezintă în figură:<br />

Text<br />

Tex<br />

tto-<br />

Spe<br />

Analiză<br />

lingvistică<br />

Generare<br />

parametrii<br />

acustici<br />

Figura 5.4. Sistemul text-to-speech<br />

Analiza lingvistică are ca scop determinarea unităţilor lingvistice din cadrul textului, cum<br />

ar fi: propoziţii, ech cuvinte, silabe, foneme. Generarea parametrilor acustici urmăreşte identificarea<br />

şi extragerea dintr-o Text bază de date vocală a parametrilor corespunzători unităţilor lingvistice. Pe<br />

baza acestor parametrii, un sintetizor vocal va genera rostirea propriu-zisă.<br />

Există trei metode de bază în sinteza text-to-speech: metoda bazată pe concatenarea<br />

formelor de undă, metoda bazată pe analiză-sinteză, şi metoda bazată pe reguli [Bur97].<br />

1. Metoda directă, bazată pe concatenarea formelor de undă, este cea mai simplă şi<br />

presupune înregistrarea în baza de date vocală a sunetelor înregistrate ca atare (codificate sau<br />

nu). Rostirea este generată prin alăturarea înregistrărilor ce corespund unităţilor lingvistice al<br />

textului de sintetizat. Metoda este schematizată în figura 5.5.<br />

Forme de<br />

undă<br />

Codificare<br />

Memorare<br />

Compunerea<br />

formelor de<br />

undă<br />

Rostire<br />

Figura 5.5. Metoda bazată pe concatenarea formelor de undă [Bur97]<br />

Rostire<br />

Metoda directă are avantajul unei calităţi ridicate a vorbirii sintetizate, având rata<br />

debitului de date de 64-128 kbit/s (fără codificare). Calitatea rostirii depinde de calitatea<br />

unităţilor acustice stocate în baza de date vocală, precum şi de modul de conectare al unităţilor<br />

acustice. În schimb este dificilă schimbarea trăsăturilor prozodice ale vorbirii: ritm, intonaţie,<br />

accent şi timbru. Pentru reducerea dimensiunilor bazei de date, de obicei formele de undă se<br />

codifică folosind metodele PCM sau ADPCM, rezultând astfel o rată de date de 16-32 kbit/s<br />

2. În cadrul metodei bazată pe analiză-sinteză, formele de undă preînregistrate sunt<br />

transformate în secvenţe de parametrii care se memorează în baza de date vocală. Metoda<br />

presupune două faze distincte: faza de analiză, în care sunt generaţi parametrii din formele de<br />

undă iniţiale, şi faza de sinteză, în care se generează rostirea prin concatenarea secvenţelor de<br />

parametrii şi trimiterea secvenţei rezultate către sintetizatorul de voce.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!