15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

159<br />

Cap. 5. Sinteza de voce<br />

În baza de date se memorează parametrii caracteristici pentru unităţile elementare cu care<br />

se lucrează (foneme, difoneme, silabe). În faza de sinteză, unităţile se vor concatena pe baza unor<br />

reguli de concatenare. Trăsăturile prozodice (amplitudine, tonalitate, durată) se controlează<br />

printr-un set de reguli prozodice ce se aplică pentru fiecare unitate în parte.<br />

Calitatea sintezei depinde în acest caz atât de calitatea unităţilor elementare înregistrate în<br />

baza de date, cât şi de modul de realizare şi performanţa regulilor prozodice şi de concatenare<br />

[Bur97].<br />

5.2.2. Etape în sinteza de voce pornind de la text<br />

Etapele procesuale ale sintezei text-to-speech se împart în două categorii de bază<br />

[Bur97]:<br />

1) Analiza textului de la intrare în scopul obţinerii unei reprezentări fonetice şi prozodice<br />

a textului;<br />

2) Transformarea reprezentării fonetice-prozodice în semnal vocal, pe baza folosirii unor<br />

reguli de sinteză.<br />

Analiza textului cuprinde: preprocesarea lingvistică, analiza sintactică şi lexicală,<br />

transcrierea fonetică şi determinarea prozodiei.<br />

Sinteza presupune generarea secvenţei de parametri corespunzătoare textului şi sinteza<br />

propriu-zisă a vorbirii.<br />

Preprocesarea lingvistică este prima etapă în analiza textului de la intrare, în care se<br />

urmăreşte aducerea textului la o formă normalizată. Aici se refac abrevierile (de exemplu „Dr.”<br />

devine „doctor”), se transformă numerele care apar ca cifre în numere exprimate literar („1000”<br />

devine „o mie”), şi de asemenea tot în acestă fază se detectează terminatorii de propoziţie, care<br />

vor da primele informaţii despre tipul propoziţiei (` . ` ` ? ` `! ` , ce corespund cu o propoziţie<br />

afirmativă, interogativă, respectiv imperativă).<br />

Analiza sintactică este necesară pentru a aduce textul la o formă corectă din punct de<br />

vedere gramatical, ştiut fiind faptul că orice greşeală de scriere a unui cuvânt îl poate face greu<br />

inteligibil în urma sintezei vocale. Astfel, cuvintele sunt confruntate cu modul corect de scriere<br />

aşa cum apare de exemplu într-un dicţionar, şi de asemenea, în cazul limbii române, se verifică şi<br />

corectitudinea inserării diacriticelor (`ă` `î` `ş` `ţ`).<br />

Urmează etapa de determinare a unităţilor lexicale, efectuată prin intermediul unui<br />

parser sau analizor lexical. Aici se determină unităţile textuale dorite, cum ar fi: propoziţii,<br />

cuvinte, silabe, foneme. Dacă de exemplu se doreşte regăsirea silabelor din cadrul cuvintelor,<br />

analizorul va trebui să fie ghidat de un set de reguli sintactice şi de despărţire a cuvintelor în<br />

silabe, reguli specifice limbii pentru care se va realiza sinteza.<br />

Etapa de transcriere fonetică are ca scop realizarea unei transcrieri standardizate a<br />

fonemelor din text (grafeme), folosind un set de simboluri fonetice standardizate ( de exemplu<br />

grupul `che` va avea transcrierea fonetică [ce], iar `ce` va avea transcrierea fonetică [c~e]; astfel<br />

sintetizatorul va şti că va trebui să folosească seturi diferite de parametrii pentru a genera două<br />

tipuri distincte de rostire).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!