15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

6. Metode de sinteză de voce<br />

6.1. Clasificarea metodelor de sinteză de voce<br />

Sinteza vorbirii poate fi realizată prin mai multe metode, care diferă în funcţie de nivelul<br />

abordării, modelul de producere a vorbirii şi domeniul de analiză şi prelucrare a semnalului<br />

vocal.<br />

A. În funcţie de nivelul abordării, metodele de sinteză se grupează în două categorii:<br />

metode care abordează sinteza de nivel jos, respectiv sinteza de nivel înalt.<br />

Metodele care abordează sinteza de nivel jos pornesc de la specificarea unor parametri<br />

acustici şi generează vorbirea sintetică prin re-crearea formei de undă a semnalului vocal<br />

[Bur96].<br />

Această categorie cuprinde:<br />

- metode bazate pe codificarea şi recompunerea vorbirii, metode implementate în sistemele<br />

de tip vocoder;<br />

- metode de sinteză formantică, ce utilizează specificarea parametrilor formantici din<br />

spectrul acustic pentru generarea vorbirii;<br />

- metode de sinteză bazate pe predicţie liniară, ce urmăresc prezicerea eşantioanelor de<br />

semnal pe baza eşantioanelor precedente;<br />

- metode de sinteză prin concatenarea formelor de undă, ce implică preînregistrarea şi apoi<br />

recompunerea formelor de undă corespunzătoare unităţilor acustice;<br />

- sinteza articulativă, ce implică utilizarea unor parametri generaţi pe baza unui model<br />

articulator de producere a vorbirii.<br />

Sintetizatoarele de vorbire care implementează metodele de nivel jos generează semnalul<br />

vocal de la ieşirea unui sistem de sinteză vocală. Exemple de astfel de sintetizatoare sunt:<br />

sistemul Holmes de sinteză formantică cu rezonatori în paralel, sistemul Klatt ce foloseşte o<br />

metodă formantică hibridă serie-paralel, sistemul PSOLA bazat pe concatenarea formelor de<br />

undă. Toate aceste sisteme nu pot genera semnal vocal cât timp ele nu sunt controlate de către un<br />

software de sinteză de nivel înalt.<br />

Metodele de sinteză de nivel înalt sunt de tipul text-to-speech sau concept-to-speech.<br />

Sistemele text-to-speech generează vorbirea pe baza textului de la intrare, iar sistemele conceptto-speech<br />

sunt sisteme de dialog vocal în care vorbirea se generează pe baza unei descrieri<br />

lingvistice ce rezultă în urma dialogului cu utilizatorul. Caracteristic acestor metode este faptul<br />

că ele includ o abordare lingvistică, prin aceasta diferenţiându-se de metodele de nivel jos<br />

[Bur96].<br />

Problemele specifice abordate de către aceste metode de nivel înalt sunt: conversia<br />

ortografie-foneme, descompunerea cuvintelor în morfeme, crearea de dicţionare cu informaţie<br />

sintactică şi fonetică, crearea regulilor de pronunţie, determinarea prozodiei (intonaţiei) din<br />

cadrul elementelor fonetice – propoziţii şi cuvinte.<br />

Sintetizatoarele de nivel înalt sunt responsabile pentru generarea intrării către<br />

sintetizatoarele de nivel jos. Intrarea într-un sistem de sinteză de nivel înalt este constituită din<br />

textul de sintetizat, în timp ce ieşirea furnizează parametrii acustici necesari sintezei vocale.<br />

162

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!