15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

173<br />

Cap. 6. Metode de sinteză de voce<br />

În faza de analiză, se vor extrage două segmente x1(t) şi x2(t) de perioadă 2T0 centrate în<br />

vârfurile de intensitate, aşa cum se observă din figură. Cele două segmente se suprapun pe axa<br />

timpului de-a lungul unei perioade de semnal T0, şi corespund cu două maxime succesive de<br />

intensitate ale semnalului original.<br />

Fiecare segment va avea un indicator de frecvenţă pitch mark ales ca un punct de<br />

referinţă pe axa timpului al segmentului respectiv. Acesta se poate alege în orice poziţie în<br />

interiorul segmentului. În cazul nostru, vom alege poziţia sa la mijlocul segmentului,<br />

corespunzând chiar maximului de intensitate al semnalului.<br />

După extragerea segmentelor din semnalul iniţial, acestea vor fi ponderate prin<br />

intermediul unei funcţii fereastră special alese (de obicei se aleg funcţiile Blackman, Hanning<br />

sau Hamming). Ponderarea cu funcţia fereastră are ca scop aplatizarea formei de undă la capetele<br />

segmentului pentru a nu denatura semnalul original, care trebuie să se regăsească prin<br />

compunerea segmentelor extrase, conform relaţiei (6.10).<br />

Urmează faza de sinteză, în care va avea loc procesul de mapare al segmentelor. Maparea<br />

reprezintă o repoziţionare pe axa timpului a segmentelor extrase, în funcţie de modificările<br />

parametrilor prozodici, şi anume a frecvenţei şi duratei semnalului.<br />

În cazul în care se doreşte modificarea frecvenţei semnalului pentru a schimba tonalitatea<br />

(înălţimea) vocii, segmentele iniţiale trebuie deplasate pe axa timpului. Deplasarea în avans<br />

determină mărirea frecvenţei (T1 < T0 , unde T1 este noua perioadă ), iar întârzierea segmentului<br />

determină micşorarea frecvenţei (T1 > T0 ), situaţie care este ilustrată în figura 6.6.<br />

Dacă se doreşte modificarea duratei semnalului sintetizat pentru a schimba ritmul<br />

vorbirii, frecvenţa va trebui să rămână aceeaşi pentru a nu altera tonalitatea vocii. De asemenea,<br />

în acest caz nu trebuie modificată lungimea segmentului considerat, pentru că aceasta ar duce<br />

implicit la modificarea frecvenţei semnalului. Schimbarea duratei se va face doar prin adăugarea,<br />

respectiv omiterea unor perioade întregi ale formei de undă, cu alte cuvinte unele segmente vor fi<br />

dublate, iar altele omise în cadrul semnalului sintetizat.<br />

Maparea, adică repoziţionarea segmentelor pe axa timpului, se va face astfel: mai întâi se<br />

determină noua frecvenţa şi durată a semnalului. Cunoscând noua durată se determină<br />

segmentele care vor intra în compunerea semnalului sintetizat. Pentru aceste segmente, pe baza<br />

noilor frecvenţe, se calculează poziţiile indicatorilor de frecvenţă pitch marks de-a lungul axei<br />

timpului. Apoi eşantioanele de semnal se deplasează în poziţia indicată de fiecare dintre aceste<br />

referinţe.<br />

În final, segmentele repoziţionate vor fi îmbinate pentru a recompune semnalul sintetizat.<br />

Pe porţiunile comune ale segmentelor, semnalul va trebui normat. Normarea se face prin<br />

medierea pătratică a amplitudinilor celor două segmente:<br />

x1(<br />

n)<br />

x<br />

2 ( n)<br />

x(<br />

n)<br />

(6.13)<br />

2 2<br />

x ( n)<br />

x<br />

( n)<br />

1<br />

2

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!