15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

unde:<br />

unde:<br />

- i este indexul cadrului curent,<br />

- Ks este dat de [Chi00]:<br />

K<br />

s<br />

USS(i)=Ks MS(i) (4.46)<br />

Tstop<br />

L<br />

j<br />

G<br />

S (1<br />

),<br />

<br />

Tstop<br />

<br />

1,<br />

L j T<br />

fric -1<br />

(1<br />

) ,<br />

<br />

T fric<br />

T<br />

stop<br />

- Gs= 8.0, Tstop= 50msec, Tfric=80msec,<br />

L<br />

L<br />

j<br />

T<br />

L<br />

j<br />

j<br />

T<br />

79<br />

stop<br />

T<br />

fric<br />

fric<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

- Lj lungimea segmentului nesonor j (în milisecunde).<br />

Cap. 4. Analiza semnalului vocal<br />

(4.47)<br />

Cele două valori de prag şi câştigul Gs sunt determinate empiric. Termenul Ks acţionează<br />

ca un factor de scală dependent de durată şi amplifică într-o mare măsură estimarea stopurilor<br />

pentru segmentele nesonore mai scurte de 50msec. Într-o măsură mai mică, Ks atenuează de<br />

asemenea estimarea stopurilor pentru segmente mai lungi de 80msec. Estimarea stopurilor<br />

USS(i) este o valoare în domeniul [0,1]. Dacă USS(i) este mai mare de 1 pentru cadrul respectiv,<br />

atunci este setată la unitate.<br />

[Chi00]:<br />

Estimarea finală a fricativelor nesonore UFS(i) se face pentru fiecare cadru astfel<br />

UFS(i) = HFS(i) (4.48)<br />

unde HFS(i) este scorul frecvenţelor înalte pentru cadrul respectiv.<br />

4.3.4. Detectarea graniţelor dintre segmente<br />

Algoritmul descris în secţiunea 4.3.3 se concentrează în principal asupra caracteristicilor<br />

acustice asociate cadrelor individuale. Pentru segmentarea şi etichetarea vorbirii în categoriile de<br />

segmente descrise anterior, trebuie trasate graniţele dintre segmentele fonematice. Aceasta se<br />

realizează cu doi algoritmi descrişi în subcapitolele următoare. Rezultatele celor doi algoritmi<br />

sunt combinate pentru a determina graniţele finale ale segmentului şi durata acestuia.<br />

4.3.4.1. Detectarea bazată pe graniţa spectrală şi segmentare<br />

Primul algoritm se bazează pe schimbările din spectrul de frecvenţe al semnalului.<br />

Algoritmul dezvoltat de Glass şi Zue [Gla86] măsoară similaritatea dintre cadrul curent şi vecinii<br />

acestuia. Pentru aceasta, se calculează valoarea absolută a răspunsului în frecvenţă al filtrului<br />

generat de coeficienţii LPC din ecuaţiile ( 4.19) şi ( 4.20), pentru fiecare cadru. Distanţa<br />

euclidiană dintre două cadre vecine x şi y se defineşte în felul următor [Chi00]:

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!