Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică

users.utcluj.ro
from users.utcluj.ro More from this publisher
15.06.2013 Views

0, RN( i) T upper EN(i) 1, RN( i) T lower T upper RN( i) Tlower RN( i) T , T upper T lower 76 upper Cap. 4. Analiza semnalului vocal (4.36) unde Tupper= 20 şi Tlower = 0.05. Valorile de prag sunt determinate empiric. 4.3.3.6. Detectarea semivocalelor Detectarea semivocalelor se bazează pe o metodă dezvoltată de Espy­Wilson [Esp86]. Algoritmul deviază uşor de la detectorul standard, deşi utilizează funcţia volum din ecuaţia (4.18). Se calculează mai întâi funcţia LFV cu G=1, A=1, B=20. În acest caz, LFV este echivalent cu un filtru trece bandă de la 20 Hz la 391 Hz. O funcţie HFV este calculată din ecuaţia (4.18) pentru G=1, A=21 şi B=50. HFV este echivalent cu un filtru trece bandă de la 410 Hz la 977 Hz. O raţie ‚murmur’ RM(i) este calculată pentru fiecare cadru după cum urmează [Chi00]: LFV(i) RM(i) (4.37) HFV(i) Raţia murmur este netezită de un filtru median de ordinul 5. Estimarea murmurului, EM(i), în cadrul scalei continue [0,1], este calculată pentru fiecare cadru prin compararea raţiei murmurului netezit cu cele două valori de prag. Estimarea murmurului este dată de [Chi00]: 1, RM ( i) T upper EM(i) 0, RM ( i) T lower RM ( i) T lower Tlower RM ( i) T , Tupper T lower unde Tupper= 12 şi Tlower = 3. upper (4.38) Estimarea semivocalei ESV(i) este calculată pentru fiecare cadru astfel [Chi00]: ESV(i) = (1- EM(i))(1- EBS(i)) EC(i) (4.39) unde: - i este indexul cadrului curent, - EBS(i) este estimarea benzii sonore din (4.34), iar - EC(i) este estimarea consoanei sonore din (4.32). Valoarea ESV(i) este limitată la o scară [0,1]. Dacă ESV(i) este mai mare de 1, este setată la unitate. Ecuaţia (4.39) arată următorul fapt: dacă acel cadru are o estimare bună a consoanei sonore, o estimare slabă a murmurului şi a benzii vocale, atunci estimarea semivocalei va fi ridicată.

4.3.3.7. Detectarea fricativelor sonore 77 Cap. 4. Analiza semnalului vocal Algoritmul de detectare a fricativelor sonore deviază faţă de detectorul standard, deşi calculează estimările caracteristicilor din valori de praguri fixe. Primul pas în detectarea fricativelor sonore este o preaccentuare a răspunsului în frecvenţă a filtrului format de coeficienţii LPC. Preaccentuarea se face printr-o funcţie pondere W în domeniul frecvenţă astfel [Chi00]: m j m 256 W ( e ) 256 , cu 0 ≤ m ≤ 255 (4.40) Răspunsul în frecvenţă (preemfazat) pentru cadrul i, Ĥi , este [Chi00]: Ĥi ( e m j 256 m j m j 256 256 ) W ( e ) H ( e ) , pentru 0 ≤ m ≤255 (4.41) unde Hi este calculat din ecuaţia (4.19) pentru cadrul i cu G=1. i Frecvenţa mediană a răspunsului în frecvenţă preemfazat, MF(i), se calculează pentru fiecare cadru astfel [Chi00]: 1 MF( i) H 255 total( i) m0 m Fs ( | H i ( e 256 2 unde: - Fs= 10 KHz, - i este indexul cadrului, - Htotal(i) este dat pentru cadru [Chi00]: 255 Htotal(i) = | m0 H m j 256 i ( ) | e m j 256 ) |) (4.42) (4.43) Spre deosebire de cazurile anterioare, unde filtrul median de netezire era de ordinul 5, MF(i) este netezit de un filtru median de ordinul trei. Estimarea frecvenţei înalte HFS(i) este calculată pentru fiecare cadru după cum urmează [Chi00]: 1, MF( i) T upper HFS(i) 0, MF( i) T lower MF( i) T lower Tlower MF( i) T , T upper T lower upper (4.44) unde Tupper= 3200 şi Tlower = 240. Valorile de prag sunt determinate empiric.

0, RN(<br />

i)<br />

T<br />

upper<br />

<br />

EN(i) <br />

1,<br />

RN(<br />

i)<br />

T<br />

lower<br />

T<br />

upper RN(<br />

i)<br />

Tlower<br />

RN(<br />

i)<br />

T<br />

<br />

,<br />

T<br />

upper T<br />

lower<br />

76<br />

upper<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

Cap. 4. Analiza semnalului vocal<br />

(4.36)<br />

unde Tupper= 20 şi Tlower = 0.05. Valorile de prag sunt determinate empiric.<br />

4.3.3.6. Detectarea semivocalelor<br />

Detectarea semivocalelor se bazează pe o metodă dezvoltată de Espy­Wilson [Esp86].<br />

Algoritmul deviază uşor de la detectorul standard, deşi utilizează funcţia volum din ecuaţia<br />

(4.18). Se calculează mai întâi funcţia LFV cu G=1, A=1, B=20.<br />

În acest caz, LFV este echivalent cu un filtru trece bandă de la 20 Hz la 391 Hz. O<br />

funcţie HFV este calculată din ecuaţia (4.18) pentru G=1, A=21 şi B=50. HFV este echivalent cu<br />

un filtru trece bandă de la 410 Hz la 977 Hz. O raţie ‚murmur’ RM(i) este calculată pentru fiecare<br />

cadru după cum urmează [Chi00]:<br />

LFV(i)<br />

RM(i) (4.37)<br />

HFV(i)<br />

Raţia murmur este netezită de un filtru median de ordinul 5. Estimarea murmurului,<br />

EM(i), în cadrul scalei continue [0,1], este calculată pentru fiecare cadru prin compararea raţiei<br />

murmurului netezit cu cele două valori de prag. Estimarea murmurului este dată de [Chi00]:<br />

<br />

1,<br />

RM ( i)<br />

T<br />

upper<br />

<br />

EM(i) <br />

0,<br />

RM ( i)<br />

T<br />

lower<br />

RM<br />

( i)<br />

T<br />

lower Tlower<br />

RM<br />

( i)<br />

T<br />

<br />

,<br />

Tupper<br />

T<br />

lower<br />

unde Tupper= 12 şi Tlower = 3.<br />

upper<br />

<br />

<br />

<br />

(4.38)<br />

<br />

<br />

<br />

Estimarea semivocalei ESV(i) este calculată pentru fiecare cadru astfel [Chi00]:<br />

ESV(i) = (1- EM(i))(1- EBS(i)) EC(i) (4.39)<br />

unde:<br />

- i este indexul cadrului curent,<br />

- EBS(i) este estimarea benzii sonore din (4.34), iar<br />

- EC(i) este estimarea consoanei sonore din (4.32).<br />

Valoarea ESV(i) este limitată la o scară [0,1]. Dacă ESV(i) este mai mare de 1, este setată<br />

la unitate. Ecuaţia (4.39) arată următorul fapt: dacă acel cadru are o estimare bună a consoanei<br />

sonore, o estimare slabă a murmurului şi a benzii vocale, atunci estimarea semivocalei va fi<br />

ridicată.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!