Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
0, RN( i) T upper EN(i) 1, RN( i) T lower T upper RN( i) Tlower RN( i) T , T upper T lower 76 upper Cap. 4. Analiza semnalului vocal (4.36) unde Tupper= 20 şi Tlower = 0.05. Valorile de prag sunt determinate empiric. 4.3.3.6. Detectarea semivocalelor Detectarea semivocalelor se bazează pe o metodă dezvoltată de EspyWilson [Esp86]. Algoritmul deviază uşor de la detectorul standard, deşi utilizează funcţia volum din ecuaţia (4.18). Se calculează mai întâi funcţia LFV cu G=1, A=1, B=20. În acest caz, LFV este echivalent cu un filtru trece bandă de la 20 Hz la 391 Hz. O funcţie HFV este calculată din ecuaţia (4.18) pentru G=1, A=21 şi B=50. HFV este echivalent cu un filtru trece bandă de la 410 Hz la 977 Hz. O raţie ‚murmur’ RM(i) este calculată pentru fiecare cadru după cum urmează [Chi00]: LFV(i) RM(i) (4.37) HFV(i) Raţia murmur este netezită de un filtru median de ordinul 5. Estimarea murmurului, EM(i), în cadrul scalei continue [0,1], este calculată pentru fiecare cadru prin compararea raţiei murmurului netezit cu cele două valori de prag. Estimarea murmurului este dată de [Chi00]: 1, RM ( i) T upper EM(i) 0, RM ( i) T lower RM ( i) T lower Tlower RM ( i) T , Tupper T lower unde Tupper= 12 şi Tlower = 3. upper (4.38) Estimarea semivocalei ESV(i) este calculată pentru fiecare cadru astfel [Chi00]: ESV(i) = (1- EM(i))(1- EBS(i)) EC(i) (4.39) unde: - i este indexul cadrului curent, - EBS(i) este estimarea benzii sonore din (4.34), iar - EC(i) este estimarea consoanei sonore din (4.32). Valoarea ESV(i) este limitată la o scară [0,1]. Dacă ESV(i) este mai mare de 1, este setată la unitate. Ecuaţia (4.39) arată următorul fapt: dacă acel cadru are o estimare bună a consoanei sonore, o estimare slabă a murmurului şi a benzii vocale, atunci estimarea semivocalei va fi ridicată.
4.3.3.7. Detectarea fricativelor sonore 77 Cap. 4. Analiza semnalului vocal Algoritmul de detectare a fricativelor sonore deviază faţă de detectorul standard, deşi calculează estimările caracteristicilor din valori de praguri fixe. Primul pas în detectarea fricativelor sonore este o preaccentuare a răspunsului în frecvenţă a filtrului format de coeficienţii LPC. Preaccentuarea se face printr-o funcţie pondere W în domeniul frecvenţă astfel [Chi00]: m j m 256 W ( e ) 256 , cu 0 ≤ m ≤ 255 (4.40) Răspunsul în frecvenţă (preemfazat) pentru cadrul i, Ĥi , este [Chi00]: Ĥi ( e m j 256 m j m j 256 256 ) W ( e ) H ( e ) , pentru 0 ≤ m ≤255 (4.41) unde Hi este calculat din ecuaţia (4.19) pentru cadrul i cu G=1. i Frecvenţa mediană a răspunsului în frecvenţă preemfazat, MF(i), se calculează pentru fiecare cadru astfel [Chi00]: 1 MF( i) H 255 total( i) m0 m Fs ( | H i ( e 256 2 unde: - Fs= 10 KHz, - i este indexul cadrului, - Htotal(i) este dat pentru cadru [Chi00]: 255 Htotal(i) = | m0 H m j 256 i ( ) | e m j 256 ) |) (4.42) (4.43) Spre deosebire de cazurile anterioare, unde filtrul median de netezire era de ordinul 5, MF(i) este netezit de un filtru median de ordinul trei. Estimarea frecvenţei înalte HFS(i) este calculată pentru fiecare cadru după cum urmează [Chi00]: 1, MF( i) T upper HFS(i) 0, MF( i) T lower MF( i) T lower Tlower MF( i) T , T upper T lower upper (4.44) unde Tupper= 3200 şi Tlower = 240. Valorile de prag sunt determinate empiric.
- Page 44 and 45: 3.2.1.1.1. Facilităţi de ordin ge
- Page 46 and 47: 28 Cap. 3. Procesarea digitală a s
- Page 48 and 49: 30 Cap. 3. Procesarea digitală a s
- Page 50 and 51: 1) Analiza spectrală a vocalelor p
- Page 52 and 53: 3) Analiza spectrală a sunetelor e
- Page 54 and 55: Figura 3.25. Cazul A. Semnalul x(t)
- Page 56 and 57: Figura 3.31. Cazul C. Semnal audio
- Page 58 and 59: Figura 3.39. Litera A din cuvântul
- Page 60 and 61: 11) Analiza spectrală a sunetelor
- Page 62 and 63: Figura 3.55. Vocala U -FM. In acest
- Page 64 and 65: 46 Cap. 3. Procesarea digitală a s
- Page 66 and 67: Vocala O : Figura 3.68. Vocala O se
- Page 68 and 69: 50 Cap. 3. Procesarea digitală a s
- Page 70 and 71: 52 Cap. 3. Procesarea digitală a s
- Page 72 and 73: 4. Analiza semnalului vocal După p
- Page 74 and 75: Figura 4.2. Structura spectrală a
- Page 76 and 77: Amplitudinea medie pentru N eşanti
- Page 78 and 79: 4.2.2. Analiza în domeniul frecven
- Page 80 and 81: F0 Excitaţie Figura 4.5. Modelul p
- Page 82 and 83: 64 Cap. 4. Analiza semnalului vocal
- Page 84 and 85: 4.3. Segmentarea semnalului vocal 6
- Page 86 and 87: 68 Cap. 4. Analiza semnalului vocal
- Page 88 and 89: 70 Cap. 4. Analiza semnalului vocal
- Page 90 and 91: 1 BNP mean p( n) (4.23) 20 20 n1
- Page 92 and 93: 74 Cap. 4. Analiza semnalului vocal
- Page 96 and 97: 78 Cap. 4. Analiza semnalului vocal
- Page 98 and 99: D(x,y) 255 m0 || H ( e x m j 256 2
- Page 100 and 101: 82 Cap. 4. Analiza semnalului vocal
- Page 102 and 103: 84 Cap. 4. Analiza semnalului vocal
- Page 104 and 105: 86 Cap. 4. Analiza semnalului vocal
- Page 106 and 107: 3. Regiune de tip vocală sonoră (
- Page 108 and 109: 90 Cap. 4. Analiza semnalului vocal
- Page 110 and 111: 92 Cap. 4. Analiza semnalului vocal
- Page 112 and 113: 4.4.2.3.1. Detectarea subregiunilor
- Page 114 and 115: 96 Cap. 4. Analiza semnalului vocal
- Page 116 and 117: 4.4.2.5. Detectarea categoriei Tran
- Page 118 and 119: Detectorul regiunii tranzitorii den
- Page 120 and 121: 102 Cap. 4. Analiza semnalului voca
- Page 122 and 123: Algoritmul de compactare în acest
- Page 124 and 125: 106 Cap. 4. Analiza semnalului voca
- Page 126 and 127: 108 Cap. 4. Analiza semnalului voca
- Page 128 and 129: 110 Cap. 4. Analiza semnalului voca
- Page 130 and 131: Punctul pivot se determină conform
- Page 132 and 133: 4.6.1.3. Detectarea maximelor de pe
- Page 134 and 135: 116 Cap. 4. Analiza semnalului voca
- Page 136 and 137: 118 Cap. 4. Analiza semnalului voca
- Page 138 and 139: 120 Cap. 4. Analiza semnalului voca
- Page 140 and 141: 4.7.3. Segmentarea bazată pe proba
- Page 142 and 143: 124 Cap. 4. Analiza semnalului voca
0, RN(<br />
i)<br />
T<br />
upper<br />
<br />
EN(i) <br />
1,<br />
RN(<br />
i)<br />
T<br />
lower<br />
T<br />
upper RN(<br />
i)<br />
Tlower<br />
RN(<br />
i)<br />
T<br />
<br />
,<br />
T<br />
upper T<br />
lower<br />
76<br />
upper<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Cap. 4. Analiza semnalului vocal<br />
(4.36)<br />
unde Tupper= 20 şi Tlower = 0.05. Valorile de prag sunt determinate empiric.<br />
4.3.3.6. Detectarea semivocalelor<br />
Detectarea semivocalelor se bazează pe o metodă dezvoltată de EspyWilson [Esp86].<br />
Algoritmul deviază uşor de la detectorul standard, deşi utilizează funcţia volum din ecuaţia<br />
(4.18). Se calculează mai întâi funcţia LFV cu G=1, A=1, B=20.<br />
În acest caz, LFV este echivalent cu un filtru trece bandă de la 20 Hz la 391 Hz. O<br />
funcţie HFV este calculată din ecuaţia (4.18) pentru G=1, A=21 şi B=50. HFV este echivalent cu<br />
un filtru trece bandă de la 410 Hz la 977 Hz. O raţie ‚murmur’ RM(i) este calculată pentru fiecare<br />
cadru după cum urmează [Chi00]:<br />
LFV(i)<br />
RM(i) (4.37)<br />
HFV(i)<br />
Raţia murmur este netezită de un filtru median de ordinul 5. Estimarea murmurului,<br />
EM(i), în cadrul scalei continue [0,1], este calculată pentru fiecare cadru prin compararea raţiei<br />
murmurului netezit cu cele două valori de prag. Estimarea murmurului este dată de [Chi00]:<br />
<br />
1,<br />
RM ( i)<br />
T<br />
upper<br />
<br />
EM(i) <br />
0,<br />
RM ( i)<br />
T<br />
lower<br />
RM<br />
( i)<br />
T<br />
lower Tlower<br />
RM<br />
( i)<br />
T<br />
<br />
,<br />
Tupper<br />
T<br />
lower<br />
unde Tupper= 12 şi Tlower = 3.<br />
upper<br />
<br />
<br />
<br />
(4.38)<br />
<br />
<br />
<br />
Estimarea semivocalei ESV(i) este calculată pentru fiecare cadru astfel [Chi00]:<br />
ESV(i) = (1- EM(i))(1- EBS(i)) EC(i) (4.39)<br />
unde:<br />
- i este indexul cadrului curent,<br />
- EBS(i) este estimarea benzii sonore din (4.34), iar<br />
- EC(i) este estimarea consoanei sonore din (4.32).<br />
Valoarea ESV(i) este limitată la o scară [0,1]. Dacă ESV(i) este mai mare de 1, este setată<br />
la unitate. Ecuaţia (4.39) arată următorul fapt: dacă acel cadru are o estimare bună a consoanei<br />
sonore, o estimare slabă a murmurului şi a benzii vocale, atunci estimarea semivocalei va fi<br />
ridicată.