Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
86 Cap. 4. Analiza semnalului vocal Primele zece puncte rezultate în urma aplicării algoritmului pe segmentul din figura 4.13 sunt prezentate în tabelul 4.3. Pe prima linie sunt figurate tipul punctelor găsite (Z – zero, M – maxim, m – minim), iar pe linia a doua amplitudinile eşantioanelor în valoare absolută: Tabelul 4.3. Rezultatele algoritmului zero-minim-maxim P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 Tip M0 Z1 m1 Z2 M2 Z3 m3 Z4 M4 Z5 Amp. 9992 161 4311 54 10760 190 4881 56 11406 166 4.4.2. Segmentarea S/U/V şi detecţia de regiuni Algoritmul propus de autor realizează segmentarea automată a semnalului vocal în 10 clase de regiuni. Se împarte mai întâi semnalul vocal în 4 categorii de bază: linişte ( Silence), vocală sonoră ( Voiced), consoană nesonoră ( Unvoiced), respectiv tranziţie, apoi se realizează clasificarea acestora în 10 clase distincte de regiuni: linişte, consoană nesonoră, vocală sonoră, linişte-nesonoră, regiune de tip salt, neregulată, tranzitorie, tranzitorie densă, discontinuă de tip R şi discontinuă de tip G. Algoritmul comportă o abordare top-down, pe cinci nivele (vezi figura 4.14). Mai întâi, pe nivelul superior sunt detectate categoriile: linişte (L), vocală (V), consoană nesonoră (C). Pe nivelul doi se detectează categoria tranziţie ( T). Pe nivelul trei se clasifică categoriile de pe nivelurile unu şi doi în cele 10 clase de regiuni; pe nivelele patru şi cinci se găsesc clasele (1) - (10). N 1 N 2 N 3 N 4 N 5 L V L C T T T L V L C L LB V VS T TN TD C V VR VG Figura 4.14. Algoritmul de detecţie a regiunilor Categorii LCV (SUV) Categoria T Clasificare Clase de regiuni Subtipuri
Au fost definite următoarele categorii de bază şi clase de regiuni : Tabelul 4.4. Categoriile de bază şi clasele de regiuni Categorii de bază Clase de regiuni 1. L – Linişte 2. V – Vocală (sonoră) 3. C – Consoană (nesonoră) 4. T – Tranziţie 1. L - REG_LIN – Regiune de linişte 87 Cap. 4. Analiza semnalului vocal 2. LB - REG_LIN_CONS - Regiune de tip linişte nesonoră 3. V - REG_VOC - Regiune de tip vocală sonoră 4. VS - REG_SALT - Regiune de tip salt 5. T - REG_TRANZ- Regiune tranzitorie 6. TD - REG_TRANZ_DENSA- Regiune tranzitorie densă 7. TN - REG_NEREG - Regiune neregulată scurtă 8. C - REG_CONS - Regiune de tip consoană nesonoră 9. VR - REG_R - Regiune de discontinuitate de tip “R” 10.VG - REG_G - Regiune de discontinuitate de tip “G” Corespondenţele dintre categoriile de bază şi clasele de regiuni sunt arătate în figura 4.15: CLASĂ CATEGORIE Figura 4.15. Relaţia dintre categoriile de bază şi clasele de regiuni Cele 10 clase de regiuni sunt următoarele : 1. Regiune de tip linişte (REG_LIN) Este o regiune în care nu se detectează semnal vorbit, respectiv amplitudinea semnalului este foarte mică. 2. Regiune de tip consoană nesonoră (REG_CONS) Pentru limba română, aici intră consoanele fricative /S/, /Ş/, /Ţ/, /F/, /Z/, /J/, /H/, precum şi africativele /Ce/, /Ci/, /Ge/, /Gi/ . Regiune L V T C L LB V VR VG VS T TN TD C
- Page 54 and 55: Figura 3.25. Cazul A. Semnalul x(t)
- Page 56 and 57: Figura 3.31. Cazul C. Semnal audio
- Page 58 and 59: Figura 3.39. Litera A din cuvântul
- Page 60 and 61: 11) Analiza spectrală a sunetelor
- Page 62 and 63: Figura 3.55. Vocala U -FM. In acest
- Page 64 and 65: 46 Cap. 3. Procesarea digitală a s
- Page 66 and 67: Vocala O : Figura 3.68. Vocala O se
- Page 68 and 69: 50 Cap. 3. Procesarea digitală a s
- Page 70 and 71: 52 Cap. 3. Procesarea digitală a s
- Page 72 and 73: 4. Analiza semnalului vocal După p
- Page 74 and 75: Figura 4.2. Structura spectrală a
- Page 76 and 77: Amplitudinea medie pentru N eşanti
- Page 78 and 79: 4.2.2. Analiza în domeniul frecven
- Page 80 and 81: F0 Excitaţie Figura 4.5. Modelul p
- Page 82 and 83: 64 Cap. 4. Analiza semnalului vocal
- Page 84 and 85: 4.3. Segmentarea semnalului vocal 6
- Page 86 and 87: 68 Cap. 4. Analiza semnalului vocal
- Page 88 and 89: 70 Cap. 4. Analiza semnalului vocal
- Page 90 and 91: 1 BNP mean p( n) (4.23) 20 20 n1
- Page 92 and 93: 74 Cap. 4. Analiza semnalului vocal
- Page 94 and 95: 0, RN( i) T upper EN(i) 1, RN( i)
- Page 96 and 97: 78 Cap. 4. Analiza semnalului vocal
- Page 98 and 99: D(x,y) 255 m0 || H ( e x m j 256 2
- Page 100 and 101: 82 Cap. 4. Analiza semnalului vocal
- Page 102 and 103: 84 Cap. 4. Analiza semnalului vocal
- Page 106 and 107: 3. Regiune de tip vocală sonoră (
- Page 108 and 109: 90 Cap. 4. Analiza semnalului vocal
- Page 110 and 111: 92 Cap. 4. Analiza semnalului vocal
- Page 112 and 113: 4.4.2.3.1. Detectarea subregiunilor
- Page 114 and 115: 96 Cap. 4. Analiza semnalului vocal
- Page 116 and 117: 4.4.2.5. Detectarea categoriei Tran
- Page 118 and 119: Detectorul regiunii tranzitorii den
- Page 120 and 121: 102 Cap. 4. Analiza semnalului voca
- Page 122 and 123: Algoritmul de compactare în acest
- Page 124 and 125: 106 Cap. 4. Analiza semnalului voca
- Page 126 and 127: 108 Cap. 4. Analiza semnalului voca
- Page 128 and 129: 110 Cap. 4. Analiza semnalului voca
- Page 130 and 131: Punctul pivot se determină conform
- Page 132 and 133: 4.6.1.3. Detectarea maximelor de pe
- Page 134 and 135: 116 Cap. 4. Analiza semnalului voca
- Page 136 and 137: 118 Cap. 4. Analiza semnalului voca
- Page 138 and 139: 120 Cap. 4. Analiza semnalului voca
- Page 140 and 141: 4.7.3. Segmentarea bazată pe proba
- Page 142 and 143: 124 Cap. 4. Analiza semnalului voca
- Page 144 and 145: 126 Cap. 4. Analiza semnalului voca
- Page 146 and 147: 128 Cap. 4. Analiza semnalului voca
- Page 148 and 149: 130 Cap. 4. Analiza semnalului voca
- Page 150 and 151: 132 Cap. 4. Analiza semnalului voca
- Page 152 and 153: 134 Cap. 4. Analiza semnalului voca
Au fost definite următoarele categorii de bază şi clase de regiuni :<br />
Tabelul 4.4. Categoriile de bază şi clasele de regiuni<br />
Categorii de bază Clase de regiuni<br />
1. L – Linişte<br />
2. V – Vocală (sonoră)<br />
3. C – Consoană (nesonoră)<br />
4. T – Tranziţie<br />
1. L - REG_LIN – Regiune de linişte<br />
87<br />
Cap. 4. Analiza semnalului vocal<br />
2. LB - REG_LIN_CONS - Regiune de tip linişte nesonoră<br />
3. V - REG_VOC - Regiune de tip vocală sonoră<br />
4. VS - REG_SALT - Regiune de tip salt<br />
5. T - REG_TRANZ- Regiune tranzitorie<br />
6. TD - REG_TRANZ_DENSA- Regiune tranzitorie densă<br />
7. TN - REG_NEREG - Regiune neregulată scurtă<br />
8. C - REG_CONS - Regiune de tip consoană nesonoră<br />
9. VR - REG_R - Regiune de discontinuitate de tip “R”<br />
10.VG - REG_G - Regiune de discontinuitate de tip “G”<br />
Corespondenţele dintre categoriile de bază şi clasele de regiuni sunt arătate în figura 4.15:<br />
CLASĂ<br />
CATEGORIE<br />
Figura 4.15. Relaţia dintre categoriile de bază şi clasele de regiuni<br />
Cele 10 clase de regiuni sunt următoarele :<br />
1. Regiune de tip linişte (REG_LIN)<br />
Este o regiune în care nu se detectează semnal vorbit, respectiv amplitudinea semnalului<br />
este foarte mică.<br />
2. Regiune de tip consoană nesonoră (REG_CONS)<br />
Pentru limba română, aici intră consoanele fricative /S/, /Ş/, /Ţ/, /F/, /Z/, /J/, /H/, precum<br />
şi africativele /Ce/, /Ci/, /Ge/, /Gi/ .<br />
Regiune<br />
L V T C<br />
L LB V VR VG VS T TN TD C