Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
52 Cap. 3. Procesarea digitală a semnalului vocal Tabelul 3.4. Duratele comparative între silabele accentuate şi silabele normale Normal Accentuat Creştere t (ms) t (ms) (%) MA 149 182 22.15 ME 127 166 30.71 MI 150 166 10.67 MO 134 168 25.37 MU 133 150 12.78 În încheiere, pentru a sintetiza pe scurt rezultatele experimentelor efectuate asupra sunetelor vocalice, se pot formula următoarele concluzii: 1. Rostirea vocalelor diferă în funcţie de vorbitor, dar spectrele pentru o aceeaşi vocală prezintă caracteristici comune în ceea ce priveşte numărul formanţilor şi învelitoarea spectrală. 2. Pentru un acelaşi vorbitor, vocalele prezintă o frecvenţă fundamentală specifică şi o structură formantică specifică. S-a constatat că sunetele sunt cu atât mai pure cu cât lăţimea formanţilor este mai mică şi structura frecvenţelor formantice este mai aproape de structura armonică a sunetului alcătuită din frecvenţe situate la valori multiplu de frecvenţa fundamentală. 3. Deosebit de importante pentru calitatea rostirii vocalice sunt armonicile situate la frecvenţe superioare. Acestea dau timbrul specific rostirii, iar în absenţa lor sunetul va fi perceput ca un sunet plat, metalizat. 4. Vocalele prezintă întotdeauna trei porţiuni distincte: porţiunea de atac (iniţială), mediană şi de cădere (finală). De cele mai multe ori, segmentele iniţial şi final sunt influenţate de contextul fonematic în care se găsesc. 5. Sunetele vocalice prezintă caracteristici distincte atunci când sunt rostite în cadrul silabelor accentuate din cuvinte. S-au constatat variaţii ale tuturor parametrilor ce influenţează prozodia: durata, amplitudinea şi frecvenţa. Astfel, durata segmentului vocalic creşte, la fel şi amplitudinea, iar frecvenţa fundamentală variază pe parcursul rostirii de la o valoare iniţială la o valoare finală într-o proporţie de până la 15-20%. Aceste observaţii asupra rezultatelor cercetărilor efectuate au o mare importanţă mai ales pentru sinteza vorbirii, arătând modul specific de sinteză al sunetelor în scopul obţinerii unei rostiri de calitate superioară, apropiată de rostirea umană propriu-zisă.
53 Cap. 3. Procesarea digitală a semnalului vocal 3.2.3. Concluzii privind contribuţiile autorului în domeniul procesării semnalului vocal În acest capitol au fost prezentate cercetările proprii precum şi rezultatele experimentale obţinute în analiza unor eşantioane reale de semnal vocal. În primul rând a fost descrisă aici o aplicaţie originală proiectată de autor numită SPEA - Signal Processing and Enhancement Application, aplicaţie destinată analizei şi procesării semnalului vocal. Aplicaţia prezintă următoarele facilităţi: încărcarea semnalului vocal înregistrat în fişiere wave având diferite codificări, vizualizarea formei de undă şi a eşantioanelor de semnal pe diferite scale de mărime, determinarea parametrilor semnalului vocal (amplitudine, energie, număr de treceri prin zero, frecvenţa fundamentală - în domeniul timp; spectrul de amplitudini, spectrul de faze, formanţii - pentru domeniul frecvenţă), posibilitatea de modificare interactivă a componentelor din spectrele de amplitudini şi faze în scopul îmbunătăţirii calităţii acustice a semnalului vocal. A fost prezentat de asemeni şi modul de lucru al utilizatorului în interacţiunea cu aplicaţia. Au fost prezentate rezultatele experimentelor efectuate, experimente axate pe studiul proprietăţilor specifice ale semnalului vocal ce asigură o calitate superioară sunetului emis. Astfel, au fost efectuate diverse analize spectrale de sunet: analiza spectrală a vocalelor emise de diferiţi vorbitori, analiza spectrală a consoanelor, analiza spectrală a sunetelor emise multitonal, evidenţiându-se importanţa alegerii ferestrei de semnal asupra rezultatului analizei spectrale; comportarea semnalelor modulate; analize sonore perceptuale: analiza perceptuală a sunetelor emise în fază diferită, relaţia dintre timbrul sunetului şi percepţia auditivă. Au fost studiaţi de asemeni factorii care determină în mod semnificativ calitatea vocii, arătându-se care este influenţa frecvenţei de eşantionare şi a mediului de înregistrare asupra calităţii vocii şi a sunetului emis, precum şi factorii determinanţi pentru a realiza o sinteză vocală de calitate superioară. Analiza comportării sunetelor vocalice prezentată în finalul capitolului are o mare importanţă în scopul realizării unei sinteze a vorbirii de calitate. În acest sens au fost studiate caracteristicile sunetelor vocalice în diferite contexte fonematice şi prozodice, realizându-se diagrame comparative ale rostirii lor în aceste contexte.
- Page 20 and 21: 2 Cap. 1. Introducere Se prezintă
- Page 22 and 23: 4 Cap. 1. Introducere Autorul tezei
- Page 24 and 25: 2. Modalitatea producerii vorbirii
- Page 26 and 27: Faringe nazal Vălul palatin Faring
- Page 28 and 29: 10 Cap. 2. Modalitatea producerii v
- Page 30 and 31: 12 Cap. 2. Modalitatea producerii v
- Page 32 and 33: 14 Cap. 2. Modalitatea producerii v
- Page 34 and 35: 16 Cap. 2. Modalitatea producerii v
- Page 36 and 37: 2.7.1.2. Efectele tractului vocal 1
- Page 38 and 39: 20 Cap. 3. Procesarea digitală a s
- Page 40 and 41: 22 Cap. 3. Procesarea digitală a s
- Page 42 and 43: 24 Cap. 3. Procesarea digitală a s
- Page 44 and 45: 3.2.1.1.1. Facilităţi de ordin ge
- Page 46 and 47: 28 Cap. 3. Procesarea digitală a s
- Page 48 and 49: 30 Cap. 3. Procesarea digitală a s
- Page 50 and 51: 1) Analiza spectrală a vocalelor p
- Page 52 and 53: 3) Analiza spectrală a sunetelor e
- Page 54 and 55: Figura 3.25. Cazul A. Semnalul x(t)
- Page 56 and 57: Figura 3.31. Cazul C. Semnal audio
- Page 58 and 59: Figura 3.39. Litera A din cuvântul
- Page 60 and 61: 11) Analiza spectrală a sunetelor
- Page 62 and 63: Figura 3.55. Vocala U -FM. In acest
- Page 64 and 65: 46 Cap. 3. Procesarea digitală a s
- Page 66 and 67: Vocala O : Figura 3.68. Vocala O se
- Page 68 and 69: 50 Cap. 3. Procesarea digitală a s
- Page 72 and 73: 4. Analiza semnalului vocal După p
- Page 74 and 75: Figura 4.2. Structura spectrală a
- Page 76 and 77: Amplitudinea medie pentru N eşanti
- Page 78 and 79: 4.2.2. Analiza în domeniul frecven
- Page 80 and 81: F0 Excitaţie Figura 4.5. Modelul p
- Page 82 and 83: 64 Cap. 4. Analiza semnalului vocal
- Page 84 and 85: 4.3. Segmentarea semnalului vocal 6
- Page 86 and 87: 68 Cap. 4. Analiza semnalului vocal
- Page 88 and 89: 70 Cap. 4. Analiza semnalului vocal
- Page 90 and 91: 1 BNP mean p( n) (4.23) 20 20 n1
- Page 92 and 93: 74 Cap. 4. Analiza semnalului vocal
- Page 94 and 95: 0, RN( i) T upper EN(i) 1, RN( i)
- Page 96 and 97: 78 Cap. 4. Analiza semnalului vocal
- Page 98 and 99: D(x,y) 255 m0 || H ( e x m j 256 2
- Page 100 and 101: 82 Cap. 4. Analiza semnalului vocal
- Page 102 and 103: 84 Cap. 4. Analiza semnalului vocal
- Page 104 and 105: 86 Cap. 4. Analiza semnalului vocal
- Page 106 and 107: 3. Regiune de tip vocală sonoră (
- Page 108 and 109: 90 Cap. 4. Analiza semnalului vocal
- Page 110 and 111: 92 Cap. 4. Analiza semnalului vocal
- Page 112 and 113: 4.4.2.3.1. Detectarea subregiunilor
- Page 114 and 115: 96 Cap. 4. Analiza semnalului vocal
- Page 116 and 117: 4.4.2.5. Detectarea categoriei Tran
- Page 118 and 119: Detectorul regiunii tranzitorii den
52<br />
Cap. 3. Procesarea digitală a semnalului vocal<br />
Tabelul 3.4. Duratele comparative între silabele accentuate şi silabele normale<br />
Normal Accentuat Creştere<br />
t (ms) t (ms) (%)<br />
MA 149 182 22.15<br />
ME 127 166 30.71<br />
MI 150 166 10.67<br />
MO 134 168 25.37<br />
MU 133 150 12.78<br />
În încheiere, pentru a sintetiza pe scurt rezultatele experimentelor efectuate asupra<br />
sunetelor vocalice, se pot formula următoarele concluzii:<br />
1. Rostirea vocalelor diferă în funcţie de vorbitor, dar spectrele pentru o aceeaşi vocală<br />
prezintă caracteristici comune în ceea ce priveşte numărul formanţilor şi învelitoarea spectrală.<br />
2. Pentru un acelaşi vorbitor, vocalele prezintă o frecvenţă fundamentală specifică şi o<br />
structură formantică specifică. S-a constatat că sunetele sunt cu atât mai pure cu cât lăţimea<br />
formanţilor este mai mică şi structura frecvenţelor formantice este mai aproape de structura<br />
armonică a sunetului alcătuită din frecvenţe situate la valori multiplu de frecvenţa fundamentală.<br />
3. Deosebit de importante pentru calitatea rostirii vocalice sunt armonicile situate la<br />
frecvenţe superioare. Acestea dau timbrul specific rostirii, iar în absenţa lor sunetul va fi<br />
perceput ca un sunet plat, metalizat.<br />
4. Vocalele prezintă întotdeauna trei porţiuni distincte: porţiunea de atac (iniţială),<br />
mediană şi de cădere (finală). De cele mai multe ori, segmentele iniţial şi final sunt influenţate de<br />
contextul fonematic în care se găsesc.<br />
5. Sunetele vocalice prezintă caracteristici distincte atunci când sunt rostite în cadrul<br />
silabelor accentuate din cuvinte. S-au constatat variaţii ale tuturor parametrilor ce influenţează<br />
prozodia: durata, amplitudinea şi frecvenţa. Astfel, durata segmentului vocalic creşte, la fel şi<br />
amplitudinea, iar frecvenţa fundamentală variază pe parcursul rostirii de la o valoare iniţială la o<br />
valoare finală într-o proporţie de până la 15-20%.<br />
Aceste observaţii asupra rezultatelor cercetărilor efectuate au o mare importanţă mai ales<br />
pentru sinteza vorbirii, arătând modul specific de sinteză al sunetelor în scopul obţinerii unei<br />
rostiri de calitate superioară, apropiată de rostirea umană propriu-zisă.