Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
Figura 3.31. Cazul C. Semnal audio generat ca sumă de 22 de frecvenţe de la 1000 Hz la 22000 Hz. Componentele au toate aceeaşi amplitudine. 9) Timbrul sunetului şi percepţia auditivă 38 Cap. 3. Procesarea digitală a semnalului vocal Figura 3.32. Cazul D. Acelaşi semnal înregistrat pe casetofon apoi din nou pe calculator la aceeaşi frecvenţă de eşantionare cu semnalul original. Banda de frecvenţe s-a redus până la 14000 Hz, iar amplitudinile frecvenţelor sunt în descreştere progresivă până la zero. Folosind un sintetizator audio, au fost generate notele muzicale cu diferite timbre corespunzătoare instrumentelor muzicale (pian, acordeon, orgă, vibrafon). S-a constatat că sunetul este cu atât mai profund şi mai intens receptat de ascultător cu cât timbrul sonor este mai bogat şi armonicile au amplitudine mai mare. În continuare sunt prezentate armonicile spectrale pentru cele patru tipuri de instrumente considerate. Frecvenţa fundamentală a sunetului (nota DO) este aceeaşi, dar situarea armonicilor precum şi amplitudinea acesto ra conferă timbrul specific fiecărui instrument. Figura 3.33. Nota Do la pian. Frecvenţa fundamentală este 525 Hz. Figura 3.34. Nota Do la acordeon. Are aceeaşi frecvenţă fundamentală, dar un timbru mai bogat.
Figura 3.35. Nota Do la vibrafon. Se observă spectrul constituit doar din două armonici; sunetul este mai pur, dar nu la fel de profund ca în cazurile anterioare. 10) Calitatea rostirii în sinteza de voce 39 Cap. 3. Procesarea digitală a semnalului vocal Figura 3.36. Nota Do la orgă. Sunetul are un impact perceptual profund din cauza armonicilor secundare care au amplitudinea apropiată de amplitudinea armonicii principale. Pentru sinteza de voce este foarte importantă construirea unei baze de date vocale adecvată. Aceasta presupune preluarea unor segmente de voce de la o persoană reală în vederea prelucrării şi apoi sintetizării vorbirii pentru un text dat. Vocea aleasă trebuie să aibă parametrii acustici superiori pentru a genera o sinteză de calitate. S-au efectuat experimente cu vocea autorului, atât în codiţii normale cât şi în condiţiile obstrucţionării căilor nazale. În figurile următoare sunt prezentate efectele apărute: Figura 3.37. Litera M din cuvântul “mama” rostit în condiţii normale. Se observă doi formanţi la 64 şi 128 Hz. Figura 3.38. Litera M din cuvântul “mama” rostit în condiţiile obstrucţionării căilor nazale. Se observă dispariţia celui deal doilea formant.
- Page 6 and 7: 6. Metode de sinteză de voce......
- Page 9 and 10: Lista de abrevieri ADPCM - Adaptive
- Page 11 and 12: Figura 3.17. Vocala A1. Se observă
- Page 13 and 14: Figura 3.63. Vocala E porţiunea me
- Page 15 and 16: Figura 4.57. Asocierea foneme-regiu
- Page 17: Lista de tabele Tabelul 2.1. Relaţ
- Page 20 and 21: 2 Cap. 1. Introducere Se prezintă
- Page 22 and 23: 4 Cap. 1. Introducere Autorul tezei
- Page 24 and 25: 2. Modalitatea producerii vorbirii
- Page 26 and 27: Faringe nazal Vălul palatin Faring
- Page 28 and 29: 10 Cap. 2. Modalitatea producerii v
- Page 30 and 31: 12 Cap. 2. Modalitatea producerii v
- Page 32 and 33: 14 Cap. 2. Modalitatea producerii v
- Page 34 and 35: 16 Cap. 2. Modalitatea producerii v
- Page 36 and 37: 2.7.1.2. Efectele tractului vocal 1
- Page 38 and 39: 20 Cap. 3. Procesarea digitală a s
- Page 40 and 41: 22 Cap. 3. Procesarea digitală a s
- Page 42 and 43: 24 Cap. 3. Procesarea digitală a s
- Page 44 and 45: 3.2.1.1.1. Facilităţi de ordin ge
- Page 46 and 47: 28 Cap. 3. Procesarea digitală a s
- Page 48 and 49: 30 Cap. 3. Procesarea digitală a s
- Page 50 and 51: 1) Analiza spectrală a vocalelor p
- Page 52 and 53: 3) Analiza spectrală a sunetelor e
- Page 54 and 55: Figura 3.25. Cazul A. Semnalul x(t)
- Page 58 and 59: Figura 3.39. Litera A din cuvântul
- Page 60 and 61: 11) Analiza spectrală a sunetelor
- Page 62 and 63: Figura 3.55. Vocala U -FM. In acest
- Page 64 and 65: 46 Cap. 3. Procesarea digitală a s
- Page 66 and 67: Vocala O : Figura 3.68. Vocala O se
- Page 68 and 69: 50 Cap. 3. Procesarea digitală a s
- Page 70 and 71: 52 Cap. 3. Procesarea digitală a s
- Page 72 and 73: 4. Analiza semnalului vocal După p
- Page 74 and 75: Figura 4.2. Structura spectrală a
- Page 76 and 77: Amplitudinea medie pentru N eşanti
- Page 78 and 79: 4.2.2. Analiza în domeniul frecven
- Page 80 and 81: F0 Excitaţie Figura 4.5. Modelul p
- Page 82 and 83: 64 Cap. 4. Analiza semnalului vocal
- Page 84 and 85: 4.3. Segmentarea semnalului vocal 6
- Page 86 and 87: 68 Cap. 4. Analiza semnalului vocal
- Page 88 and 89: 70 Cap. 4. Analiza semnalului vocal
- Page 90 and 91: 1 BNP mean p( n) (4.23) 20 20 n1
- Page 92 and 93: 74 Cap. 4. Analiza semnalului vocal
- Page 94 and 95: 0, RN( i) T upper EN(i) 1, RN( i)
- Page 96 and 97: 78 Cap. 4. Analiza semnalului vocal
- Page 98 and 99: D(x,y) 255 m0 || H ( e x m j 256 2
- Page 100 and 101: 82 Cap. 4. Analiza semnalului vocal
- Page 102 and 103: 84 Cap. 4. Analiza semnalului vocal
- Page 104 and 105: 86 Cap. 4. Analiza semnalului vocal
Figura 3.35. Nota Do la vibrafon. Se<br />
observă spectrul constituit doar din două<br />
armonici; sunetul este mai pur, dar nu la fel<br />
de profund ca în cazurile anterioare.<br />
10) Calitatea rostirii în sinteza de voce<br />
39<br />
Cap. 3. Procesarea digitală a semnalului vocal<br />
Figura 3.36. Nota Do la orgă. Sunetul are<br />
un impact perceptual profund din cauza<br />
armonicilor secundare care au amplitudinea<br />
apropiată de amplitudinea armonicii<br />
principale.<br />
Pentru sinteza de voce este foarte importantă construirea unei baze de date vocale<br />
adecvată. Aceasta presupune preluarea unor segmente de voce de la o persoană reală în<br />
vederea prelucrării şi apoi sintetizării vorbirii pentru un text dat. Vocea aleasă trebuie să aibă<br />
parametrii acustici superiori pentru a genera o sinteză de calitate. S-au efectuat experimente<br />
cu vocea autorului, atât în codiţii normale cât şi în condiţiile obstrucţionării căilor nazale. În<br />
figurile următoare sunt prezentate efectele apărute:<br />
Figura 3.37. Litera M din cuvântul<br />
“mama” rostit în condiţii normale. Se<br />
observă doi formanţi la 64 şi 128 Hz.<br />
Figura 3.38. Litera M din cuvântul<br />
“mama” rostit în condiţiile obstrucţionării<br />
căilor nazale. Se observă dispariţia celui deal<br />
doilea formant.