Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
Figura 3.39. Litera A din cuvântul “mama” rostit în condiţii normale. Se observă doi formanţi principali şi alţi câţiva secundari. ..............................................................40 Figura 3.40. Litera A din cuvântul “mama” rostit în condiţiile obstrucţionării căilor nazale. Se observă dispariţia formanţilor de ordin superior precum şi deplasarea în tonalitate a primului formant..............................................................40 Figura 3.41. Litera M din cuvântul “maşină” rostit de către autor (vocea A). Se observă doi formanţi principali..............................................................................................40 Figura 3.42. Litera M din cuvântul “maşină” rostit de vocea B. Spectrul este asemănător cu cel de la vocea A, diferenţele constând doar din raportul amplitudinilor celor doi formanţi. ....................................................................................................40 Figura 3.43. Litera A din cuvântul “maşină” rostit de către autor (vocea A). Spectrul acestei rostiri vocalice conţine trei formanţi bine conturaţi. ....................................41 Figura 3.44. Litera A din cuvântul “maşină” rostit de vocea B. Se observă diferenţa faţă de cazul anterior (vocea A), prin faptul că acum spectrul conţine o serie largă de armonici, cu primele cinci armonici bine conturate. ................................................41 Figura 3.45. Litera S din cuvântul “maşină” rostit de către autor (vocea A). Se observă că spectrul, în cazul acestei consoane, conţine o paletă largă de armonici, situate îndeosebi la frecvenţe superioare. ............................................................................41 Figura 3.46. Litera S din cuvântul “maşină” rostit de vocea B. Diferenţa este că armonicile superioare sunt mult mai bine conturate decât în cazul anterior corespondent........41 Figura 3.47. Vocala A - Formele de undă (sus: FM; jos: MW) ...................................................42 Figura 3.48. Vocala A – Spectrele armonice(sus: A –FM; jos: A –MW) ....................................42 Figura 3.49. Vocala E -FM. Sunt vizibili 3 formanţi principali. ..................................................43 Figura 3.50. Vocala E - MW. Formantul 3 s-a redus cu 5%. .......................................................43 Figura 3.51. Vocala I -FM. În acest caz vocala are doi formanţi. ................................................43 Figura 3.52. Vocala I - MW. Formanţii se păstrează; apare zgomotul de fond............................43 Figura 3.53. Vocala O -FM. In acest caz vocala are trei formanţi. ..............................................43 Figura 3.54. Vocala O - MW. Formantul 3 creşte cu aproximativ 3%.........................................43 Figura 3.55. Vocala U -FM. În acest caz vocala are doi formanţi majori. ...................................44 Figura 3.56. Vocala U - MW. Formantul 2 a scăzut cu aproximativ 12%. ..................................44 Figura 3.57. Vocala /A/ îmbogăţită cu armonici înalte ................................................................44 Figura 3.58. Cele trei segmente definitorii pentru rostirea unei vocale........................................45 Figura 3.59. Vocala A segmentul de atac. Amplitudinea creşte progresiv; durata segmentului: 42,2 ms; frecvenţa medie este de 120 Hz. ..........................................46 Figura 3.60. Vocala A porţiunea mediană. Se observă un spectru de mai multe armonici; amplitudinea este constantă; durata segmentului: 89,6 ms; frecvenţa fundamentală este de 109 Hz....................................................................................46 Figura 3.61. Vocala A porţiunea finală. Amplitudinea scade progresiv; durata segmentului: 37,5 ms; frecvenţa fundamentală este de 124 Hz. .............................46 Figura 3.62. Vocala E segmentul de atac. Amplitudinea creşte; durata segmentului: 45,4 ms; frecvenţa medie este de 112 Hz. ........................................................................47 x
Figura 3.63. Vocala E porţiunea mediană. Spectrul este identic; amplitudinea este constantă; durata segmentului: 87,7 ms; frecvenţa fundamentală este de 106 Hz............................................................................................................................. 47 Figura 3.64. Vocala E porţiunea finală. Amplitudinea scade progresiv; durata segmentului: 66,0 ms; frecvenţa fundamentală este de 117 Hz.............................. 47 Figura 3.65. Vocala I segmentul de atac. Frecvenţa medie este de 130 Hz. Durata segmentului: 51,6 ms. .............................................................................................. 47 Figura 3.66. Vocala I porţiunea mediană. Frecvenţa fundamentală este de 113 Hz. Durata segmentului: 122 ms. ............................................................................................... 47 Figura 3.67. Vocala I porţiunea finală. Amplitudinea scade; frecvenţa funda-mentală este de 123 Hz. Durata segmentului: 60,3 ms................................................................. 48 Figura 3.68. Vocala O segmentul de atac. Amplitudinea creşte; durata segmentului: 41,1 ms; frecvenţa medie este de 118 Hz. ....................................................................... 48 Figura 3.69. Vocala O porţiunea mediană. Amplitudinea rămâne constantă; durata segmentului: 73,2 ms; frecvenţa fundamentală este de 108 Hz............................... 48 Figura 3.70. Vocala O porţiunea finală. Amplitudinea scade progresiv; durata segmentului: 38,5 ms ; frecvenţa fundamentală creşte la 119 Hz. .......................... 48 Figura 3.71. Vocala U segmentul de atac. Amplitudinea creşte; durata segmentului: 34,3 ms; frecvenţa medie este de 116 Hz. ....................................................................... 49 Figura 3.72. Vocala U porţiunea mediană. Amplitudinea este constantă; durata : 51,6 ms; frecvenţa fundamentală este de 99 Hz. .................................................................... 49 Figura 3.73. Vocala U porţiunea finală. Amplitudinea scade progresiv pe o durată de 40,7 ms; frecvenţa fundamentală se menţine aproximativ constantă (96-99 Hz)............ 49 Figura 3.74. Silaba MA neaccentuată. Frecvenţa fundamentală este aproximativ constantă, egală cu 102 Hz. ..................................................................................... 50 Figura 3.75. Silaba MA accentuată. Se observă ceşterea amplitudinii, frecvenţei şi duratei rostirii silabice. Frecvenţa variază de la 113 la 121 Hz............................... 50 Figura 3.76. Variaţia frecvenţei vocalice dintr-o silabă accentuată ............................................. 51 Figura 4.1. Segment de analiză din cadrul semnalului vocal...................................................... 54 Figura 4.2. Structura spectrală a unui semnal vocal periodic [Fer97] ........................................ 56 Figura 4.3. Funcţie fereastră utilizată în ponderare .................................................................... 57 Figura 4.4. Schema bloc a analizorului cu banc de filtre............................................................ 60 Figura 4.5. Modelul producerii vorbirii prin metoda LPC.......................................................... 62 Figura 4.6. Modelul producerii vorbirii prin metoda cepstrală................................................... 63 Figura 4.7. Modul de calcul al cepstrumului .............................................................................. 63 Figura 4.8. Segmentarea semnalului vocal ................................................................................. 66 Figura 4.9. Detectarea automată a segmentelor vorbirii ............................................................. 67 Figura 4.10. Relaţia dintre analiză, segmentare şi etichetare [Chi00] ......................................... 68 Figura 4.11. Rezultatele segmentării prin metoda Childers [Chi00] ........................................... 83 Figura 4.12. Metoda de segmentare automată propusă de autor.................................................. 84 Figura 4.13. Determinarea punctelor de zero, minim, maxim..................................................... 85 Figura 4.14. Algoritmul de detecţie a regiunilor.......................................................................... 86 Figura 4.15. Relaţia dintre categoriile de bază şi clasele de regiuni............................................ 87 xi
- Page 1: FACULTATEA DE ELECTRONICĂ, TELECOM
- Page 4 and 5: 4. Analiza semnalului vocal .......
- Page 6 and 7: 6. Metode de sinteză de voce......
- Page 9 and 10: Lista de abrevieri ADPCM - Adaptive
- Page 11: Figura 3.17. Vocala A1. Se observă
- Page 15 and 16: Figura 4.57. Asocierea foneme-regiu
- Page 17: Lista de tabele Tabelul 2.1. Relaţ
- Page 20 and 21: 2 Cap. 1. Introducere Se prezintă
- Page 22 and 23: 4 Cap. 1. Introducere Autorul tezei
- Page 24 and 25: 2. Modalitatea producerii vorbirii
- Page 26 and 27: Faringe nazal Vălul palatin Faring
- Page 28 and 29: 10 Cap. 2. Modalitatea producerii v
- Page 30 and 31: 12 Cap. 2. Modalitatea producerii v
- Page 32 and 33: 14 Cap. 2. Modalitatea producerii v
- Page 34 and 35: 16 Cap. 2. Modalitatea producerii v
- Page 36 and 37: 2.7.1.2. Efectele tractului vocal 1
- Page 38 and 39: 20 Cap. 3. Procesarea digitală a s
- Page 40 and 41: 22 Cap. 3. Procesarea digitală a s
- Page 42 and 43: 24 Cap. 3. Procesarea digitală a s
- Page 44 and 45: 3.2.1.1.1. Facilităţi de ordin ge
- Page 46 and 47: 28 Cap. 3. Procesarea digitală a s
- Page 48 and 49: 30 Cap. 3. Procesarea digitală a s
- Page 50 and 51: 1) Analiza spectrală a vocalelor p
- Page 52 and 53: 3) Analiza spectrală a sunetelor e
- Page 54 and 55: Figura 3.25. Cazul A. Semnalul x(t)
- Page 56 and 57: Figura 3.31. Cazul C. Semnal audio
- Page 58 and 59: Figura 3.39. Litera A din cuvântul
- Page 60 and 61: 11) Analiza spectrală a sunetelor
Figura 3.63. Vocala E porţiunea mediană. Spectrul este identic; amplitudinea este<br />
constantă; durata segmentului: 87,7 ms; frecvenţa fundamentală este de 106<br />
Hz............................................................................................................................. 47<br />
Figura 3.64. Vocala E porţiunea finală. Amplitudinea scade progresiv; durata<br />
segmentului: 66,0 ms; frecvenţa fundamentală este de 117 Hz.............................. 47<br />
Figura 3.65. Vocala I segmentul de atac. Frecvenţa medie este de 130 Hz. Durata<br />
segmentului: 51,6 ms. .............................................................................................. 47<br />
Figura 3.66. Vocala I porţiunea mediană. Frecvenţa fundamentală este de 113 Hz. Durata<br />
segmentului: 122 ms. ............................................................................................... 47<br />
Figura 3.67. Vocala I porţiunea finală. Amplitudinea scade; frecvenţa funda-mentală este<br />
de 123 Hz. Durata segmentului: 60,3 ms................................................................. 48<br />
Figura 3.68. Vocala O segmentul de atac. Amplitudinea creşte; durata segmentului: 41,1<br />
ms; frecvenţa medie este de 118 Hz. ....................................................................... 48<br />
Figura 3.69. Vocala O porţiunea mediană. Amplitudinea rămâne constantă; durata<br />
segmentului: 73,2 ms; frecvenţa fundamentală este de 108 Hz............................... 48<br />
Figura 3.70. Vocala O porţiunea finală. Amplitudinea scade progresiv; durata<br />
segmentului: 38,5 ms ; frecvenţa fundamentală creşte la 119 Hz. .......................... 48<br />
Figura 3.71. Vocala U segmentul de atac. Amplitudinea creşte; durata segmentului: 34,3<br />
ms; frecvenţa medie este de 116 Hz. ....................................................................... 49<br />
Figura 3.72. Vocala U porţiunea mediană. Amplitudinea este constantă; durata : 51,6 ms;<br />
frecvenţa fundamentală este de 99 Hz. .................................................................... 49<br />
Figura 3.73. Vocala U porţiunea finală. Amplitudinea scade progresiv pe o durată de 40,7<br />
ms; frecvenţa fundamentală se menţine aproximativ constantă (96-99 Hz)............ 49<br />
Figura 3.74. Silaba MA neaccentuată. Frecvenţa fundamentală este aproximativ<br />
constantă, egală cu 102 Hz. ..................................................................................... 50<br />
Figura 3.75. Silaba MA accentuată. Se observă ceşterea amplitudinii, frecvenţei şi<br />
duratei rostirii silabice. Frecvenţa variază de la 113 la 121 Hz............................... 50<br />
Figura 3.76. Variaţia frecvenţei vocalice dintr-o silabă accentuată ............................................. 51<br />
Figura 4.1. Segment de analiză din cadrul semnalului vocal...................................................... 54<br />
Figura 4.2. Structura spectrală a unui semnal vocal periodic [Fer97] ........................................ 56<br />
Figura 4.3. Funcţie fereastră utilizată în ponderare .................................................................... 57<br />
Figura 4.4. Schema bloc a analizorului cu banc de filtre............................................................ 60<br />
Figura 4.5. Modelul producerii vorbirii prin metoda LPC.......................................................... 62<br />
Figura 4.6. Modelul producerii vorbirii prin metoda cepstrală................................................... 63<br />
Figura 4.7. Modul de calcul al cepstrumului .............................................................................. 63<br />
Figura 4.8. Segmentarea semnalului vocal ................................................................................. 66<br />
Figura 4.9. Detectarea automată a segmentelor vorbirii ............................................................. 67<br />
Figura 4.10. Relaţia dintre analiză, segmentare şi etichetare [Chi00] ......................................... 68<br />
Figura 4.11. Rezultatele segmentării prin metoda Childers [Chi00] ........................................... 83<br />
Figura 4.12. Metoda de segmentare automată propusă de autor.................................................. 84<br />
Figura 4.13. Determinarea punctelor de zero, minim, maxim..................................................... 85<br />
Figura 4.14. Algoritmul de detecţie a regiunilor.......................................................................... 86<br />
Figura 4.15. Relaţia dintre categoriile de bază şi clasele de regiuni............................................ 87<br />
xi