Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică

users.utcluj.ro
from users.utcluj.ro More from this publisher
15.06.2013 Views

Figura 3.39. Litera A din cuvântul “mama” rostit în condiţii normale. Se observă doi formanţi principali şi alţi câţiva secundari. ..............................................................40 Figura 3.40. Litera A din cuvântul “mama” rostit în condiţiile obstrucţionării căilor nazale. Se observă dispariţia formanţilor de ordin superior precum şi deplasarea în tonalitate a primului formant..............................................................40 Figura 3.41. Litera M din cuvântul “maşină” rostit de către autor (vocea A). Se observă doi formanţi principali..............................................................................................40 Figura 3.42. Litera M din cuvântul “maşină” rostit de vocea B. Spectrul este asemănător cu cel de la vocea A, diferenţele constând doar din raportul amplitudinilor celor doi formanţi. ....................................................................................................40 Figura 3.43. Litera A din cuvântul “maşină” rostit de către autor (vocea A). Spectrul acestei rostiri vocalice conţine trei formanţi bine conturaţi. ....................................41 Figura 3.44. Litera A din cuvântul “maşină” rostit de vocea B. Se observă diferenţa faţă de cazul anterior (vocea A), prin faptul că acum spectrul conţine o serie largă de armonici, cu primele cinci armonici bine conturate. ................................................41 Figura 3.45. Litera S din cuvântul “maşină” rostit de către autor (vocea A). Se observă că spectrul, în cazul acestei consoane, conţine o paletă largă de armonici, situate îndeosebi la frecvenţe superioare. ............................................................................41 Figura 3.46. Litera S din cuvântul “maşină” rostit de vocea B. Diferenţa este că armonicile superioare sunt mult mai bine conturate decât în cazul anterior corespondent........41 Figura 3.47. Vocala A - Formele de undă (sus: FM; jos: MW) ...................................................42 Figura 3.48. Vocala A – Spectrele armonice(sus: A –FM; jos: A –MW) ....................................42 Figura 3.49. Vocala E -FM. Sunt vizibili 3 formanţi principali. ..................................................43 Figura 3.50. Vocala E - MW. Formantul 3 s-a redus cu 5%. .......................................................43 Figura 3.51. Vocala I -FM. În acest caz vocala are doi formanţi. ................................................43 Figura 3.52. Vocala I - MW. Formanţii se păstrează; apare zgomotul de fond............................43 Figura 3.53. Vocala O -FM. In acest caz vocala are trei formanţi. ..............................................43 Figura 3.54. Vocala O - MW. Formantul 3 creşte cu aproximativ 3%.........................................43 Figura 3.55. Vocala U -FM. În acest caz vocala are doi formanţi majori. ...................................44 Figura 3.56. Vocala U - MW. Formantul 2 a scăzut cu aproximativ 12%. ..................................44 Figura 3.57. Vocala /A/ îmbogăţită cu armonici înalte ................................................................44 Figura 3.58. Cele trei segmente definitorii pentru rostirea unei vocale........................................45 Figura 3.59. Vocala A segmentul de atac. Amplitudinea creşte progresiv; durata segmentului: 42,2 ms; frecvenţa medie este de 120 Hz. ..........................................46 Figura 3.60. Vocala A porţiunea mediană. Se observă un spectru de mai multe armonici; amplitudinea este constantă; durata segmentului: 89,6 ms; frecvenţa fundamentală este de 109 Hz....................................................................................46 Figura 3.61. Vocala A porţiunea finală. Amplitudinea scade progresiv; durata segmentului: 37,5 ms; frecvenţa fundamentală este de 124 Hz. .............................46 Figura 3.62. Vocala E segmentul de atac. Amplitudinea creşte; durata segmentului: 45,4 ms; frecvenţa medie este de 112 Hz. ........................................................................47 x

Figura 3.63. Vocala E porţiunea mediană. Spectrul este identic; amplitudinea este constantă; durata segmentului: 87,7 ms; frecvenţa fundamentală este de 106 Hz............................................................................................................................. 47 Figura 3.64. Vocala E porţiunea finală. Amplitudinea scade progresiv; durata segmentului: 66,0 ms; frecvenţa fundamentală este de 117 Hz.............................. 47 Figura 3.65. Vocala I segmentul de atac. Frecvenţa medie este de 130 Hz. Durata segmentului: 51,6 ms. .............................................................................................. 47 Figura 3.66. Vocala I porţiunea mediană. Frecvenţa fundamentală este de 113 Hz. Durata segmentului: 122 ms. ............................................................................................... 47 Figura 3.67. Vocala I porţiunea finală. Amplitudinea scade; frecvenţa funda-mentală este de 123 Hz. Durata segmentului: 60,3 ms................................................................. 48 Figura 3.68. Vocala O segmentul de atac. Amplitudinea creşte; durata segmentului: 41,1 ms; frecvenţa medie este de 118 Hz. ....................................................................... 48 Figura 3.69. Vocala O porţiunea mediană. Amplitudinea rămâne constantă; durata segmentului: 73,2 ms; frecvenţa fundamentală este de 108 Hz............................... 48 Figura 3.70. Vocala O porţiunea finală. Amplitudinea scade progresiv; durata segmentului: 38,5 ms ; frecvenţa fundamentală creşte la 119 Hz. .......................... 48 Figura 3.71. Vocala U segmentul de atac. Amplitudinea creşte; durata segmentului: 34,3 ms; frecvenţa medie este de 116 Hz. ....................................................................... 49 Figura 3.72. Vocala U porţiunea mediană. Amplitudinea este constantă; durata : 51,6 ms; frecvenţa fundamentală este de 99 Hz. .................................................................... 49 Figura 3.73. Vocala U porţiunea finală. Amplitudinea scade progresiv pe o durată de 40,7 ms; frecvenţa fundamentală se menţine aproximativ constantă (96-99 Hz)............ 49 Figura 3.74. Silaba MA neaccentuată. Frecvenţa fundamentală este aproximativ constantă, egală cu 102 Hz. ..................................................................................... 50 Figura 3.75. Silaba MA accentuată. Se observă ceşterea amplitudinii, frecvenţei şi duratei rostirii silabice. Frecvenţa variază de la 113 la 121 Hz............................... 50 Figura 3.76. Variaţia frecvenţei vocalice dintr-o silabă accentuată ............................................. 51 Figura 4.1. Segment de analiză din cadrul semnalului vocal...................................................... 54 Figura 4.2. Structura spectrală a unui semnal vocal periodic [Fer97] ........................................ 56 Figura 4.3. Funcţie fereastră utilizată în ponderare .................................................................... 57 Figura 4.4. Schema bloc a analizorului cu banc de filtre............................................................ 60 Figura 4.5. Modelul producerii vorbirii prin metoda LPC.......................................................... 62 Figura 4.6. Modelul producerii vorbirii prin metoda cepstrală................................................... 63 Figura 4.7. Modul de calcul al cepstrumului .............................................................................. 63 Figura 4.8. Segmentarea semnalului vocal ................................................................................. 66 Figura 4.9. Detectarea automată a segmentelor vorbirii ............................................................. 67 Figura 4.10. Relaţia dintre analiză, segmentare şi etichetare [Chi00] ......................................... 68 Figura 4.11. Rezultatele segmentării prin metoda Childers [Chi00] ........................................... 83 Figura 4.12. Metoda de segmentare automată propusă de autor.................................................. 84 Figura 4.13. Determinarea punctelor de zero, minim, maxim..................................................... 85 Figura 4.14. Algoritmul de detecţie a regiunilor.......................................................................... 86 Figura 4.15. Relaţia dintre categoriile de bază şi clasele de regiuni............................................ 87 xi

Figura 3.63. Vocala E porţiunea mediană. Spectrul este identic; amplitudinea este<br />

constantă; durata segmentului: 87,7 ms; frecvenţa fundamentală este de 106<br />

Hz............................................................................................................................. 47<br />

Figura 3.64. Vocala E porţiunea finală. Amplitudinea scade progresiv; durata<br />

segmentului: 66,0 ms; frecvenţa fundamentală este de 117 Hz.............................. 47<br />

Figura 3.65. Vocala I segmentul de atac. Frecvenţa medie este de 130 Hz. Durata<br />

segmentului: 51,6 ms. .............................................................................................. 47<br />

Figura 3.66. Vocala I porţiunea mediană. Frecvenţa fundamentală este de 113 Hz. Durata<br />

segmentului: 122 ms. ............................................................................................... 47<br />

Figura 3.67. Vocala I porţiunea finală. Amplitudinea scade; frecvenţa funda-mentală este<br />

de 123 Hz. Durata segmentului: 60,3 ms................................................................. 48<br />

Figura 3.68. Vocala O segmentul de atac. Amplitudinea creşte; durata segmentului: 41,1<br />

ms; frecvenţa medie este de 118 Hz. ....................................................................... 48<br />

Figura 3.69. Vocala O porţiunea mediană. Amplitudinea rămâne constantă; durata<br />

segmentului: 73,2 ms; frecvenţa fundamentală este de 108 Hz............................... 48<br />

Figura 3.70. Vocala O porţiunea finală. Amplitudinea scade progresiv; durata<br />

segmentului: 38,5 ms ; frecvenţa fundamentală creşte la 119 Hz. .......................... 48<br />

Figura 3.71. Vocala U segmentul de atac. Amplitudinea creşte; durata segmentului: 34,3<br />

ms; frecvenţa medie este de 116 Hz. ....................................................................... 49<br />

Figura 3.72. Vocala U porţiunea mediană. Amplitudinea este constantă; durata : 51,6 ms;<br />

frecvenţa fundamentală este de 99 Hz. .................................................................... 49<br />

Figura 3.73. Vocala U porţiunea finală. Amplitudinea scade progresiv pe o durată de 40,7<br />

ms; frecvenţa fundamentală se menţine aproximativ constantă (96-99 Hz)............ 49<br />

Figura 3.74. Silaba MA neaccentuată. Frecvenţa fundamentală este aproximativ<br />

constantă, egală cu 102 Hz. ..................................................................................... 50<br />

Figura 3.75. Silaba MA accentuată. Se observă ceşterea amplitudinii, frecvenţei şi<br />

duratei rostirii silabice. Frecvenţa variază de la 113 la 121 Hz............................... 50<br />

Figura 3.76. Variaţia frecvenţei vocalice dintr-o silabă accentuată ............................................. 51<br />

Figura 4.1. Segment de analiză din cadrul semnalului vocal...................................................... 54<br />

Figura 4.2. Structura spectrală a unui semnal vocal periodic [Fer97] ........................................ 56<br />

Figura 4.3. Funcţie fereastră utilizată în ponderare .................................................................... 57<br />

Figura 4.4. Schema bloc a analizorului cu banc de filtre............................................................ 60<br />

Figura 4.5. Modelul producerii vorbirii prin metoda LPC.......................................................... 62<br />

Figura 4.6. Modelul producerii vorbirii prin metoda cepstrală................................................... 63<br />

Figura 4.7. Modul de calcul al cepstrumului .............................................................................. 63<br />

Figura 4.8. Segmentarea semnalului vocal ................................................................................. 66<br />

Figura 4.9. Detectarea automată a segmentelor vorbirii ............................................................. 67<br />

Figura 4.10. Relaţia dintre analiză, segmentare şi etichetare [Chi00] ......................................... 68<br />

Figura 4.11. Rezultatele segmentării prin metoda Childers [Chi00] ........................................... 83<br />

Figura 4.12. Metoda de segmentare automată propusă de autor.................................................. 84<br />

Figura 4.13. Determinarea punctelor de zero, minim, maxim..................................................... 85<br />

Figura 4.14. Algoritmul de detecţie a regiunilor.......................................................................... 86<br />

Figura 4.15. Relaţia dintre categoriile de bază şi clasele de regiuni............................................ 87<br />

xi

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!