Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
Figura 4.2. Structura spectrală a unui semnal vocal periodic [Fer97] 56 Cap. 4. Analiza semnalului vocal În cazul semnalelor sonore este importantă specificarea frecvenţei semnalului de excitaţie, ceea ce se numeşte frecvenţă fundamentală. Acest parametru este strâns legat de aspectele de inonaţie din cadrul vorbirii. Prin modificarea acestui parametru se pot exprima diferite stări subiective (exclamare, stări emoţionale, interogări). Pe de altă parte modul de intonaţie aj ută la creşterea inteligibilităţii mesajului transmis. Frecvenţa fundamentală este un parametru care pe lângă aspectele descrise mai sus variază nu numai în cadrul cuvintelor, ci şi în interiorul fonemelor (celor sonore) şi variază şi de la om la om. Valorile uzuale pe care le are acest parametru se situează în domeniul 90÷150 Hz pentru vocea de bărbaţi şi 150÷200 Hz în cazul vocii femeilor [Fer97].
57 Cap. 4. Analiza semnalului vocal 4.2. Analiza semnalului pentru determinarea parametrilor caracteristici Ţinând cont că semnalul vocal este cvasistaţionar pe segmente scurte de timp, adică îşi păstrează proprietăţile nealterate pe parcursul fiecărui interval, metodele actuale de prelucrare a semnalului vocal folosesc aşa-numita analiză pe termen scurt. Pentru a aborda această modalitate de analiză, semnalul vocal este împărţit în segmente cu lungimea de 10-30 ms, pe parcursul cărora semnalul se consideră staţionar. Extragerea informaţiei din cadrul segmentelor de timp se face folosind o funcţie fereastră, care are rolul de ponderare a parametrilor semnalului cu accentuarea valorilor corespunzătoare eşantioanelor din centrului ferestrei (segmentului considerat) şi diminuarea celor corespunzătoare marginilor ferestrei. Aceasta se face în scopul obţinerii unei estimări netezite a parametrilor, care să permită trecerea fină de la o secvenţă de parametrii la următoarea, corespunzător segmentelor de semnal considerate. În acelaşi scop se foloseşte şi intercalarea segmentelor pe axa timpului, în acest caz începutul unui segment suprapunându-se peste sfârşitul segmentului anterior. Acest tip de analiză se numeşte analiză cu fereastră glisantă [Lup04]. Funcţiile fereastră cele mai uzuale sunt: fereastra Hamming, Hanning, fereastra cosinus. Aceste funcţii au o formă gaussiană (prezentată în figura 4.3 ) pentru a asigura ponderarea valorilor centrată pe mijlocul ferestrei. y Figura 4.3. Funcţie fereastră utilizată în ponderare Mai departe, analiza semnalului vocal poate fi făcută în două moduri, ţinând cont de domeniul de analiză: în domeniul timp şi în domeniul frecvenţă. Analiza în domeniul timp presupune determinarea proprietăţilor semnalului vocal din studierea formei de undă a semnalului, privită ca variaţia valorilor eşantioanelor vocale în funcţie de timp. Analiza în domeniul frecvenţă presupune determinarea spectrului de frecvenţe a semnalului şi determinarea parametrilor doriţi pe baza formei spectrale. 4.2.1. Analiza în domeniul timp a semnalului vocal Prin analizarea directă a formei de undă a semnalului se pot extrage următorii parametrii: amplitudinea maximă şi medie, energia semnalului vocal, numărul trecerilor prin zero şi frecvenţa fundamentală. Amplitudinea semnalului ne dă informaţii despre prezenţa sau absenţa semnalului vocal, despre faptul că semnalul este sonor sau nesonor pe segmentul considerat. În cazul sonor (rostirea unor sunete vocalice) amplitudinea este mare, pe când în cazul sunetelor nesonore (zgomote, rostire de consoane) amplitudinea este redusă. x
- Page 24 and 25: 2. Modalitatea producerii vorbirii
- Page 26 and 27: Faringe nazal Vălul palatin Faring
- Page 28 and 29: 10 Cap. 2. Modalitatea producerii v
- Page 30 and 31: 12 Cap. 2. Modalitatea producerii v
- Page 32 and 33: 14 Cap. 2. Modalitatea producerii v
- Page 34 and 35: 16 Cap. 2. Modalitatea producerii v
- Page 36 and 37: 2.7.1.2. Efectele tractului vocal 1
- Page 38 and 39: 20 Cap. 3. Procesarea digitală a s
- Page 40 and 41: 22 Cap. 3. Procesarea digitală a s
- Page 42 and 43: 24 Cap. 3. Procesarea digitală a s
- Page 44 and 45: 3.2.1.1.1. Facilităţi de ordin ge
- Page 46 and 47: 28 Cap. 3. Procesarea digitală a s
- Page 48 and 49: 30 Cap. 3. Procesarea digitală a s
- Page 50 and 51: 1) Analiza spectrală a vocalelor p
- Page 52 and 53: 3) Analiza spectrală a sunetelor e
- Page 54 and 55: Figura 3.25. Cazul A. Semnalul x(t)
- Page 56 and 57: Figura 3.31. Cazul C. Semnal audio
- Page 58 and 59: Figura 3.39. Litera A din cuvântul
- Page 60 and 61: 11) Analiza spectrală a sunetelor
- Page 62 and 63: Figura 3.55. Vocala U -FM. In acest
- Page 64 and 65: 46 Cap. 3. Procesarea digitală a s
- Page 66 and 67: Vocala O : Figura 3.68. Vocala O se
- Page 68 and 69: 50 Cap. 3. Procesarea digitală a s
- Page 70 and 71: 52 Cap. 3. Procesarea digitală a s
- Page 72 and 73: 4. Analiza semnalului vocal După p
- Page 76 and 77: Amplitudinea medie pentru N eşanti
- Page 78 and 79: 4.2.2. Analiza în domeniul frecven
- Page 80 and 81: F0 Excitaţie Figura 4.5. Modelul p
- Page 82 and 83: 64 Cap. 4. Analiza semnalului vocal
- Page 84 and 85: 4.3. Segmentarea semnalului vocal 6
- Page 86 and 87: 68 Cap. 4. Analiza semnalului vocal
- Page 88 and 89: 70 Cap. 4. Analiza semnalului vocal
- Page 90 and 91: 1 BNP mean p( n) (4.23) 20 20 n1
- Page 92 and 93: 74 Cap. 4. Analiza semnalului vocal
- Page 94 and 95: 0, RN( i) T upper EN(i) 1, RN( i)
- Page 96 and 97: 78 Cap. 4. Analiza semnalului vocal
- Page 98 and 99: D(x,y) 255 m0 || H ( e x m j 256 2
- Page 100 and 101: 82 Cap. 4. Analiza semnalului vocal
- Page 102 and 103: 84 Cap. 4. Analiza semnalului vocal
- Page 104 and 105: 86 Cap. 4. Analiza semnalului vocal
- Page 106 and 107: 3. Regiune de tip vocală sonoră (
- Page 108 and 109: 90 Cap. 4. Analiza semnalului vocal
- Page 110 and 111: 92 Cap. 4. Analiza semnalului vocal
- Page 112 and 113: 4.4.2.3.1. Detectarea subregiunilor
- Page 114 and 115: 96 Cap. 4. Analiza semnalului vocal
- Page 116 and 117: 4.4.2.5. Detectarea categoriei Tran
- Page 118 and 119: Detectorul regiunii tranzitorii den
- Page 120 and 121: 102 Cap. 4. Analiza semnalului voca
- Page 122 and 123: Algoritmul de compactare în acest
57<br />
Cap. 4. Analiza semnalului vocal<br />
4.2. Analiza semnalului pentru determinarea parametrilor caracteristici<br />
Ţinând cont că semnalul vocal este cvasistaţionar pe segmente scurte de timp, adică îşi<br />
păstrează proprietăţile nealterate pe parcursul fiecărui interval, metodele actuale de prelucrare a<br />
semnalului vocal folosesc aşa-numita analiză pe termen scurt. Pentru a aborda această<br />
modalitate de analiză, semnalul vocal este împărţit în segmente cu lungimea de 10-30 ms, pe<br />
parcursul cărora semnalul se consideră staţionar.<br />
Extragerea informaţiei din cadrul segmentelor de timp se face folosind o funcţie<br />
fereastră, care are rolul de ponderare a parametrilor semnalului cu accentuarea valorilor<br />
corespunzătoare eşantioanelor din centrului ferestrei (segmentului considerat) şi diminuarea<br />
celor corespunzătoare marginilor ferestrei. Aceasta se face în scopul obţinerii unei estimări<br />
netezite a parametrilor, care să permită trecerea fină de la o secvenţă de parametrii la următoarea,<br />
corespunzător segmentelor de semnal considerate. În acelaşi scop se foloseşte şi intercalarea<br />
segmentelor pe axa timpului, în acest caz începutul unui segment suprapunându-se peste sfârşitul<br />
segmentului anterior. Acest tip de analiză se numeşte analiză cu fereastră glisantă [Lup04].<br />
Funcţiile fereastră cele mai uzuale sunt: fereastra Hamming, Hanning, fereastra cosinus.<br />
Aceste funcţii au o formă gaussiană (prezentată în figura 4.3 ) pentru a asigura ponderarea<br />
valorilor centrată pe mijlocul ferestrei.<br />
y<br />
Figura 4.3. Funcţie fereastră utilizată în ponderare<br />
Mai departe, analiza semnalului vocal poate fi făcută în două moduri, ţinând cont de<br />
domeniul de analiză: în domeniul timp şi în domeniul frecvenţă. Analiza în domeniul timp<br />
presupune determinarea proprietăţilor semnalului vocal din studierea formei de undă a<br />
semnalului, privită ca variaţia valorilor eşantioanelor vocale în funcţie de timp. Analiza în<br />
domeniul frecvenţă presupune determinarea spectrului de frecvenţe a semnalului şi determinarea<br />
parametrilor doriţi pe baza formei spectrale.<br />
4.2.1. Analiza în domeniul timp a semnalului vocal<br />
Prin analizarea directă a formei de undă a semnalului se pot extrage următorii parametrii:<br />
amplitudinea maximă şi medie, energia semnalului vocal, numărul trecerilor prin zero şi<br />
frecvenţa fundamentală.<br />
Amplitudinea semnalului ne dă informaţii despre prezenţa sau absenţa semnalului vocal,<br />
despre faptul că semnalul este sonor sau nesonor pe segmentul considerat. În cazul sonor<br />
(rostirea unor sunete vocalice) amplitudinea este mare, pe când în cazul sunetelor nesonore<br />
(zgomote, rostire de consoane) amplitudinea este redusă.<br />
x