Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică

users.utcluj.ro
from users.utcluj.ro More from this publisher
15.06.2013 Views

Figura 4.2. Structura spectrală a unui semnal vocal periodic [Fer97] 56 Cap. 4. Analiza semnalului vocal În cazul semnalelor sonore este importantă specificarea frecvenţei semnalului de excitaţie, ceea ce se numeşte frecvenţă fundamentală. Acest parametru este strâns legat de aspectele de inonaţie din cadrul vorbirii. Prin modificarea acestui parametru se pot exprima diferite stări subiective (exclamare, stări emoţionale, interogări). Pe de altă parte modul de intonaţie aj ută la creşterea inteligibilităţii mesajului transmis. Frecvenţa fundamentală este un parametru care pe lângă aspectele descrise mai sus variază nu numai în cadrul cuvintelor, ci şi în interiorul fonemelor (celor sonore) şi variază şi de la om la om. Valorile uzuale pe care le are acest parametru se situează în domeniul 90÷150 Hz pentru vocea de bărbaţi şi 150÷200 Hz în cazul vocii femeilor [Fer97].

57 Cap. 4. Analiza semnalului vocal 4.2. Analiza semnalului pentru determinarea parametrilor caracteristici Ţinând cont că semnalul vocal este cvasistaţionar pe segmente scurte de timp, adică îşi păstrează proprietăţile nealterate pe parcursul fiecărui interval, metodele actuale de prelucrare a semnalului vocal folosesc aşa-numita analiză pe termen scurt. Pentru a aborda această modalitate de analiză, semnalul vocal este împărţit în segmente cu lungimea de 10-30 ms, pe parcursul cărora semnalul se consideră staţionar. Extragerea informaţiei din cadrul segmentelor de timp se face folosind o funcţie fereastră, care are rolul de ponderare a parametrilor semnalului cu accentuarea valorilor corespunzătoare eşantioanelor din centrului ferestrei (segmentului considerat) şi diminuarea celor corespunzătoare marginilor ferestrei. Aceasta se face în scopul obţinerii unei estimări netezite a parametrilor, care să permită trecerea fină de la o secvenţă de parametrii la următoarea, corespunzător segmentelor de semnal considerate. În acelaşi scop se foloseşte şi intercalarea segmentelor pe axa timpului, în acest caz începutul unui segment suprapunându-se peste sfârşitul segmentului anterior. Acest tip de analiză se numeşte analiză cu fereastră glisantă [Lup04]. Funcţiile fereastră cele mai uzuale sunt: fereastra Hamming, Hanning, fereastra cosinus. Aceste funcţii au o formă gaussiană (prezentată în figura 4.3 ) pentru a asigura ponderarea valorilor centrată pe mijlocul ferestrei. y Figura 4.3. Funcţie fereastră utilizată în ponderare Mai departe, analiza semnalului vocal poate fi făcută în două moduri, ţinând cont de domeniul de analiză: în domeniul timp şi în domeniul frecvenţă. Analiza în domeniul timp presupune determinarea proprietăţilor semnalului vocal din studierea formei de undă a semnalului, privită ca variaţia valorilor eşantioanelor vocale în funcţie de timp. Analiza în domeniul frecvenţă presupune determinarea spectrului de frecvenţe a semnalului şi determinarea parametrilor doriţi pe baza formei spectrale. 4.2.1. Analiza în domeniul timp a semnalului vocal Prin analizarea directă a formei de undă a semnalului se pot extrage următorii parametrii: amplitudinea maximă şi medie, energia semnalului vocal, numărul trecerilor prin zero şi frecvenţa fundamentală. Amplitudinea semnalului ne dă informaţii despre prezenţa sau absenţa semnalului vocal, despre faptul că semnalul este sonor sau nesonor pe segmentul considerat. În cazul sonor (rostirea unor sunete vocalice) amplitudinea este mare, pe când în cazul sunetelor nesonore (zgomote, rostire de consoane) amplitudinea este redusă. x

57<br />

Cap. 4. Analiza semnalului vocal<br />

4.2. Analiza semnalului pentru determinarea parametrilor caracteristici<br />

Ţinând cont că semnalul vocal este cvasistaţionar pe segmente scurte de timp, adică îşi<br />

păstrează proprietăţile nealterate pe parcursul fiecărui interval, metodele actuale de prelucrare a<br />

semnalului vocal folosesc aşa-numita analiză pe termen scurt. Pentru a aborda această<br />

modalitate de analiză, semnalul vocal este împărţit în segmente cu lungimea de 10-30 ms, pe<br />

parcursul cărora semnalul se consideră staţionar.<br />

Extragerea informaţiei din cadrul segmentelor de timp se face folosind o funcţie<br />

fereastră, care are rolul de ponderare a parametrilor semnalului cu accentuarea valorilor<br />

corespunzătoare eşantioanelor din centrului ferestrei (segmentului considerat) şi diminuarea<br />

celor corespunzătoare marginilor ferestrei. Aceasta se face în scopul obţinerii unei estimări<br />

netezite a parametrilor, care să permită trecerea fină de la o secvenţă de parametrii la următoarea,<br />

corespunzător segmentelor de semnal considerate. În acelaşi scop se foloseşte şi intercalarea<br />

segmentelor pe axa timpului, în acest caz începutul unui segment suprapunându-se peste sfârşitul<br />

segmentului anterior. Acest tip de analiză se numeşte analiză cu fereastră glisantă [Lup04].<br />

Funcţiile fereastră cele mai uzuale sunt: fereastra Hamming, Hanning, fereastra cosinus.<br />

Aceste funcţii au o formă gaussiană (prezentată în figura 4.3 ) pentru a asigura ponderarea<br />

valorilor centrată pe mijlocul ferestrei.<br />

y<br />

Figura 4.3. Funcţie fereastră utilizată în ponderare<br />

Mai departe, analiza semnalului vocal poate fi făcută în două moduri, ţinând cont de<br />

domeniul de analiză: în domeniul timp şi în domeniul frecvenţă. Analiza în domeniul timp<br />

presupune determinarea proprietăţilor semnalului vocal din studierea formei de undă a<br />

semnalului, privită ca variaţia valorilor eşantioanelor vocale în funcţie de timp. Analiza în<br />

domeniul frecvenţă presupune determinarea spectrului de frecvenţe a semnalului şi determinarea<br />

parametrilor doriţi pe baza formei spectrale.<br />

4.2.1. Analiza în domeniul timp a semnalului vocal<br />

Prin analizarea directă a formei de undă a semnalului se pot extrage următorii parametrii:<br />

amplitudinea maximă şi medie, energia semnalului vocal, numărul trecerilor prin zero şi<br />

frecvenţa fundamentală.<br />

Amplitudinea semnalului ne dă informaţii despre prezenţa sau absenţa semnalului vocal,<br />

despre faptul că semnalul este sonor sau nesonor pe segmentul considerat. În cazul sonor<br />

(rostirea unor sunete vocalice) amplitudinea este mare, pe când în cazul sunetelor nesonore<br />

(zgomote, rostire de consoane) amplitudinea este redusă.<br />

x

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!