15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

70<br />

Cap. 4. Analiza semnalului vocal<br />

- Hi este răspunsul în frecvenţă complex şi singular al filtrului IIR Hi(z) care este produs<br />

de coeficienţii LPC şi evaluat în punctele exp(jπm/256), pentru 0 ≤ m ≤ 255.<br />

Hi(z) este dat de formula:<br />

unde N =13, a0 =1.<br />

G(i) este dat de:<br />

G(<br />

i)<br />

H i ( z)<br />

<br />

1<br />

2<br />

N<br />

a0<br />

a<br />

1z<br />

a<br />

2z<br />

...<br />

a<br />

N z<br />

t<br />

<br />

ns<br />

2<br />

G ( i)<br />

r ( n)<br />

unde:<br />

- r(n) este valoarea reziduului LPC în eşantionul n,<br />

- i reprezintă indexul cadrului curent,<br />

- s este indicele primului eşantion al cadrului curent,<br />

- t este indicele ultimului eşantion al cadrului curent.<br />

(4.20)<br />

(4.19)<br />

Funcţia volum dată de ecuaţia (4.18) este des utilizată pentru detectarea caracteristicilor<br />

segmentului vocal, chiar dacă scara de frecvenţe a filtrului trece-bandă variază în funcţie de<br />

detectorul specific. Se mai foloseşte calculul unui raport a două funcţii volum, care compară<br />

energia dintr-o bandă de frecvenţă cu energia din cea de-a doua bandă de frecvenţă.<br />

În cazul majorităţii detectorilor de caracteristici, se utilizează filtrarea mediană pentru a<br />

netezi fluctuaţiile din funcţia volum.<br />

Fluctuaţiile sunt cauzate de o varietate de surse incluzând determinarea incorectă a GCI,<br />

clasificarea S/U/V incorectă, sau artefactele cum ar fi zgomotul de fond. De obicei aceşti<br />

detectori de caracteristici utilizează o filtrare mediană de ordinul 5, ordinul putând varia de la caz<br />

la caz.<br />

Detectorul S/U/V utilizează o singură funcţie volum din ecuaţia (4.18) cu valorile A=17,<br />

B=255. Limita inferioară A=17 corespunde cu frecvenţa de tăiere de 312 Hz a unui filtru trecesus<br />

aplicat răspunsului în frecvenţă. Filtrul trece-sus este necesar pentru a reduce artefactele de<br />

frecvenţă joasă cauzate de o amplasare incorectă a microfonului în timpul înregistrării. Funcţia<br />

volum este utilizată de detectorul S/U/V ca şi un integrator cu o bandă relativ largă care<br />

calculează energia semnalului în fiecare cadru.<br />

4.3.2.3. Valorile pragurilor şi scorurile de caracteristici<br />

Fiecare algoritm de detectare a caracteristicilor calculează un scor pentru a indica<br />

prezenţa caracteristicii acustice respective în cadrul de semnal corespunzător. Acest scor se<br />

calculează pe o scară între [0,1], existând însă şi excepţii (unele estimări ale caracteristicilor sunt<br />

discrete, binare ori ternare). În general, estimarea caracteristicii se calculează prin compararea<br />

valorii funcţiei volum (sau a unui raport de două funcţii volum) cu una sau mai multe valori de<br />

prag.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!