Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică

users.utcluj.ro
from users.utcluj.ro More from this publisher
15.06.2013 Views

2) Compararea vectorilor din regiunea ţintă cu modelul 148 Cap. 4. Analiza semnalului vocal Această fază presupune detectarea cadrelor din regiunea ţintă de lungime egală cu lungimea cadrelor aleasă pentru modelare, calculul coeficienţilor Fourier de aceeaşi manieră ca şi în faza precedentă, construirea vectorilor de caracteristici, şi compararea vectorilor cu modelele din fişierul model. Compararea se face pe baza distanţei minime pătratice E(a,b) expusă în paragraful 4..8.4.1. Compararea vectorilor din regiunea ţintă cu modelul este ilustrată în figura 4.66. C este cadrul curent, F(C) este vectorul coeficienţilor Fourier asociat cadrului C, MF este modelul asociat fonemei F. F(C) Model Figura 4.66. Compararea vectorilor din regiunea ţintă cu modelul În urma fazei de comparare a vectorilor din regiunea ţintă cu modelele din fişierul model rezultă câte un set de modele corespondente pentru fiecare cadru C: C M M M SM ,..., , (4.93) f 1, f 2 unde Mfi sunt instanţe ale modelelor fonematice, având: fi C F1 F2 F3 F4 … Fn-1 Fn MA ME MI MO MU ML f fn E( M , F( C)) P , i 1.. n , (4.94) unde Pf este un prag fixat, iar F(C) este vectorul de caracteristici al cadrului C.

3) Regăsirea modelului fonematic şi etichetarea regiunilor 149 Cap. 4. Analiza semnalului vocal Această fază presupune găsirea modelului fonematic cel mai probabil de asociat cu cadrul curent din regiunea ţintă. Etichetarea cu foneme poate fi făcută pentru fiecare cadru independent sau în corelaţie cu cadrele învecinate. minimă : În primul caz modelul asociat MC este cel pentru care distanţa pătratică E(MC,F(C)) este E( M C , F( C)) min E( M fi , F( C)) , (4.95) unde M fi SM C . i1 .. n În al doilea caz, în care etichetarea se face în corelaţie cu cadrele învecinate, dacă aceste cadre vecine fac parte dintr-un şir etichetat cu o aceeaşi fonemă fk, şi dacă Mfk face parte din setul SMC, atunci Mfk se va asocia cu cadrul C chiar dacă nu respectă condiţia (4.95). 4) Gruparea fonemelor şi determinarea subregiunilor În această ultimă fază subregiunile sunt determinate prin găsirea şi extinderea secvenţelor de cadre vecine etichetate cu aceeaşi fonemă. Dacă o secvenţă {Fi} este întreruptă de o fonemă singulară diferită Fp, secvenţa va fi extinsă şi peste cadrul respectiv: Fi Fi … Fi Fp Fi -> Fi Fi … Fi Fi Fi Figura 4.67. Extinderea secvenţelor fonematice În finalul procesului de extindere a secvenţelor fonematice, Ure se marchează graniţele de subregiuni ca fiind graniţele secvenţelor fonematice. În concluzie, metoda de segmentare în subregiuni fonematice bazată pe modelarea caracteristicilor spectrale are o mare aplicabilitate practică. Dacă se foloseşte în corelaţie cu metoda de segmentare fonematică prezentată în secţiunea 4.8, atunci cunoscându-se secvenţa fonematică asociată cu fiecare regiune, se va putea determina corespondenţa exactă dintre fiecare fonemă şi cadrele din acea regiune. 1 2 k-1 k k+1 1 2 k-1 k k+1 Pe de altă parte metoda de segmentare în subregiuni bazată pe model poate fi folosită şi în recunoaşterea vorbirii. În acest caz vor trebui luate în consideraţie toate combinaţiile de foneme care rezultă din setul SMC ( 4.93), iar combinaţia exactă va trebui determinată prin utilizarea unei predicţii lingvistice bazată pe vocabular. che a me die

3) Regăsirea modelului fonematic şi etichetarea regiunilor<br />

149<br />

Cap. 4. Analiza semnalului vocal<br />

Această fază presupune găsirea modelului fonematic cel mai probabil de asociat cu cadrul<br />

curent din regiunea ţintă. Etichetarea cu foneme poate fi făcută pentru fiecare cadru independent<br />

sau în corelaţie cu cadrele învecinate.<br />

minimă :<br />

În primul caz modelul asociat MC este cel pentru care distanţa pătratică E(MC,F(C)) este<br />

E( M C , F(<br />

C))<br />

min E(<br />

M fi , F(<br />

C))<br />

, (4.95)<br />

unde M fi SM C .<br />

i1<br />

.. n<br />

În al doilea caz, în care etichetarea se face în corelaţie cu cadrele învecinate, dacă aceste<br />

cadre vecine fac parte dintr-un şir etichetat cu o aceeaşi fonemă fk, şi dacă Mfk face parte din setul<br />

SMC, atunci Mfk se va asocia cu cadrul C chiar dacă nu respectă condiţia (4.95).<br />

4) Gruparea fonemelor şi determinarea subregiunilor<br />

În această ultimă fază subregiunile sunt determinate prin găsirea şi extinderea secvenţelor<br />

de cadre vecine etichetate cu aceeaşi fonemă. Dacă o secvenţă {Fi} este întreruptă de o fonemă<br />

singulară diferită Fp, secvenţa va fi extinsă şi peste cadrul respectiv:<br />

Fi Fi … Fi Fp Fi -> Fi Fi … Fi Fi Fi<br />

Figura 4.67. Extinderea secvenţelor fonematice<br />

În finalul procesului de extindere a secvenţelor fonematice, Ure se marchează graniţele de<br />

subregiuni ca fiind graniţele secvenţelor fonematice.<br />

În concluzie, metoda de segmentare în subregiuni fonematice bazată pe modelarea<br />

caracteristicilor spectrale are o mare aplicabilitate practică. Dacă se foloseşte în corelaţie cu<br />

metoda de segmentare fonematică prezentată în secţiunea 4.8, atunci cunoscându-se secvenţa<br />

fonematică asociată cu fiecare regiune, se va putea determina corespondenţa exactă dintre fiecare<br />

fonemă şi cadrele din acea regiune.<br />

1 2 k-1 k k+1 1 2 k-1 k k+1<br />

Pe de altă parte metoda de segmentare în subregiuni bazată pe model poate fi folosită şi<br />

în recunoaşterea vorbirii. În acest caz vor trebui luate în consideraţie toate combinaţiile de<br />

foneme care rezultă din setul SMC ( 4.93), iar combinaţia exactă va trebui determinată prin<br />

utilizarea unei predicţii lingvistice bazată pe vocabular.<br />

che<br />

a<br />

me<br />

die

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!