15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4.7.3. Segmentarea bazată pe probabilităţi generalizate<br />

4.7.3.1. Algoritmul de bază<br />

122<br />

Cap. 4. Analiza semnalului vocal<br />

Scopul metodei utilizată de Brandt [Bra83] este de a detecta discontinuităţile din<br />

semnalul vocal. Semnalul vocal este constituit dintr-o suma de segmente omogene. Fiecare<br />

segment w este o secvenţă finită w=(yn) de eşantioane care respectă următorul model<br />

autoregresiv:<br />

(4.71)<br />

În ecuaţia (4.71 ), p este ordinul modelului, acelaşi pentru toate segmentele, en este un<br />

zgomot alb Gaussian de medie nulă cu varianţa σ 2 .<br />

Un astfel de segment w este caracterizat de un vector Θ = (a1, … , ap, σ). Fie w0 un<br />

segment având N eşantioane, Θ0 fiind vectorul corespondent. Se urmăreşte să se decidă dacă w0<br />

trebuie împărţit în două subsegmente w1 şi w2 sau nu. Segmentul iniţial se va împărţi în două<br />

dacă există un salt între vectorii Θ1 şi Θ2 corespunzători celor două subsegmente. Pentru a lua<br />

această decizie, se utilizează raţia de probabilitate generalizată ( Generalized Likelihood Ratio<br />

GLR) [Bra83] (presupunând că y1, … , yn sunt gaussiene):<br />

(4.72)<br />

unde:<br />

- r este numărul de eşantioane corespunzător subsegmentului w1,<br />

- şi sunt estimările deviaţiilor standard ale zgomotului pentru modelele caracterizate<br />

de vectorii Θ1 şi Θ2.<br />

Metoda decide dacă apare un salt între vectorii Θ1 şi Θ2 corespunzători subsegmentelor<br />

w1 şi w2 prin compararea valorii maxime a lui DN(r) cu o valoare de prag [And88].<br />

4.7.3.2. Algoritmul ce foloseşte o segmentare iniţială după secvenţa de foneme<br />

Metoda de bază, care are ca scop detectarea discontinuităţilor din semnalul vocal, se<br />

poate adapta pentru cazul în care secvenţa de foneme asociată semnalului este cunoscută. În<br />

acest caz, se obţine mai întâi o segmentare iniţială folosind metoda bazată pe modele Markov<br />

HMM. Pentru fiecare frontieră de segment, se ia un interval pe care se aplică metoda GLR, care<br />

va produce o segmentare mai precisă a regiunilor separate de acea frontieră.<br />

Astfel, presupunem că (U0, U1, … , UL) sunt frontierele segmentării iniţiale. În continuare<br />

U i 1 U<br />

i<br />

se caută o discontinuitate a semnalului între punctele Vi<br />

<br />

2<br />

U i U<br />

i1<br />

şi V i1<br />

, cu i în<br />

2<br />

intervalul (1, … , L − 1), prin determinarea punctului care maximizează raţia GLR.<br />

În acest mod se produce o redistribuţie mult mai precisă a frontierelor de segment.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!