15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

84<br />

Cap. 4. Analiza semnalului vocal<br />

4.4. Contribuţii aduse în procesul segmentării automate a semnalului<br />

vocal<br />

Aşa cum s-a precizat în paragraful anterior, găsirea unei metode optime de segmentare a<br />

semnalului vocal reprezintă o operaţie absolut necesară în procesul de construire a bazei de date<br />

vocale. În acest paragraf este prezentată metoda proiectată de autor, care este capabilă să<br />

detecteze automat componentele S/U/V ale semnalului ( Silence – linişte, Unvoiced – nesonor,<br />

Voiced – sonor), să împartă aceste componente în regiuni şi subregiuni cu anumite proprietăţi, iar<br />

apoi să pună în corespondenţă aceste regiuni cu o secvenţă cunoscută de foneme (figura 4.12):<br />

Semnal vocal<br />

Segmentare S/U/V<br />

Detecţie regiuni<br />

Compactare<br />

Segmentare fonematică<br />

Subregiuni<br />

Figura 4.12. Metoda de segmentare automată propusă de autor<br />

Algoritmul propus utilizează analiza în domeniul timp a semnalului vocal. După o filtrare<br />

trece-jos a semnalului, se detectează mai întâi punctele de trecere prin zero Zi din forma de undă.<br />

Apoi se calculează punctele de valoare minimă mi şi maximă Mi dintre două puncte de zero.<br />

Separarea linişte/vorbire se realizează utilizând o valoare de prag Ts aplicată asupra<br />

amplitudinii semnalului vocal. În segmentele de linişte (silence), toate punctele mi şi Mi trebuie<br />

să fie mai mici decât Ts .<br />

Pentru fiecare segment din semnalul vocal se calculează apoi distanţa dintre două puncte<br />

de zero adiacente Di . Se ia decizia de segment sonor (voiced) dacă această distanţă este mai mare<br />

decât o valoare de prag V.<br />

Un segment este considerat nesonor (unvoiced) dacă distanţa Di dintre punctele de zero<br />

adiacente este mai mică decât un prag U.<br />

Se definesc de asemeni segmente tranzitorii, acestea fiind segmentele pentru care<br />

condiţiile de mai sus nu sunt îndeplinite.<br />

În urma operaţiei de segmentare S/U/V (detectarea segmentelor de tip silence/ unvoiced<br />

/voiced), va avea loc o împărţire a semnalului vocal în clase de regiuni distincte, în scopul<br />

determinării proprietăţilor semnalului pe regiuni şi punerii în corespondenţă cu setul de foneme<br />

prezent la intrare.<br />

După o primă aplicare a algoritmului de mai sus, va fi generat un număr mare de regiuni.<br />

În timp ce regiunile sonore sunt determinate corect de la început, regiunile nesonore sunt

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!