15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

106<br />

Cap. 4. Analiza semnalului vocal<br />

4.4.5. Concluzii privitoare la segmentarea semnalului vocal în clase de<br />

regiuni<br />

Aşa cum am văzut, segmentarea în clase de regiuni este o etapă a analizei semnalului<br />

vocal utilizată atât în sinteza, cât şi în recunoaşterea vorbirii. Pentru sinteza bazată pe corpus în<br />

general, şi pentru sinteza bazată pe concatenarea unităţilor, este de mare importanţă segmentarea<br />

şi adnotarea corpusului vorbit, respectiv crearea unei baze de date cu unităţi acustice, într-un<br />

mod cât mai eficient. Segmentarea automată a semnalului vocal în clase de regiuni împlineşte<br />

aceste necesităţi, alături de segmentarea fonematică - ce va fi prezentată în capitolul următor.<br />

Algoritmul propus de autor realizează segmentarea automată a semnalului vocal în 10<br />

clase de regiuni. Abordarea este în domeniul timp al analizei, deşi detectarea unor clase<br />

particulare a necesitat şi calcule în domeniul frecvenţelor. Algoritmul împarte mai întâi semnalul<br />

vocal în 4 categorii de bază : linişte, sonoră, nesonoră, respectiv tranziţie, apoi realizează<br />

clasificarea în cele 10 clase distincte de regiuni: linişte, consoană nesonoră, vocală sonoră,<br />

linişte-nesonoră, de tip salt, neregulată, tranzitorie, tranzitorie densă, discontinuă de tip R şi<br />

discontinuă de tip G.<br />

Avantajul algoritmului faţă de alte abordări este rapiditatea derivată din efectuarea<br />

calculelor în domeniul timp şi detectarea categoriilor de bază dintr-o singură parcurgere a<br />

eşantioanelor de semnal. De asemeni, diferitele tipuri de regiuni sunt detectate în principal pe<br />

baza parametrilor obţinuţi în prima fază a algoritmului.<br />

În această etapă s-au proiectat:<br />

- un algoritm de determinare a punctelor de zero, minim şi maxim din semnalul vocal în<br />

domeniul timp;<br />

- o metodă de detecţie a segmentelor S/U/V (Silence/Voiced /Unvoiced) şi clasificare în<br />

tipuri de regiuni a semnalului vocal, metodă ce cuprinde :<br />

- 4 detectori pentru categoriile de bază (linişte, sonoră, nesonoră, tranziţie) ;<br />

- 8 clasificatori pentru clasele de regiuni propriu-zise (linişte, consoană nesonoră, vocală<br />

sonoră, linişte-nesonoră, de tip salt, neregulată, tranzitorie, tranzitorie densă);<br />

de tip G);<br />

- 2 detectori pentru determinarea subregiunilor (discontinuitate de tip R şi discontinuitate<br />

- un algoritm de compactare a regiunilor pentru gruparea regiunilor similare şi reducerea<br />

numărului de regiuni.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!