Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
240 Cap. 6. Metode de sinteză de voce Avantajele metodei de sinteză a vorbirii pe bază de silabe dezvoltată de autor Metoda de sinteză bazată pe concatenarea silabelor prezentată în acest capitol are următoarele avantaje: a) Prezintă o abordare unitară în toate fazele de proiectare, fiind bazată pe reguli în cele mai importante etape ale sale. b) Foloseşte reguli organizate într-o gramatică de tip LEX, rezultând astfel separarea modulului de analiză lingvistică faţă de fluxul de prelucrare a datelor. c) Asigură o capacitate mărită de extensibilitate şi adaptabilitate datorită faptului că regulile sunt accesibile şi se pot edita de către utilizator. d) Asigură reducerea semnificativă a costului şi timpului alocat procesului de proiectare, datorită utilizării regulilor (cel mult de ordinul sutelor), faţă de metodele ce utilizează dicţionare sau lexicoane (conţinând definiţii de ordinul zecilor sau sutelor de mii). e) Prezintă un grad mai mare de versatilitate, datorită utilizării gramaticilor regulate specifice LEX, faţă de alte metode ce folosesc reprezentări interne ale regulilor sau chiar formatul XML. Utilizarea seturilor bazate pe expresii regulate permite specificarea de tipare pentru unităţile lingvistice şi contextele în care ele apar, rezultând astfel şi un grad mai mare de corectitudine în analiza finală a textului. f) Necesită un efort mai mic de construire şi întreţinere a bazei de date vocale decât în cazul metodei bazate pe corpus. Astfel, în cazul metodei bazate pe silabe, numărul unităţilor acustice este cu cel puţin două ordine de mărime mai mic decât în cazul metodei bazate pe corpus. g) Păstrează eficienţa şi calitatea metodelor de sinteză prin concatenare, în raport cu metodele parametrice de sinteză. Astfel, în cazul concatenării, semnalul sintetizat păstrează calitatea unităţilor înregistrate în baza de date vocală, pe când în cazul metodele parametrice, semnalul de ieşire este aproximat. h) Prezintă o calitate mai înaltă a sintezei faţă de metodele bazate pe foneme sau difoneme, din cauza unui număr mai redus de puncte de concatenare, la nivelul silabei. Aplicaţii şi dezvoltări de viitor Pentru mărirea performanţelor metodei de sinteză prezentate, se au în vedere următoarele dezvoltări de viitor: - mărirea gradului de completitudine a seturilor de reguli pentru silabisire şi accentuare, prin adăugarea de noi reguli; - îmbunătăţirea ratei de detectare corectă a accentuării prin folosirea unui dicţionar morfologic al limbii române. Astfel, gradul de completitudine al unor reguli stabilite pentru cuvinte cu aceeaşi terminaţie poate fi mărit prin preluarea cuvintelor din dicţionar. Aceasta va duce la creşterea ratei de detecţie corectă a analizorului, chiar fără a introduce noi reguli de accentuare; - în faza de analiză a sintaxei, determinarea părţilor de propoziţie (subiect, predicat) pe baza părţilor de vorbire detectate deja (substantiv, verb, etc.) va duce la determinarea semanticii frazei, cu aplicaţii importante în dialogul om-calculator;
241 Cap. 6. Metode de sinteză de voce - analiza contextului în care apar părţile de vorbire detectate prin analizorul de sintaxă proiectat, precum şi stabilirea modului corect de flexionare, sunt aspecte importante care se vor putea aplica la construirea unor traducătoare automate de limbaj de înaltă fidelitate. - mărirea numărului de unităţi stocate în baza de date vocală, de la 600 în prezent la 2- 3000, în conformitate cu statistica prezentată a silabelor din limba română, fapt ce va avea ca rezultat îmbunătăţirea semnificativă a calităţii semnalului sintetizat; - luarea în considerare a implementării prozodiei suprasegmentale, de tipul intonaţiei, prin intermediul tehnicii TD_PSOLA, crescându-se astfel naturaleţea vorbirii sintetizate. Aici, metoda proiectată de autor de detectare automată a perioadelor fundamentale din semnal (metodă prezentată în secţiunea 4.6) va fi foarte utilă în momentul aplicării PSOLA. Contribuţiile autorului Contribuţiile autorului prezentate în capitolul curent au fost următoarele: - dezvoltarea unei metode complete de sinteză de vorbire pornind de la text pentru limba română, metodă bazată pe concatenarea de silabe; - dezvoltarea unei metode bazată pe reguli pentru preprocesarea textului; - dezvoltarea unei metode bazată pe reguli pentru analiza sintaxei unui text în limba română şi a unui set de reguli pentru flexionarea cuvintelor din limba română; - realizarea unui analizor sintactic pentru extragerea propoziţiilor şi a cuvintelor ; - realizarea unui analizor lexical şi a unui set de reguli pentru despărţirea în silabe a cuvintelor din limba română; - realizarea unui analizor lexical şi a unui set de reguli pentru determinarea silabei accentuate din cadrul cuvintelor; - realizarea unei statistici a silabelor limbii române pentru determinarea frecvenţelor de apariţie ale silabelor din limba română; - realizarea unei baze de date acustice de silabe, în care unităţile au fost înregistrate în diferite contexte şi moduri de pronunţie, incluzând aspectele prozodice intrasegmentale; - proiectarea unui algoritm de regăsire în baza de date a unităţilor acustice în funcţie de caracteristicile acestora: lungime, context şi accentuare; - realizarea unei aplicaţii de test pentru validarea rezultatelor.
- Page 208 and 209: TEXT Forma flexionată Figura 6.13.
- Page 210 and 211: 192 Cap. 6. Metode de sinteză de v
- Page 212 and 213: 194 Cap. 6. Metode de sinteză de v
- Page 214 and 215: {LIT}+(le|lui)/{SEP} {/*peştele*/
- Page 216 and 217: {LIT}+{CONS}e/{SEP} {/* merge */ Ca
- Page 218 and 219: 200 Cap. 6. Metode de sinteză de v
- Page 220 and 221: 202 Cap. 6. Metode de sinteză de v
- Page 222 and 223: 204 Cap. 6. Metode de sinteză de v
- Page 224 and 225: silaba: SILABA { ProcesareSilaba($1
- Page 226 and 227: 208 Cap. 6. Metode de sinteză de v
- Page 228 and 229: 210 Cap. 6. Metode de sinteză de v
- Page 230 and 231: 212 Cap. 6. Metode de sinteză de v
- Page 232 and 233: 214 Cap. 6. Metode de sinteză de v
- Page 234 and 235: 216 Cap. 6. Metode de sinteză de v
- Page 236 and 237: 218 Cap. 6. Metode de sinteză de v
- Page 238 and 239: 220 Cap. 6. Metode de sinteză de v
- Page 240 and 241: 222 Cap. 6. Metode de sinteză de v
- Page 242 and 243: -----------------------------------
- Page 244 and 245: 6.4.6. Proiectarea bazei de date vo
- Page 246 and 247: 228 Cap. 6. Metode de sinteză de v
- Page 248 and 249: 6.4.6.3. Organizarea bazei de date
- Page 250 and 251: 232 Cap. 6. Metode de sinteză de v
- Page 252 and 253: silabă conţinând litera ă silab
- Page 254 and 255: 236 Cap. 6. Metode de sinteză de v
- Page 256 and 257: 238 Cap. 6. Metode de sinteză de v
- Page 260 and 261: 7. Realizarea sistemului de sintez
- Page 262 and 263: Figura 7.2. Sistemul de sinteză a
- Page 264 and 265: 1) Crearea listei de silabe Cap. 7.
- Page 266 and 267: Cap. 7. Proiectarea sistemului de s
- Page 268 and 269: Cap. 7. Proiectarea sistemului de s
- Page 270 and 271: Cap. 7. Proiectarea sistemului de s
- Page 272 and 273: Cap. 7. Proiectarea sistemului de s
- Page 274 and 275: Baza de date vocală Cap. 7. Proiec
- Page 276 and 277: 1 Procesare Separator Procesare Cuv
- Page 278 and 279: Cap. 7. Proiectarea sistemului de s
- Page 280 and 281: Cap. 7. Proiectarea sistemului de s
- Page 282 and 283: Cap. 7. Proiectarea sistemului de s
- Page 284 and 285: 8. Concluzii finale Cercetările ef
- Page 286 and 287: 268 Cap. 8. Concluzii finale 11. A
- Page 288 and 289: 270 Cap. 8. Concluzii finale percep
- Page 290 and 291: 272 Cap. 8. Concluzii finale b) pen
- Page 292 and 293: 274 Cap. 8. Concluzii finale - nive
- Page 294 and 295: Bibliografie [And88] André-Obrecht
- Page 296 and 297: 278 Bibliografie Quality and Testin
- Page 298 and 299: 280 Bibliografie [Giu06] Giurgiu M.
- Page 300 and 301: 282 Bibliografie [Nag05] Nageshwara
- Page 302 and 303: 284 Bibliografie Research Institute
- Page 304 and 305: Anexa 2. Silabele din setul S2 dup
- Page 306 and 307: Anexa 2. Silabele din setul S2 dup
240<br />
Cap. 6. Metode de sinteză de voce<br />
Avantajele metodei de sinteză a vorbirii pe bază de silabe dezvoltată de autor<br />
Metoda de sinteză bazată pe concatenarea silabelor prezentată în acest capitol are<br />
următoarele avantaje:<br />
a) Prezintă o abordare unitară în toate fazele de proiectare, fiind bazată pe reguli în cele<br />
mai importante etape ale sale.<br />
b) Foloseşte reguli organizate într-o gramatică de tip LEX, rezultând astfel separarea<br />
modulului de analiză lingvistică faţă de fluxul de prelucrare a datelor.<br />
c) Asigură o capacitate mărită de extensibilitate şi adaptabilitate datorită faptului că<br />
regulile sunt accesibile şi se pot edita de către utilizator.<br />
d) Asigură reducerea semnificativă a costului şi timpului alocat procesului de proiectare,<br />
datorită utilizării regulilor (cel mult de ordinul sutelor), faţă de metodele ce utilizează dicţionare<br />
sau lexicoane (conţinând definiţii de ordinul zecilor sau sutelor de mii).<br />
e) Prezintă un grad mai mare de versatilitate, datorită utilizării gramaticilor regulate<br />
specifice LEX, faţă de alte metode ce folosesc reprezentări interne ale regulilor sau chiar<br />
formatul XML. Utilizarea seturilor bazate pe expresii regulate permite specificarea de tipare<br />
pentru unităţile lingvistice şi contextele în care ele apar, rezultând astfel şi un grad mai mare de<br />
corectitudine în analiza finală a textului.<br />
f) Necesită un efort mai mic de construire şi întreţinere a bazei de date vocale decât în<br />
cazul metodei bazate pe corpus. Astfel, în cazul metodei bazate pe silabe, numărul unităţilor<br />
acustice este cu cel puţin două ordine de mărime mai mic decât în cazul metodei bazate pe<br />
corpus.<br />
g) Păstrează eficienţa şi calitatea metodelor de sinteză prin concatenare, în raport cu<br />
metodele parametrice de sinteză. Astfel, în cazul concatenării, semnalul sintetizat păstrează<br />
calitatea unităţilor înregistrate în baza de date vocală, pe când în cazul metodele parametrice,<br />
semnalul de ieşire este aproximat.<br />
h) Prezintă o calitate mai înaltă a sintezei faţă de metodele bazate pe foneme sau<br />
difoneme, din cauza unui număr mai redus de puncte de concatenare, la nivelul silabei.<br />
Aplicaţii şi dezvoltări de viitor<br />
Pentru mărirea performanţelor metodei de sinteză prezentate, se au în vedere următoarele<br />
dezvoltări de viitor:<br />
- mărirea gradului de completitudine a seturilor de reguli pentru silabisire şi accentuare,<br />
prin adăugarea de noi reguli;<br />
- îmbunătăţirea ratei de detectare corectă a accentuării prin folosirea unui dicţionar<br />
morfologic al limbii române. Astfel, gradul de completitudine al unor reguli stabilite pentru<br />
cuvinte cu aceeaşi terminaţie poate fi mărit prin preluarea cuvintelor din dicţionar. Aceasta va<br />
duce la creşterea ratei de detecţie corectă a analizorului, chiar fără a introduce noi reguli de<br />
accentuare;<br />
- în faza de analiză a sintaxei, determinarea părţilor de propoziţie (subiect, predicat) pe<br />
baza părţilor de vorbire detectate deja (substantiv, verb, etc.) va duce la determinarea semanticii<br />
frazei, cu aplicaţii importante în dialogul om-calculator;