Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
6. Metode de sinteză de voce.........................................................................................162 6.1. Clasificarea metodelor de sinteză de voce .......................................................................162 6.2. Metode de sinteză în domeniul frecvenţă ........................................................................165 6.2.1. Sinteza bazată pe predicţie liniară..........................................................................165 6.2.2. Sinteza formantică..................................................................................................167 6.2.2.1. Realizarea excitaţiei ......................................................................................168 6.2.2.2. Sinteza în cascadă .........................................................................................168 6.2.2.3. Sinteza în paralel...........................................................................................170 6.3. Metode de sinteză în domeniul timp ................................................................................170 6.3.1. Metoda TD-PSOLA ...............................................................................................171 6.3.1.1. Modelare matematică....................................................................................171 6.3.1.2. Avantajele şi dezavantajele metodei TD-PSOLA.........................................175 6.3.1.3. Îmbunătăţiri ale metodei ...............................................................................175 6.3.2. Metoda bazată pe corpus........................................................................................176 6.3.2.1. Algoritmul de selecţie a unităţilor acustice...................................................176 6.3.2.2. Adnotarea bazei de date vocală.....................................................................177 6.3.2.3. Potrivirea unităţilor candidat cu unităţile ţintă..............................................178 6.3.2.4. Calculul costurilor şi măsurile distanţelor dintre unităţi [Mob00]................180 6.3.2.4.1. Metoda de căutare în spaţiul stărilor (Weight Space Search) ................180 6.3.2.4.2. Metoda de grupare a unităţilor în funcţie de context ______ (Context Clustering)...............................................................................180 6.3.2.5. Algoritmul metodei de sinteză bazată pe corpus vocal.................................182 6.3.2.6. Avantajele şi dezavantajele metodei bazate pe corpus .................................182 6.4. Contribuţii în proiectarea metodelor de sinteză de voce..................................................183 6.4.1. Metoda de sinteză bazată pe silabe pentru limba română......................................183 6.4.2. Preprocesarea textului............................................................................................184 6.4.3. Analiza sintaxei......................................................................................................189 6.4.3.1. Modul de funcţionare al analizorului de sintaxă...........................................191 6.4.3.2. Regulile specificate de analizorul de sintaxă ................................................192 6.4.3.3. Rezultate obţinute cu analizorul automat de sintaxă.....................................201 6.4.3.4. Concluzii cu privire la metoda de analiză automată a sintaxei propusă de autor ..............................................................................................................202 6.4.4. Determinarea unităţilor lingvistice: silabele ..........................................................203 6.4.4.1. Analizorul sintactic folosit în extragerea propoziţiilor şi cuvintelor ............204 6.4.4.1.1. Gramatica analizorului sintactic ............................................................205 6.4.4.2. Analizorul lexical utilizat în determinarea silabelor .....................................207 6.4.4.2.1. Gramatica analizorului lexical ...............................................................208 6.4.4.2.2. Acţiunile de realizat la potrivirea intrării...............................................209 6.4.4.2.3. Regulile de producţie pentru despărţirea în silabe .................................210 6.4.4.2.4. Rezultate obţinute cu analizorul lexical pentru determinarea silabelor .218 6.4.5. Determinarea aspectelor prozodice: accentele.......................................................219 6.4.5.1. Analizorul lexical utilizat în determinarea accentelor ..................................219 iv
6.4.5.2. Gramatica analizorului lexical pentru determinarea accentelor din limba română.......................................................................................................... 220 6.4.5.3. Rezultate obţinute cu analizorul lexical pentru determinarea accentelor..... 225 6.4.6. Proiectarea bazei de date vocale............................................................................ 226 6.4.6.1. O statistică a silabelor limbii române ........................................................... 227 6.4.6.2. Caracteristicile silabelor înregistrate în baza de date acustică ..................... 229 6.4.6.3. Organizarea bazei de date acustice............................................................... 230 6.4.7. Regăsirea unităţilor acustice şi sinteza de voce..................................................... 231 6.4.8. Concluzii cu privire la metoda de sinteză a vorbirii prin concatenare de silabe proiectată şi realizată de autor ............................................................................... 236 7. Realizarea sistemului de sinteză de voce în limba română LIGHTVOX ............ 242 7.1. Organizarea pe module a sistemului ............................................................................... 242 7.2. Structura funcţională a sistemului ................................................................................... 243 7.3. Metodologia de proiectare a sistemului de sinteză LIGHTVOX .................................... 245 7.3.1. Construirea bazei de date acustice......................................................................... 245 7.3.2. Conversia text-voce............................................................................................... 253 7.4. Algoritmul de implementare al conversiei text-voce ...................................................... 254 7.5. Rezultate experimentale şi dezvoltări de viitor ............................................................... 260 7.6. Concluzii privind proiectarea şi realizarea sistemului de sinteză vocală ........................ 262 8. Concluzii finale.......................................................................................................... 266 8.1. Principalele aspecte expuse în cadrul tezei ..................................................................... 267 8.2. Contribuţiile şi realizările tezei de doctorat .................................................................... 269 Bibliografie ................................................................................................................................276 Anexa 1. Notaţia Backus-Naur Form şi gramatica LEX …………………………………. 285 Anexa 2. Silabele din setul S2 după frecvenţa de apariţie ……..………………………….. 286 Anexa 3. Silabele din setul S3 după frecvenţa de apariţie ………..……………………….. 289 Anexa 4. Silabele din setul S4 după frecvenţa de apariţie ……………………..………...... 292 Anexa 5. Activitatea ştiinţifică a autorului............................................................................ 295 _Anexa 6. Lucrări ştiinţifice prezentate în extenso ................................................................. 300 v
- Page 1: FACULTATEA DE ELECTRONICĂ, TELECOM
- Page 4 and 5: 4. Analiza semnalului vocal .......
- Page 9 and 10: Lista de abrevieri ADPCM - Adaptive
- Page 11 and 12: Figura 3.17. Vocala A1. Se observă
- Page 13 and 14: Figura 3.63. Vocala E porţiunea me
- Page 15 and 16: Figura 4.57. Asocierea foneme-regiu
- Page 17: Lista de tabele Tabelul 2.1. Relaţ
- Page 20 and 21: 2 Cap. 1. Introducere Se prezintă
- Page 22 and 23: 4 Cap. 1. Introducere Autorul tezei
- Page 24 and 25: 2. Modalitatea producerii vorbirii
- Page 26 and 27: Faringe nazal Vălul palatin Faring
- Page 28 and 29: 10 Cap. 2. Modalitatea producerii v
- Page 30 and 31: 12 Cap. 2. Modalitatea producerii v
- Page 32 and 33: 14 Cap. 2. Modalitatea producerii v
- Page 34 and 35: 16 Cap. 2. Modalitatea producerii v
- Page 36 and 37: 2.7.1.2. Efectele tractului vocal 1
- Page 38 and 39: 20 Cap. 3. Procesarea digitală a s
- Page 40 and 41: 22 Cap. 3. Procesarea digitală a s
- Page 42 and 43: 24 Cap. 3. Procesarea digitală a s
- Page 44 and 45: 3.2.1.1.1. Facilităţi de ordin ge
- Page 46 and 47: 28 Cap. 3. Procesarea digitală a s
- Page 48 and 49: 30 Cap. 3. Procesarea digitală a s
- Page 50 and 51: 1) Analiza spectrală a vocalelor p
- Page 52 and 53: 3) Analiza spectrală a sunetelor e
- Page 54 and 55: Figura 3.25. Cazul A. Semnalul x(t)
6. Metode de sinteză de voce.........................................................................................162<br />
6.1. Clasificarea metodelor de sinteză de voce .......................................................................162<br />
6.2. Metode de sinteză în domeniul frecvenţă ........................................................................165<br />
6.2.1. Sinteza bazată pe predicţie liniară..........................................................................165<br />
6.2.2. Sinteza formantică..................................................................................................167<br />
6.2.2.1. Realizarea excitaţiei ......................................................................................168<br />
6.2.2.2. Sinteza în cascadă .........................................................................................168<br />
6.2.2.3. Sinteza în paralel...........................................................................................170<br />
6.3. Metode de sinteză în domeniul timp ................................................................................170<br />
6.3.1. Metoda TD-PSOLA ...............................................................................................171<br />
6.3.1.1. Modelare matematică....................................................................................171<br />
6.3.1.2. Avantajele şi dezavantajele metodei TD-PSOLA.........................................175<br />
6.3.1.3. Îmbunătăţiri ale metodei ...............................................................................175<br />
6.3.2. Metoda bazată pe corpus........................................................................................176<br />
6.3.2.1. Algoritmul de selecţie a unităţilor acustice...................................................176<br />
6.3.2.2. Adnotarea bazei de date vocală.....................................................................177<br />
6.3.2.3. Potrivirea unităţilor candidat cu unităţile ţintă..............................................178<br />
6.3.2.4. Calculul costurilor şi măsurile distanţelor dintre unităţi [Mob00]................180<br />
6.3.2.4.1. Metoda de căutare în spaţiul stărilor (Weight Space Search) ................180<br />
6.3.2.4.2. Metoda de grupare a unităţilor în funcţie de context ______<br />
(Context Clustering)...............................................................................180<br />
6.3.2.5. Algoritmul metodei de sinteză bazată pe corpus vocal.................................182<br />
6.3.2.6. Avantajele şi dezavantajele metodei bazate pe corpus .................................182<br />
6.4. Contribuţii în proiectarea metodelor de sinteză de voce..................................................183<br />
6.4.1. Metoda de sinteză bazată pe silabe pentru limba română......................................183<br />
6.4.2. Preprocesarea textului............................................................................................184<br />
6.4.3. Analiza sintaxei......................................................................................................189<br />
6.4.3.1. Modul de funcţionare al analizorului de sintaxă...........................................191<br />
6.4.3.2. Regulile specificate de analizorul de sintaxă ................................................192<br />
6.4.3.3. Rezultate obţinute cu analizorul automat de sintaxă.....................................201<br />
6.4.3.4. Concluzii cu privire la metoda de analiză automată a sintaxei propusă de<br />
autor ..............................................................................................................202<br />
6.4.4. Determinarea unităţilor lingvistice: silabele ..........................................................203<br />
6.4.4.1. Analizorul sintactic folosit în extragerea propoziţiilor şi cuvintelor ............204<br />
6.4.4.1.1. Gramatica analizorului sintactic ............................................................205<br />
6.4.4.2. Analizorul lexical utilizat în determinarea silabelor .....................................207<br />
6.4.4.2.1. Gramatica analizorului lexical ...............................................................208<br />
6.4.4.2.2. Acţiunile de realizat la potrivirea intrării...............................................209<br />
6.4.4.2.3. Regulile de producţie pentru despărţirea în silabe .................................210<br />
6.4.4.2.4. Rezultate obţinute cu analizorul lexical pentru determinarea silabelor .218<br />
6.4.5. Determinarea aspectelor prozodice: accentele.......................................................219<br />
6.4.5.1. Analizorul lexical utilizat în determinarea accentelor ..................................219<br />
iv