Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
4. Analiza semnalului vocal ............................................................................................54 4.1. Parametrii de bază ai semnalului vocal..............................................................................54 4.2. Analiza semnalului pentru determinarea parametrilor caracteristici .................................57 4.2.1. Analiza în domeniul timp a semnalului vocal..........................................................57 4.2.2. Analiza în domeniul frecvenţă a semnalului vocal ..................................................60 4.3. Segmentarea semnalului vocal...........................................................................................66 4.3.1. Detectarea automată a segmentelor semnalului vocal .............................................67 4.3.2. Algoritmi de detectare a caracteristicilor de segment..............................................69 4.3.2.1. Date de intrare şi pre-procesare S/U/V ...........................................................69 4.3.2.2. Funcţia volum .................................................................................................69 4.3.2.3. Valorile pragurilor şi scorurile de caracteristici..............................................70 4.3.3. Detectarea categoriilor specifice din semnalul vocal...............................................73 4.3.3.1. Detectarea cadrelor sonore..............................................................................73 4.3.3.2. Detectarea vocalelor........................................................................................73 4.3.3.3. Detectarea consoanelor sonore........................................................................74 4.3.3.4. Detectarea benzii sonore .................................................................................75 4.3.3.5. Detectarea nazalelor........................................................................................75 4.3.3.6. Detectarea semivocalelor ................................................................................76 4.3.3.7. Detectarea fricativelor sonore .........................................................................77 4.3.3.8. Detectarea stopurilor şi fricativelor nesonore .................................................78 4.3.4. Detectarea graniţelor dintre segmente......................................................................79 4.3.4.1. Detectarea bazată pe graniţa spectrală şi segmentare .....................................79 4.3.4.2. Detectarea graniţelor prin metoda S/U/V........................................................80 4.3.5. Segmentarea finală...................................................................................................81 4.3.6. Etichetarea segmentelor ...........................................................................................81 4.3.7. Rezultate şi concluzii privind metoda generică de segmentare ...............................82 4.4. Contribuţii aduse în procesul segmentării automate a semnalului vocal ...........................84 4.4.1. Detectarea punctelor de zero, minim şi maxim........................................................85 4.4.2. Segmentarea SUV şi detecţia de regiuni..................................................................86 4.4.2.1. Detectarea categoriei Linişte...........................................................................89 4.4.2.2. Detectarea categoriei Vocală ..........................................................................91 4.4.2.3. Împărţirea în subregiuni vocalice....................................................................93 4.4.2.3.1. Detectarea subregiunilor corespunzătoare consoanei /R/ ........................94 4.4.2.3.2. Detectarea subregiunilor corespunzătoare consoanelor /C/, /G/..............96 4.4.2.4. Detectarea categoriei Consoană ......................................................................96 4.4.2.5. Detectarea categoriei Tranziţie .......................................................................98 4.4.3. Compactarea regiunilor..........................................................................................101 4.4.4. Rezultatul final al segmentării în clase de regiuni .................................................105 4.4.5. Concluzii privitoare la segmentarea semnalului vocal în clase de regiuni ............106 4.5. Detectarea perioadelor din forma de undă. Punctele de închidere glotală.......................107 ii
4.6. Contribuţii ale autorului în determinarea perioadelor de semnal.................................... 109 4.6.1. Algoritmul de determinare a perioadelor şi maximelor de perioadă..................... 109 4.6.1.1. Determinarea pivotului................................................................................. 111 4.6.1.2. Estimarea perioadei ...................................................................................... 112 4.6.1.3. Detectarea maximelor de perioadă ............................................................... 114 4.6.1.4. Marcarea intervalelor de perioadă................................................................ 116 4.6.1.5. Rezultate obţinute cu algoritmul propriu de determinare a intervalelor de perioadă…. ................................................................................................... 117 4.6.1.6. Concluzii cu privire la algoritmul propriu de determinare a intervalelor de perioadă … .............................................................................................. 118 4.7. Segmentarea fonematică.................................................................................................. 119 4.7.1. Segmentarea fonematică folosind modele Markov ascunse.................................. 119 4.7.2. Segmentarea bazată pe rafinarea frontierelor........................................................ 120 4.7.3. Segmentarea bazată pe probabilităţi generalizate ................................................. 122 4.7.3.1. Algoritmul de bază ....................................................................................... 122 4.7.3.2. Algoritmul ce foloseşte o segmentare iniţială după secvenţa de foneme..... 122 4.7.4. Rezultate obţinute prin cele trei metode de segmentare fonematică ..................... 123 4.8. Contribuţii ale autorului în problematica segmentării fonematice automate a semnalului vocal.............................................................................................................. 124 4.8.1. Transcrierea fonetică a textului de la intrare ......................................................... 125 4.8.2. Proiectarea regulilor de asociere pentru fiecare grup fonetic................................ 126 4.8.3. Rezultate obţinute în urma aplicării metodei propuse de asociere fonemeregiuni .................................................................................................................... 134 4.8.4. Experimente privind segmentarea în subregiuni fonematice ................................ 137 4.8.4.1. Calculul distanţei dintre două seturi de coeficienţi fonematici .................... 138 4.8.4.2. Metoda de segmentare în subregiuni fonematice bazată pe determinarea tranziţiilor bruşte din regiune ....................................................................... 140 4.8.4.3. Rezultate obţinute prin metoda de segmentare bazată pe determinarea tranziţiilor bruşte din regiune ....................................................................... 141 4.8.4.4. Metoda de segmentare în subregiuni fonematice bazată pe modelarea caracteristicilor spectrale.............................................................................. 147 4.8.4.5. Rezultate obţinute prin metoda de segmentare în subregiuni fonematice bazată pe modelarea caracteristicilor spectrale ............................................ 150 4.8.5. Aplicaţii ale segmentării fonematice în realizarea bazelor de date acustice ......... 153 4.8.6. Concluzii privitoare la contribuţiile autorului în segmentarea fonematică a semnalului vocal .................................................................................................... 154 5. Sinteza de voce........................................................................................................... 155 5.1. Modelul general al sintezei vorbirii................................................................................. 155 5.2. Sistemul de sinteză text-to-speech................................................................................... 157 5.2.1. Caracteristicile unui sistem text-to-speech. Metode de bază folosite.................... 157 5.2.2. Etape în sinteza de voce pornind de la text ........................................................... 159 iii
- Page 1: FACULTATEA DE ELECTRONICĂ, TELECOM
- Page 6 and 7: 6. Metode de sinteză de voce......
- Page 9 and 10: Lista de abrevieri ADPCM - Adaptive
- Page 11 and 12: Figura 3.17. Vocala A1. Se observă
- Page 13 and 14: Figura 3.63. Vocala E porţiunea me
- Page 15 and 16: Figura 4.57. Asocierea foneme-regiu
- Page 17: Lista de tabele Tabelul 2.1. Relaţ
- Page 20 and 21: 2 Cap. 1. Introducere Se prezintă
- Page 22 and 23: 4 Cap. 1. Introducere Autorul tezei
- Page 24 and 25: 2. Modalitatea producerii vorbirii
- Page 26 and 27: Faringe nazal Vălul palatin Faring
- Page 28 and 29: 10 Cap. 2. Modalitatea producerii v
- Page 30 and 31: 12 Cap. 2. Modalitatea producerii v
- Page 32 and 33: 14 Cap. 2. Modalitatea producerii v
- Page 34 and 35: 16 Cap. 2. Modalitatea producerii v
- Page 36 and 37: 2.7.1.2. Efectele tractului vocal 1
- Page 38 and 39: 20 Cap. 3. Procesarea digitală a s
- Page 40 and 41: 22 Cap. 3. Procesarea digitală a s
- Page 42 and 43: 24 Cap. 3. Procesarea digitală a s
- Page 44 and 45: 3.2.1.1.1. Facilităţi de ordin ge
- Page 46 and 47: 28 Cap. 3. Procesarea digitală a s
- Page 48 and 49: 30 Cap. 3. Procesarea digitală a s
- Page 50 and 51: 1) Analiza spectrală a vocalelor p
- Page 52 and 53: 3) Analiza spectrală a sunetelor e
4. Analiza semnalului vocal ............................................................................................54<br />
4.1. Parametrii de bază ai semnalului vocal..............................................................................54<br />
4.2. Analiza semnalului pentru determinarea parametrilor caracteristici .................................57<br />
4.2.1. Analiza în domeniul timp a semnalului vocal..........................................................57<br />
4.2.2. Analiza în domeniul frecvenţă a semnalului vocal ..................................................60<br />
4.3. Segmentarea semnalului vocal...........................................................................................66<br />
4.3.1. Detectarea automată a segmentelor semnalului vocal .............................................67<br />
4.3.2. Algoritmi de detectare a caracteristicilor de segment..............................................69<br />
4.3.2.1. Date de intrare şi pre-procesare S/U/V ...........................................................69<br />
4.3.2.2. Funcţia volum .................................................................................................69<br />
4.3.2.3. Valorile pragurilor şi scorurile de caracteristici..............................................70<br />
4.3.3. Detectarea categoriilor specifice din semnalul vocal...............................................73<br />
4.3.3.1. Detectarea cadrelor sonore..............................................................................73<br />
4.3.3.2. Detectarea vocalelor........................................................................................73<br />
4.3.3.3. Detectarea consoanelor sonore........................................................................74<br />
4.3.3.4. Detectarea benzii sonore .................................................................................75<br />
4.3.3.5. Detectarea nazalelor........................................................................................75<br />
4.3.3.6. Detectarea semivocalelor ................................................................................76<br />
4.3.3.7. Detectarea fricativelor sonore .........................................................................77<br />
4.3.3.8. Detectarea stopurilor şi fricativelor nesonore .................................................78<br />
4.3.4. Detectarea graniţelor dintre segmente......................................................................79<br />
4.3.4.1. Detectarea bazată pe graniţa spectrală şi segmentare .....................................79<br />
4.3.4.2. Detectarea graniţelor prin metoda S/U/V........................................................80<br />
4.3.5. Segmentarea finală...................................................................................................81<br />
4.3.6. Etichetarea segmentelor ...........................................................................................81<br />
4.3.7. Rezultate şi concluzii privind metoda generică de segmentare ...............................82<br />
4.4. Contribuţii aduse în procesul segmentării automate a semnalului vocal ...........................84<br />
4.4.1. Detectarea punctelor de zero, minim şi maxim........................................................85<br />
4.4.2. Segmentarea SUV şi detecţia de regiuni..................................................................86<br />
4.4.2.1. Detectarea categoriei Linişte...........................................................................89<br />
4.4.2.2. Detectarea categoriei Vocală ..........................................................................91<br />
4.4.2.3. Împărţirea în subregiuni vocalice....................................................................93<br />
4.4.2.3.1. Detectarea subregiunilor corespunzătoare consoanei /R/ ........................94<br />
4.4.2.3.2. Detectarea subregiunilor corespunzătoare consoanelor /C/, /G/..............96<br />
4.4.2.4. Detectarea categoriei Consoană ......................................................................96<br />
4.4.2.5. Detectarea categoriei Tranziţie .......................................................................98<br />
4.4.3. Compactarea regiunilor..........................................................................................101<br />
4.4.4. Rezultatul final al segmentării în clase de regiuni .................................................105<br />
4.4.5. Concluzii privitoare la segmentarea semnalului vocal în clase de regiuni ............106<br />
4.5. Detectarea perioadelor din forma de undă. Punctele de închidere glotală.......................107<br />
ii