Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică

users.utcluj.ro
from users.utcluj.ro More from this publisher
15.06.2013 Views

4. Analiza semnalului vocal ............................................................................................54 4.1. Parametrii de bază ai semnalului vocal..............................................................................54 4.2. Analiza semnalului pentru determinarea parametrilor caracteristici .................................57 4.2.1. Analiza în domeniul timp a semnalului vocal..........................................................57 4.2.2. Analiza în domeniul frecvenţă a semnalului vocal ..................................................60 4.3. Segmentarea semnalului vocal...........................................................................................66 4.3.1. Detectarea automată a segmentelor semnalului vocal .............................................67 4.3.2. Algoritmi de detectare a caracteristicilor de segment..............................................69 4.3.2.1. Date de intrare şi pre-procesare S/U/V ...........................................................69 4.3.2.2. Funcţia volum .................................................................................................69 4.3.2.3. Valorile pragurilor şi scorurile de caracteristici..............................................70 4.3.3. Detectarea categoriilor specifice din semnalul vocal...............................................73 4.3.3.1. Detectarea cadrelor sonore..............................................................................73 4.3.3.2. Detectarea vocalelor........................................................................................73 4.3.3.3. Detectarea consoanelor sonore........................................................................74 4.3.3.4. Detectarea benzii sonore .................................................................................75 4.3.3.5. Detectarea nazalelor........................................................................................75 4.3.3.6. Detectarea semivocalelor ................................................................................76 4.3.3.7. Detectarea fricativelor sonore .........................................................................77 4.3.3.8. Detectarea stopurilor şi fricativelor nesonore .................................................78 4.3.4. Detectarea graniţelor dintre segmente......................................................................79 4.3.4.1. Detectarea bazată pe graniţa spectrală şi segmentare .....................................79 4.3.4.2. Detectarea graniţelor prin metoda S/U/V........................................................80 4.3.5. Segmentarea finală...................................................................................................81 4.3.6. Etichetarea segmentelor ...........................................................................................81 4.3.7. Rezultate şi concluzii privind metoda generică de segmentare ...............................82 4.4. Contribuţii aduse în procesul segmentării automate a semnalului vocal ...........................84 4.4.1. Detectarea punctelor de zero, minim şi maxim........................................................85 4.4.2. Segmentarea SUV şi detecţia de regiuni..................................................................86 4.4.2.1. Detectarea categoriei Linişte...........................................................................89 4.4.2.2. Detectarea categoriei Vocală ..........................................................................91 4.4.2.3. Împărţirea în subregiuni vocalice....................................................................93 4.4.2.3.1. Detectarea subregiunilor corespunzătoare consoanei /R/ ........................94 4.4.2.3.2. Detectarea subregiunilor corespunzătoare consoanelor /C/, /G/..............96 4.4.2.4. Detectarea categoriei Consoană ......................................................................96 4.4.2.5. Detectarea categoriei Tranziţie .......................................................................98 4.4.3. Compactarea regiunilor..........................................................................................101 4.4.4. Rezultatul final al segmentării în clase de regiuni .................................................105 4.4.5. Concluzii privitoare la segmentarea semnalului vocal în clase de regiuni ............106 4.5. Detectarea perioadelor din forma de undă. Punctele de închidere glotală.......................107 ii

4.6. Contribuţii ale autorului în determinarea perioadelor de semnal.................................... 109 4.6.1. Algoritmul de determinare a perioadelor şi maximelor de perioadă..................... 109 4.6.1.1. Determinarea pivotului................................................................................. 111 4.6.1.2. Estimarea perioadei ...................................................................................... 112 4.6.1.3. Detectarea maximelor de perioadă ............................................................... 114 4.6.1.4. Marcarea intervalelor de perioadă................................................................ 116 4.6.1.5. Rezultate obţinute cu algoritmul propriu de determinare a intervalelor de perioadă…. ................................................................................................... 117 4.6.1.6. Concluzii cu privire la algoritmul propriu de determinare a intervalelor de perioadă … .............................................................................................. 118 4.7. Segmentarea fonematică.................................................................................................. 119 4.7.1. Segmentarea fonematică folosind modele Markov ascunse.................................. 119 4.7.2. Segmentarea bazată pe rafinarea frontierelor........................................................ 120 4.7.3. Segmentarea bazată pe probabilităţi generalizate ................................................. 122 4.7.3.1. Algoritmul de bază ....................................................................................... 122 4.7.3.2. Algoritmul ce foloseşte o segmentare iniţială după secvenţa de foneme..... 122 4.7.4. Rezultate obţinute prin cele trei metode de segmentare fonematică ..................... 123 4.8. Contribuţii ale autorului în problematica segmentării fonematice automate a semnalului vocal.............................................................................................................. 124 4.8.1. Transcrierea fonetică a textului de la intrare ......................................................... 125 4.8.2. Proiectarea regulilor de asociere pentru fiecare grup fonetic................................ 126 4.8.3. Rezultate obţinute în urma aplicării metodei propuse de asociere fonemeregiuni .................................................................................................................... 134 4.8.4. Experimente privind segmentarea în subregiuni fonematice ................................ 137 4.8.4.1. Calculul distanţei dintre două seturi de coeficienţi fonematici .................... 138 4.8.4.2. Metoda de segmentare în subregiuni fonematice bazată pe determinarea tranziţiilor bruşte din regiune ....................................................................... 140 4.8.4.3. Rezultate obţinute prin metoda de segmentare bazată pe determinarea tranziţiilor bruşte din regiune ....................................................................... 141 4.8.4.4. Metoda de segmentare în subregiuni fonematice bazată pe modelarea caracteristicilor spectrale.............................................................................. 147 4.8.4.5. Rezultate obţinute prin metoda de segmentare în subregiuni fonematice bazată pe modelarea caracteristicilor spectrale ............................................ 150 4.8.5. Aplicaţii ale segmentării fonematice în realizarea bazelor de date acustice ......... 153 4.8.6. Concluzii privitoare la contribuţiile autorului în segmentarea fonematică a semnalului vocal .................................................................................................... 154 5. Sinteza de voce........................................................................................................... 155 5.1. Modelul general al sintezei vorbirii................................................................................. 155 5.2. Sistemul de sinteză text-to-speech................................................................................... 157 5.2.1. Caracteristicile unui sistem text-to-speech. Metode de bază folosite.................... 157 5.2.2. Etape în sinteza de voce pornind de la text ........................................................... 159 iii

4. Analiza semnalului vocal ............................................................................................54<br />

4.1. Parametrii de bază ai semnalului vocal..............................................................................54<br />

4.2. Analiza semnalului pentru determinarea parametrilor caracteristici .................................57<br />

4.2.1. Analiza în domeniul timp a semnalului vocal..........................................................57<br />

4.2.2. Analiza în domeniul frecvenţă a semnalului vocal ..................................................60<br />

4.3. Segmentarea semnalului vocal...........................................................................................66<br />

4.3.1. Detectarea automată a segmentelor semnalului vocal .............................................67<br />

4.3.2. Algoritmi de detectare a caracteristicilor de segment..............................................69<br />

4.3.2.1. Date de intrare şi pre-procesare S/U/V ...........................................................69<br />

4.3.2.2. Funcţia volum .................................................................................................69<br />

4.3.2.3. Valorile pragurilor şi scorurile de caracteristici..............................................70<br />

4.3.3. Detectarea categoriilor specifice din semnalul vocal...............................................73<br />

4.3.3.1. Detectarea cadrelor sonore..............................................................................73<br />

4.3.3.2. Detectarea vocalelor........................................................................................73<br />

4.3.3.3. Detectarea consoanelor sonore........................................................................74<br />

4.3.3.4. Detectarea benzii sonore .................................................................................75<br />

4.3.3.5. Detectarea nazalelor........................................................................................75<br />

4.3.3.6. Detectarea semivocalelor ................................................................................76<br />

4.3.3.7. Detectarea fricativelor sonore .........................................................................77<br />

4.3.3.8. Detectarea stopurilor şi fricativelor nesonore .................................................78<br />

4.3.4. Detectarea graniţelor dintre segmente......................................................................79<br />

4.3.4.1. Detectarea bazată pe graniţa spectrală şi segmentare .....................................79<br />

4.3.4.2. Detectarea graniţelor prin metoda S/U/V........................................................80<br />

4.3.5. Segmentarea finală...................................................................................................81<br />

4.3.6. Etichetarea segmentelor ...........................................................................................81<br />

4.3.7. Rezultate şi concluzii privind metoda generică de segmentare ...............................82<br />

4.4. Contribuţii aduse în procesul segmentării automate a semnalului vocal ...........................84<br />

4.4.1. Detectarea punctelor de zero, minim şi maxim........................................................85<br />

4.4.2. Segmentarea SUV şi detecţia de regiuni..................................................................86<br />

4.4.2.1. Detectarea categoriei Linişte...........................................................................89<br />

4.4.2.2. Detectarea categoriei Vocală ..........................................................................91<br />

4.4.2.3. Împărţirea în subregiuni vocalice....................................................................93<br />

4.4.2.3.1. Detectarea subregiunilor corespunzătoare consoanei /R/ ........................94<br />

4.4.2.3.2. Detectarea subregiunilor corespunzătoare consoanelor /C/, /G/..............96<br />

4.4.2.4. Detectarea categoriei Consoană ......................................................................96<br />

4.4.2.5. Detectarea categoriei Tranziţie .......................................................................98<br />

4.4.3. Compactarea regiunilor..........................................................................................101<br />

4.4.4. Rezultatul final al segmentării în clase de regiuni .................................................105<br />

4.4.5. Concluzii privitoare la segmentarea semnalului vocal în clase de regiuni ............106<br />

4.5. Detectarea perioadelor din forma de undă. Punctele de închidere glotală.......................107<br />

ii

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!