Teza doctorat (pdf) - Universitatea Tehnică
Teza doctorat (pdf) - Universitatea Tehnică Teza doctorat (pdf) - Universitatea Tehnică
200 Cap. 6. Metode de sinteză de voce În setul de reguli prezentat, categoria gramaticală propusă de analizor (substantiv cu o anumită declinare, verb într-o anumită conjugare, etc.) se poate specifica în trei moduri distincte: a) implicit prin apelul unei primitive specifice pentru acea categorie, de exemplu : CautVerbMaiMultCaPerf(term, str) => P.v.=’VERB’; Timp=’MMCP’ b) primul parametru al primitivei Caut / Caută , de exemplu : Caut(V_CONJ, len, str) => P.v.=’VERB’; Timp=’CONJUNCTIV’ c) prin folosirea variabilei TipLex, care rescrie categoria gramaticală în modul specificat: TipLex=’sf’ => P.v.=’SUBST’; Gen=’FEM’ În plus, pentru categoriile gramaticale neflexionate (cum ar fi pronume, adverbe, conjuncţii, interjecţii, verbe la infinitiv, substantive nearticulate) s-a introdus o regulă generală care caută acea formă direct în dicţionar, fără a mai urmări înlocuirea terminaţiei ca în modul flexionat: {LIT}+/{SEP} {/* Se caută cuvântul întreg neflexionat */ Caut(GENERIC,0,""); } Desigur că aici nu au fost prezentate explicit regulile de flexionare ale limbii române pentru fiecare categorie gramaticală, pentru aceasta este de dorit a se consulta bibliografia indicată [Gra08]. Cu privire la setul de reguli pentru analiza sintaxei prezentat în acest capitol, se poate face observaţia că au fost cuprinse în acest set categoriile gramaticale de bază, nu şi cele a căror formă nu se schimbă faţă de categoria principală de bază. Astfel, pentru categoria Substantiv declinările pentru cazul Dativ şi Genitiv sunt identice, ambele situaţii fiind memorate ca Dativ : Articol : Hotărât Nehotărât Dativ: ‘am dat fetei caietul’ ‘am dat unei fete caietul’ Genitiv : ‘caietul fetei’ ‘caietul unei fete’ De asemeni forma la Acuzativ este identică cu forma de Nominativ a substantivului : Articol : Hotărât Nehotărât Nominativ: ‘fata se plimba ’ ‘o fată se plimba ’ Acuzativ : ‘mă plimbam cu fata’ ‘mă plimbam cu o fată’ În cazul verbului, Imperativul are aceeaşi formă cu Prezentul : Singular Plural Imperativ: ‘Vorbeşte mai încet! ’ Imperativ : ‘Vorbiţi mai tare !’ Prez. Pers. 3: ‘el vorbeşte încet’ Prez. Pers. 2: ‘voi vorbiţi tare’
De asemeni Viitorul se construieşte pe baza Infinitivului : Singular Plural Viitor: ‘va fi’ ; ‘va urma’ Viitor : ‘vor fi’ ; ‘vor urma’ Infinitiv: ‘a fi’ ; ‘a urma’ Infinitiv: ‘a fi’ ; ‘a urma’ 201 Cap. 6. Metode de sinteză de voce Tot în cazul verbului, Conjunctivul are aceeaşi formă cu Prezentul la persoana întâia singular şi plural, apărând diferenţe doar la persoana 3 singular şi plural : Conjunctiv Prezent Pers. 1 sg. să fac eu fac Pers. 2 sg. să faci tu faci Pers. 3 sg. să facă el face Pers. 1 pl. să facem noi facem Pers. 2 pl. să faceţi voi faceţi Pers. 3 pl. să facă ei fac 6.4.3.3. Rezultate obţinute cu analizorul automat de sintaxă Analizorul automat de sintaxă se bazează pe un dicţionar ce conţine peste 30.000 de forme neflexionate ale limbii române şi pe un set de 550 de reguli de flexionare. Analizorul a fost testat pe o serie de texte în limba română de diferite genuri, de la literatură la documente tehnice, însumând peste 200.000 de cuvinte. Testele au dovedit o corectitudine de peste 98% cuvinte recunoscute corect, cuvintele nerecunoscute constituind excepţii care nu au fost încă introduse în setul de reguli. Aceste rezultate arată completitudinea setului de reguli proiectat, precum şi viabilitatea metodei propuse de autor. Pentru testarea analizorului a fost creată o aplicaţie în limbajul Visual C++, în care s-a integrat modulul de analiză generat prin LEX pe baza setului de reguli prezentat. În figura 6.16 se poate observa interfaţa aplicaţiei în care cuvintele cu sintaxă incorectă sunt puse în evidenţă faţă de restul textului : Figura 6.16. Interfaţa aplicaţiei de analiză automată de sintaxă
- Page 168 and 169: 150 Cap. 4. Analiza semnalului voca
- Page 170 and 171: c) În faza de etichetare s-a mers
- Page 172 and 173: 154 Cap. 4. Analiza semnalului voca
- Page 174 and 175: 156 Cap. 5. Sinteza de voce Aşa cu
- Page 176 and 177: 158 Cap. 5. Sinteza de voce Metodel
- Page 178 and 179: 160 Cap. 5. Sinteza de voce Urmeaz
- Page 180 and 181: 6. Metode de sinteză de voce 6.1.
- Page 182 and 183: 164 Cap. 6. Metode de sinteză de v
- Page 184 and 185: 166 Cap. 6. Metode de sinteză de v
- Page 186 and 187: 168 Cap. 6. Metode de sinteză de v
- Page 188 and 189: 170 Cap. 6. Metode de sinteză de v
- Page 190 and 191: 172 Cap. 6. Metode de sinteză de v
- Page 192 and 193: x(t) x1(t) x2(t) x1(t) x2(t) X1(t)
- Page 194 and 195: 6.3.2. Metoda bazată pe corpus 176
- Page 196 and 197: 178 Cap. 6. Metode de sinteză de v
- Page 198 and 199: Cost 180 Cap. 6. Metode de sinteză
- Page 200 and 201: 6.3.2.5. Algoritmul metodei de sint
- Page 202 and 203: Fiecare fază cuprinde mai multe et
- Page 204 and 205: 186 Cap. 6. Metode de sinteză de v
- Page 206 and 207: cat(Cuvint,term[nrcif]); if(nrcif>0
- Page 208 and 209: TEXT Forma flexionată Figura 6.13.
- Page 210 and 211: 192 Cap. 6. Metode de sinteză de v
- Page 212 and 213: 194 Cap. 6. Metode de sinteză de v
- Page 214 and 215: {LIT}+(le|lui)/{SEP} {/*peştele*/
- Page 216 and 217: {LIT}+{CONS}e/{SEP} {/* merge */ Ca
- Page 220 and 221: 202 Cap. 6. Metode de sinteză de v
- Page 222 and 223: 204 Cap. 6. Metode de sinteză de v
- Page 224 and 225: silaba: SILABA { ProcesareSilaba($1
- Page 226 and 227: 208 Cap. 6. Metode de sinteză de v
- Page 228 and 229: 210 Cap. 6. Metode de sinteză de v
- Page 230 and 231: 212 Cap. 6. Metode de sinteză de v
- Page 232 and 233: 214 Cap. 6. Metode de sinteză de v
- Page 234 and 235: 216 Cap. 6. Metode de sinteză de v
- Page 236 and 237: 218 Cap. 6. Metode de sinteză de v
- Page 238 and 239: 220 Cap. 6. Metode de sinteză de v
- Page 240 and 241: 222 Cap. 6. Metode de sinteză de v
- Page 242 and 243: -----------------------------------
- Page 244 and 245: 6.4.6. Proiectarea bazei de date vo
- Page 246 and 247: 228 Cap. 6. Metode de sinteză de v
- Page 248 and 249: 6.4.6.3. Organizarea bazei de date
- Page 250 and 251: 232 Cap. 6. Metode de sinteză de v
- Page 252 and 253: silabă conţinând litera ă silab
- Page 254 and 255: 236 Cap. 6. Metode de sinteză de v
- Page 256 and 257: 238 Cap. 6. Metode de sinteză de v
- Page 258 and 259: 240 Cap. 6. Metode de sinteză de v
- Page 260 and 261: 7. Realizarea sistemului de sintez
- Page 262 and 263: Figura 7.2. Sistemul de sinteză a
- Page 264 and 265: 1) Crearea listei de silabe Cap. 7.
- Page 266 and 267: Cap. 7. Proiectarea sistemului de s
200<br />
Cap. 6. Metode de sinteză de voce<br />
În setul de reguli prezentat, categoria gramaticală propusă de analizor (substantiv cu o<br />
anumită declinare, verb într-o anumită conjugare, etc.) se poate specifica în trei moduri distincte:<br />
a) implicit prin apelul unei primitive specifice pentru acea categorie, de exemplu :<br />
CautVerbMaiMultCaPerf(term, str) =><br />
P.v.=’VERB’; Timp=’MMCP’<br />
b) primul parametru al primitivei Caut / Caută , de exemplu :<br />
Caut(V_CONJ, len, str) =><br />
P.v.=’VERB’; Timp=’CONJUNCTIV’<br />
c) prin folosirea variabilei TipLex, care rescrie categoria gramaticală în modul<br />
specificat:<br />
TipLex=’sf’ => P.v.=’SUBST’; Gen=’FEM’<br />
În plus, pentru categoriile gramaticale neflexionate (cum ar fi pronume, adverbe,<br />
conjuncţii, interjecţii, verbe la infinitiv, substantive nearticulate) s-a introdus o regulă generală<br />
care caută acea formă direct în dicţionar, fără a mai urmări înlocuirea terminaţiei ca în modul<br />
flexionat:<br />
{LIT}+/{SEP} {/* Se caută cuvântul întreg neflexionat */<br />
Caut(GENERIC,0,"");<br />
}<br />
Desigur că aici nu au fost prezentate explicit regulile de flexionare ale limbii române<br />
pentru fiecare categorie gramaticală, pentru aceasta este de dorit a se consulta bibliografia<br />
indicată [Gra08].<br />
Cu privire la setul de reguli pentru analiza sintaxei prezentat în acest capitol, se poate<br />
face observaţia că au fost cuprinse în acest set categoriile gramaticale de bază, nu şi cele a căror<br />
formă nu se schimbă faţă de categoria principală de bază.<br />
Astfel, pentru categoria Substantiv declinările pentru cazul Dativ şi Genitiv sunt identice,<br />
ambele situaţii fiind memorate ca Dativ :<br />
Articol : Hotărât Nehotărât<br />
Dativ: ‘am dat fetei caietul’ ‘am dat unei fete caietul’<br />
Genitiv : ‘caietul fetei’ ‘caietul unei fete’<br />
De asemeni forma la Acuzativ este identică cu forma de Nominativ a substantivului :<br />
Articol : Hotărât Nehotărât<br />
Nominativ: ‘fata se plimba ’ ‘o fată se plimba ’<br />
Acuzativ : ‘mă plimbam cu fata’ ‘mă plimbam cu o fată’<br />
În cazul verbului, Imperativul are aceeaşi formă cu Prezentul :<br />
Singular Plural<br />
Imperativ: ‘Vorbeşte mai încet! ’ Imperativ : ‘Vorbiţi mai tare !’<br />
Prez. Pers. 3: ‘el vorbeşte încet’ Prez. Pers. 2: ‘voi vorbiţi tare’