15.06.2013 Views

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

Teza doctorat (pdf) - Universitatea Tehnică

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

5. Sinteza de voce<br />

5.1. Modelul general al sintezei vorbirii<br />

Sinteza vorbirii presupune generarea automată a vorbirii de către un sistem automat. Din<br />

punct de vedere al realizării fizice, sinteza de voce poate fi implementată atât pe un calculator cât<br />

şi pe diverse dispozitive electronice sau de telecomunicaţii prin componente dedicate (circuite<br />

integrate, circuite programabile, microcontroler, etc.).<br />

Există două concepte de bază ce definesc sistemele de sinteză a vocii: conversia textrostire<br />

(sistemele text-to-speech), şi sinteza propriu-zisă a vorbirii. Sistemele text-to-speech<br />

(figura 5.1) pornesc de la un text de sintetizat, parcurg o fază de analiză lexicală în care sunt<br />

determinate unităţile lexicale componente (prop oziţii, cuvinte, silabe, foneme), apoi pe baza<br />

acestor unităţi lexicale vor fi generaţi anumiţi parametri acustici care vor fi utilizaţi în generarea<br />

vorbirii [Bur96].<br />

Analiză<br />

Generare<br />

Text Rostire<br />

lexicală<br />

parametri<br />

Figura 5.1. Sistem de sinteză a vorbirii pornind de la text<br />

Ultima etapă procesuală din cadrul sistemului text-to-speech, şi anume generarea rostirii<br />

pe baza parametrilor acustici, reprezintă sinteza de voce propriu-zisă. Sistemele sintetizatoare de<br />

voce diferă deci de sistemele text-to-speech prin faptul că primele utilizează la intrare nu direct<br />

textul de sintetizat, ci parametrii acustici pe baza cărora va fi posibilă generarea rostirii.<br />

Există două faze principale în cadrul procesului de sinteză a vorbirii:<br />

1. Faza de analiză, ce presupune înregistrarea, codificarea şi parametrizarea unor unităţi<br />

acustice într-o bază de date vocală. Unităţile acustice pe baza cărora se va realiza sinteza unui<br />

text sau a unei rostiri se preiau în general dintr-o rostire preliminară a unui vorbitor.<br />

2. Faza de sinteză reprezintă sinteza propriu-zisă a vorbirii: se porneşte de la un text care<br />

se prelucrează şi apoi se generează semnalul vocal pe baza cunoştinţelor înmagazinate a-priori în<br />

baza de date vocală.<br />

Aceste două faze din cadrul procesului de sinteză a vorbirii sunt ilustrate în figurile<br />

următoare. Prima fază – faza de analiză – este ilustrată în figura 5.2:<br />

Rostire<br />

Segmentare<br />

Unităţi<br />

acustice<br />

Codificare -<br />

Parametrizare<br />

Figura 5.2. Faza de analiză din cadrul sintezei vorbirii<br />

155<br />

Unităţi acustice<br />

codificate sau<br />

parametrizate<br />

Înregistrare<br />

date<br />

Baza de<br />

date vocală

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!