20.06.2013 Views

Java e Shkencës 2012 - Universiteti i Prishtinës

Java e Shkencës 2012 - Universiteti i Prishtinës

Java e Shkencës 2012 - Universiteti i Prishtinës

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

KONFERENCA VJETORE E SHKENCËS ‘JAVA E SHKENCËS <strong>2012</strong><br />

Agni DIKA, nebi CAKA, Adnan MAXHUNI, Avni REXHEPI, Kadri SYLEJMANI,<br />

Haxhi LAJQI 1 : PRINCIPET BAZIKE PËR SINTETIZIMIN E TË FOLURIT<br />

PËRMES KOMPJUTERIT TË TEKSTEVE TË SHKRUARA NË GJUHËN SHQIPE<br />

1 Fakulteti i Inxhinierisë Elektrike dhe Kompjuterike, <strong>Universiteti</strong> i <strong>Prishtinës</strong><br />

Abstrakti<br />

Me sintezimin e të folurit nënkuptohet procesi i gjenerimit artificial të të folurit nga<br />

tekstet e shkruara. Përpjekjet për gjenerimin artificial të të folurit janë shumë të hershme, gjë<br />

që ndërlidhet me mundësitë e përdorimit të tij për qëllime të ndryshme. Gjenerimi në fjalë ka<br />

një rëndësi të veçantë për njerëzit e hendikepuar në të pamur, për përdorim në lojrat e<br />

ndryshme për fëmijë, në gjenerimin e numrave në mesazhet e ndryshme telefonike, si dhe në<br />

shumë raste tjera të jetës së përditshme. Procesi i konvertimit të tekstit të shkruar në të folur,<br />

në punime të ndryshme shkurt njihet si TTS (nga Text-To-Speech).<br />

Ky punim ka për qëllim prezentimin e principeve bazë mbi të cilët do të mbështetet<br />

algoritmi për gjenerimin e të folurit nga tekstet e shkruara në gjuhën shqipe 262 . Aktualisht,<br />

për disa gjuhë të mëdha botërore ekzistojnë zgjidhje për konvertimin e teksteve në të folur.<br />

Kurse për gjuhën shqipe ekzistojnë punime përmes të cilave janë prezentuar ide për zgjidhje<br />

të këtij problemi, pa dhënë një zgjidhje finale. Përdorimi i platformave ekzistuese në internet<br />

për gjuhë të tjera, në bazë të hulumtimeve tona, nuk japin rezultate të kënaqshme edhe për<br />

gjuhën shqipe. Një përafrim më i dukshëm vërehet nëse si gjuhë bazë merret gjuha italiane.<br />

Derisa kuptueshmëria e fjalëve plotësonë një lloj pragu minimal, natyraliteti është shumë<br />

larg të të folurit shqip. Konvertimi i numrave është diç më i natyrshëm. Edhe versioni i cili<br />

ofrohet në kuadër të Google Translate, është me qartësi të kufizuar dhe jonatyror. Kjo është<br />

si rezultat i asaj se gjuhët i kanë specifikat e tyre dhe përputhet me konstatimin që haset në<br />

punime të ndryshme se për secilën gjuhë (apo së paku për secilën familje gjuhësh) duhet<br />

gjetur zgjidhje të veçantë.<br />

Shumica e zgjidhjeve për gjuhë të ndryshme bazohen në metodën e bashkimit të<br />

segmenteve akustike (zanore), të ruajtura paraprakisht në një bazë të dhënash. Si segmente<br />

akustike mund të merren fjalët, rrokjet, grupe shkronjash, shkronja, etj. Pastaj, përmes<br />

262 Ky punim ndërlidhet me projektin shkencor “Konvertimi automatik në të folur i teksteve të shkruara në gjuhën<br />

shqipe”, që financohet nga Ministria e Arsimit, <strong>Shkencës</strong> dhe Tekonologjisë së Kosovës.<br />

~ 343 ~

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!