26.08.2013 Views

Euskaltzaindia : ekin eta jarrai (PDF, 33,9 MB)

Euskaltzaindia : ekin eta jarrai (PDF, 33,9 MB)

Euskaltzaindia : ekin eta jarrai (PDF, 33,9 MB)

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

180<br />

BATZORDEAK. EGITASMOAK. LANTALDEAK<br />

Andoni Sagarna<br />

Lexikoaren Behatokia<br />

egitasmoaren zuzendaria<br />

Behatokia<br />

Zuzendaria: Iker sailburua (Andoni Sagarna). Teknikariak: Hitzarmen bidez<br />

(UZEI, Elhuyar, IXA).<br />

“<br />

Gaur egun, hizkuntza bati buruzko ikerk<strong>eta</strong>k hizkuntza horren erabileran<br />

oinarritzen dira. Erabilera ezagutzeko, hizkuntza horr<strong>eta</strong>n idatzitako testumasa<br />

handiak biltzen dira —corpusak— <strong>eta</strong> dauzkaten hitzak, esapideak <strong>eta</strong><br />

abar haiek dituzten ezaugarri linguistikoez markatzen dira. Lexikoaren<br />

Behatokia gaur egungo euskara nolakoa den <strong>eta</strong> nola aldatzen ari den<br />

ezagutzea ahalbidetuko digun corpusa da. Bereziki komunikabide<strong>eta</strong>ko <strong>eta</strong><br />

prosa arrunteko erabilera edukiko du.<br />

..............................<br />

Egitasmoaren ezaugarri teknikoak 2007an zehaztu ziren <strong>eta</strong> bost urterako<br />

plan bat egin zen. 2008ko udaberrian jarri zen plan hori abian. Lehenbizi<br />

azpiegitura tekniko guztia prestatu behar zen, komunikabide batzu<strong>ekin</strong><br />

hitzarmenak egin dira horiek ekoizten dituzten testuak ikerk<strong>eta</strong>n baliatzeko,<br />

<strong>eta</strong> 2009aren bukaerarako lau milioi testu-hitzeko corpus etik<strong>eta</strong>tu <strong>eta</strong><br />

linguistikoki anotatu bat izango dugu. 2012. urtearen amaierarako, berriz, 49<br />

milioi testu-hitzeko corpusa izango da. <strong>Euskaltzaindia</strong> beste hiru<br />

erakunder<strong>ekin</strong> ari da lan hori egiten: Elhuyar Fundazioar<strong>ekin</strong>, EHUren<br />

Informatika Fakultateko IXA ikerk<strong>eta</strong>-taldear<strong>ekin</strong> <strong>eta</strong> UZEIr<strong>ekin</strong>.<br />

..............................<br />

Bilk<strong>eta</strong> hori guztia egin <strong>eta</strong> automatikoki tratatu ondoren, hainbat ikerk<strong>eta</strong> egin<br />

ahal izango dira, adibidez, ikusi ahal izango da zenbaterainoko eragina duten<br />

<strong>Euskaltzaindia</strong>ren arauek, zer hitz edo adiera berri hasi diren agertzen<br />

euskaraz <strong>eta</strong> abar. Tratamendu automatiko hori ez da %100 akatsik gabea,<br />

beraz hizkuntzalariek berrikusi <strong>eta</strong> zuzendu egin beharko dute makinak<br />

egindakoa. Urrunago begiratuz, berriz, gauza asko daude egiteko, bereziki<br />

corpus hori etengabe eguneratzea <strong>eta</strong>, hizkuntzaren isla zehatza eskain<br />

dezan, gai <strong>eta</strong> generoen arteko oreka lortzea.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!