2007-levicka-terminologicke implementacie.pdf - Slovenský národný ...

2007-levicka-terminologicke implementacie.pdf - Slovenský národný ... 2007-levicka-terminologicke implementacie.pdf - Slovenský národný ...

korpus.juls.savba.sk
from korpus.juls.savba.sk More from this publisher
18.07.2013 Views

ad hoc excerpcie. TDB si vyžaduje neustálu kontrolu a aktualizáciu, ktorá by nebola možná bez textovej dokumentácie v podobe súvislých, počítačovo spracovaných a lingvisticky označkovaných textov. Sager (1990:131) ich považuje za jediný spoľahlivý indikátor zmien významu, kolokability a frekvencie používania termínu a zároveň za predpoklad pre revíziu terminologických záznamov. V súčasnosti sa pri tvorbe terminologickej databázy upriamuje pozornosť na niekoľko kľúčových okruhov: 1. výber textových zdrojov na získanie termínov, 7. voľbu, prípadne zostavenie, klasifikačnej štruktúry, 8. výber jednotlivých položiek terminologického záznamu, 9. zloženie tímu terminológov. Selekcia relevantných primárnych a sekundárnych zdrojov vzhľadom na zvolený cieľ predstavuje základný predpoklad na vytvorenie kvalitného odborného korpusu, z ktorého sa na základe príslušného softvéru extrahujú potenciálne terminologické jednotky (Slodzianová ich nazýva termes-candidats). V posledných rokoch sa z korpusov získavajú automaticky aj definície a lexikálne vzťahy pomocou softvérových nástrojov z oblasti počítačovej lingvistiky. Získané extrahované údaje sa porovnávajú s existujúcimi glosármi a slovníkmi a zároveň sa predložia na posúdenie odborníkom, vďaka čomu možno zostaviť konečný heslár a identifikovať vzťahy medzi extrahovanými termínmi. Podľa Bourigaulta môže v rámci terminologického projektu nasledovať aj vytvorenie vlastnej ontológie 44 . V samotnej realizačnej etape sa heslár rozdelí na tematické podskupiny a začína sa vypracúvanie jednotlivých záznamov aj pomocou konkordančných korpusových nástrojov (pozri Bourigault 2000 – 2004) 45 . Hotové záznamy napokon čaká niekoľkonásobná revízia tímom redaktorov a supervízorov (pozri Schwarz 2003). spracovaný a prístupný súbor jazykových dát v štandardizovanom formáte, t.j. jednotlivých foriem a textových celkov alebo vzoriek písaného a hovoreného jazyka, cielene zhromaždených ako referenčný zdroj pre vedecké štúdium jazyka a spracovanie úžitkových jazykových nástrojov, príručiek a iných artefaktov. (Čermák 1995:52) 44 Pojem a termín „ontológia“ vznikol najprv v znalostnom inžinierstve na začiatku 90-tych rokov. Podľa Gilliama sa používa na označenie počítačovo čitateľnej reprezentácie informácií o svete v takej forme, ktorú možno prepracovať. Tvorí sa ako súbor pojmov, štrukturovaný pomocou vzťahov, pričom kľúčovým z nich je vzťah is-a, na základe ktorého sa tvorí taxonomická konštrukcia ontológie. Bourigault (2002) upozorňuje, že podoba ontológie závisí od jej tvorcu. 45 TERMINAE – prvý „progiciel“ (softvér pre profesionálov) na získavanie terminológie z korpusu, vytvorený na Université du Québec roku 1990. Funguje na báze morfosyntaktickej analýzy, pričom extrahuje len nominálne syntagmy. Okrem iného sa využíva aj na tvorbu a správu terminologickej banky. Strana 56

Databázy uvádzajú pri heslovom termíne predovšetkým definíciu, oblasť zaradenia, kompletný súpis lingvistickej informácie a zdroj. Poznámky týkajúce sa používania termínov v súčasných TDB naznačujú odklon od preskriptívnej terminológie a nechávajú voľnú ruku používateľom, aby sami zvážili použitie toho ktorého termínu v konkrétnej situácii. Ideálne naplnený multifunkčný terminologický záznam by mal obsahovať niekoľko podskupín: 1. heslový termín, 10. lingvistická špecifikácia termínu – minimálna (skratky a varianty) alebo rozšírená (morfologické a syntaktické poznámky), 11. sémantická a pojmová špecifikácia termínu (definícia, oblasť, rozsah použitia, synonymá, antonymá, vzťah k príbuzným pojmom prostredníctvom terminologických vzťahov – kognitívny kontext), 12. doplnkové informácie o textovom správaní termínu – poznámky a príklady kontextového použitia, 13. informáciu o zdroji všetkých excerpovaných informácií, 14. informáciu o zaradení termínu do databázy – dátum, terminológ, 15. ekvivalent alebo ekvivalenty v cudzom jazyku spolu s charakteristikou ich kontextového použitia. Pri dvoj- a viac jazyčných databázach sa predpokladá zaznamenanie definície pri každom z ekvivalentných termínov. Ak tieto definície vykazujú menšie rozdiely, termíny predstavujú len čiastočné ekvivalenty a v tom prípade sa hovorí o jednosmernej TDB. Obojstrannosť databáz je pritom v organizáciách ako Európska únia či v prípade viacjazykových spoločenstiev (napríklad v Kanade – TDB Termium) nevyhnutnosťou. Nakoniec ešte raz zhrnieme výhody TDB: nepomerne väčší počet termínov možno uchovať na malom priestore, možnosť paralelného využívania terminologických záznamov takmer neobmedzeným počtom používateľov (prostredníctvom internetu, diskiet, nosičov CD-ROM alebo tlače), jednoduchá obsluha a aktualizácia a najmä rýchlosť prenosu. Pre terminografiu má veľký význam možnosť generovať z jednej TDB rôzne typy terminologických slovníkov s rôzne obsiahlou štruktúrou hesla a heslovej state. Strana 57

ad hoc excerpcie. TDB si vyžaduje neustálu kontrolu a aktualizáciu, ktorá by nebola<br />

možná bez textovej dokumentácie v podobe súvislých, počítačovo spracovaných<br />

a lingvisticky označkovaných textov. Sager (1990:131) ich považuje za jediný<br />

spoľahlivý indikátor zmien významu, kolokability a frekvencie používania termínu<br />

a zároveň za predpoklad pre revíziu terminologických záznamov.<br />

V súčasnosti sa pri tvorbe <strong>terminologicke</strong>j databázy upriamuje pozornosť na<br />

niekoľko kľúčových okruhov:<br />

1. výber textových zdrojov na získanie termínov,<br />

7. voľbu, prípadne zostavenie, klasifikačnej štruktúry,<br />

8. výber jednotlivých položiek terminologického záznamu,<br />

9. zloženie tímu terminológov.<br />

Selekcia relevantných primárnych a sekundárnych zdrojov vzhľadom na zvolený<br />

cieľ predstavuje základný predpoklad na vytvorenie kvalitného odborného korpusu,<br />

z ktorého sa na základe príslušného softvéru extrahujú potenciálne terminologické<br />

jednotky (Slodzianová ich nazýva termes-candidats). V posledných rokoch sa<br />

z korpusov získavajú automaticky aj definície a lexikálne vzťahy pomocou<br />

softvérových nástrojov z oblasti počítačovej lingvistiky. Získané extrahované údaje sa<br />

porovnávajú s existujúcimi glosármi a slovníkmi a zároveň sa predložia na<br />

posúdenie odborníkom, vďaka čomu možno zostaviť konečný heslár a identifikovať<br />

vzťahy medzi extrahovanými termínmi. Podľa Bourigaulta môže v rámci<br />

terminologického projektu nasledovať aj vytvorenie vlastnej ontológie 44 . V samotnej<br />

realizačnej etape sa heslár rozdelí na tematické podskupiny a začína sa vypracúvanie<br />

jednotlivých záznamov aj pomocou konkordančných korpusových nástrojov<br />

(pozri Bourigault 2000 – 2004) 45 . Hotové záznamy napokon čaká niekoľkonásobná<br />

revízia tímom redaktorov a supervízorov (pozri Schwarz 2003).<br />

spracovaný a prístupný súbor jazykových dát v štandardizovanom formáte, t.j.<br />

jednotlivých foriem a textových celkov alebo vzoriek písaného a hovoreného<br />

jazyka, cielene zhromaždených ako referenčný zdroj pre vedecké štúdium jazyka<br />

a spracovanie úžitkových jazykových nástrojov, príručiek a iných artefaktov.<br />

(Čermák 1995:52)<br />

44 Pojem a termín „ontológia“ vznikol najprv v znalostnom inžinierstve na<br />

začiatku 90-tych rokov. Podľa Gilliama sa používa na označenie počítačovo<br />

čitateľnej reprezentácie informácií o svete v takej forme, ktorú možno<br />

prepracovať. Tvorí sa ako súbor pojmov, štrukturovaný pomocou vzťahov, pričom<br />

kľúčovým z nich je vzťah is-a, na základe ktorého sa tvorí taxonomická<br />

konštrukcia ontológie. Bourigault (2002) upozorňuje, že podoba ontológie<br />

závisí od jej tvorcu.<br />

45 TERMINAE – prvý „progiciel“ (softvér pre profesionálov) na získavanie<br />

terminológie z korpusu, vytvorený na Université du Québec roku 1990. Funguje<br />

na báze morfosyntaktickej analýzy, pričom extrahuje len nominálne syntagmy.<br />

Okrem iného sa využíva aj na tvorbu a správu <strong>terminologicke</strong>j banky.<br />

Strana 56

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!