2007-levicka-terminologicke implementacie.pdf - Slovenský národný ...

2007-levicka-terminologicke implementacie.pdf - Slovenský národný ... 2007-levicka-terminologicke implementacie.pdf - Slovenský národný ...

korpus.juls.savba.sk
from korpus.juls.savba.sk More from this publisher
18.07.2013 Views

ad hoc excerpcie. TDB si vyžaduje neustálu kontrolu a aktualizáciu, ktorá by nebola možná bez textovej dokumentácie v podobe súvislých, počítačovo spracovaných a lingvisticky označkovaných textov. Sager (1990:131) ich považuje za jediný spoľahlivý indikátor zmien významu, kolokability a frekvencie používania termínu a zároveň za predpoklad pre revíziu terminologických záznamov. V súčasnosti sa pri tvorbe terminologickej databázy upriamuje pozornosť na niekoľko kľúčových okruhov: 1. výber textových zdrojov na získanie termínov, 7. voľbu, prípadne zostavenie, klasifikačnej štruktúry, 8. výber jednotlivých položiek terminologického záznamu, 9. zloženie tímu terminológov. Selekcia relevantných primárnych a sekundárnych zdrojov vzhľadom na zvolený cieľ predstavuje základný predpoklad na vytvorenie kvalitného odborného korpusu, z ktorého sa na základe príslušného softvéru extrahujú potenciálne terminologické jednotky (Slodzianová ich nazýva termes-candidats). V posledných rokoch sa z korpusov získavajú automaticky aj definície a lexikálne vzťahy pomocou softvérových nástrojov z oblasti počítačovej lingvistiky. Získané extrahované údaje sa porovnávajú s existujúcimi glosármi a slovníkmi a zároveň sa predložia na posúdenie odborníkom, vďaka čomu možno zostaviť konečný heslár a identifikovať vzťahy medzi extrahovanými termínmi. Podľa Bourigaulta môže v rámci terminologického projektu nasledovať aj vytvorenie vlastnej ontológie 44 . V samotnej realizačnej etape sa heslár rozdelí na tematické podskupiny a začína sa vypracúvanie jednotlivých záznamov aj pomocou konkordančných korpusových nástrojov (pozri Bourigault 2000 – 2004) 45 . Hotové záznamy napokon čaká niekoľkonásobná revízia tímom redaktorov a supervízorov (pozri Schwarz 2003). spracovaný a prístupný súbor jazykových dát v štandardizovanom formáte, t.j. jednotlivých foriem a textových celkov alebo vzoriek písaného a hovoreného jazyka, cielene zhromaždených ako referenčný zdroj pre vedecké štúdium jazyka a spracovanie úžitkových jazykových nástrojov, príručiek a iných artefaktov. (Čermák 1995:52) 44 Pojem a termín „ontológia“ vznikol najprv v znalostnom inžinierstve na začiatku 90-tych rokov. Podľa Gilliama sa používa na označenie počítačovo čitateľnej reprezentácie informácií o svete v takej forme, ktorú možno prepracovať. Tvorí sa ako súbor pojmov, štrukturovaný pomocou vzťahov, pričom kľúčovým z nich je vzťah is-a, na základe ktorého sa tvorí taxonomická konštrukcia ontológie. Bourigault (2002) upozorňuje, že podoba ontológie závisí od jej tvorcu. 45 TERMINAE – prvý „progiciel“ (softvér pre profesionálov) na získavanie terminológie z korpusu, vytvorený na Université du Québec roku 1990. Funguje na báze morfosyntaktickej analýzy, pričom extrahuje len nominálne syntagmy. Okrem iného sa využíva aj na tvorbu a správu terminologickej banky. Strana 56

Databázy uvádzajú pri heslovom termíne predovšetkým definíciu, oblasť zaradenia, kompletný súpis lingvistickej informácie a zdroj. Poznámky týkajúce sa používania termínov v súčasných TDB naznačujú odklon od preskriptívnej terminológie a nechávajú voľnú ruku používateľom, aby sami zvážili použitie toho ktorého termínu v konkrétnej situácii. Ideálne naplnený multifunkčný terminologický záznam by mal obsahovať niekoľko podskupín: 1. heslový termín, 10. lingvistická špecifikácia termínu – minimálna (skratky a varianty) alebo rozšírená (morfologické a syntaktické poznámky), 11. sémantická a pojmová špecifikácia termínu (definícia, oblasť, rozsah použitia, synonymá, antonymá, vzťah k príbuzným pojmom prostredníctvom terminologických vzťahov – kognitívny kontext), 12. doplnkové informácie o textovom správaní termínu – poznámky a príklady kontextového použitia, 13. informáciu o zdroji všetkých excerpovaných informácií, 14. informáciu o zaradení termínu do databázy – dátum, terminológ, 15. ekvivalent alebo ekvivalenty v cudzom jazyku spolu s charakteristikou ich kontextového použitia. Pri dvoj- a viac jazyčných databázach sa predpokladá zaznamenanie definície pri každom z ekvivalentných termínov. Ak tieto definície vykazujú menšie rozdiely, termíny predstavujú len čiastočné ekvivalenty a v tom prípade sa hovorí o jednosmernej TDB. Obojstrannosť databáz je pritom v organizáciách ako Európska únia či v prípade viacjazykových spoločenstiev (napríklad v Kanade – TDB Termium) nevyhnutnosťou. Nakoniec ešte raz zhrnieme výhody TDB: nepomerne väčší počet termínov možno uchovať na malom priestore, možnosť paralelného využívania terminologických záznamov takmer neobmedzeným počtom používateľov (prostredníctvom internetu, diskiet, nosičov CD-ROM alebo tlače), jednoduchá obsluha a aktualizácia a najmä rýchlosť prenosu. Pre terminografiu má veľký význam možnosť generovať z jednej TDB rôzne typy terminologických slovníkov s rôzne obsiahlou štruktúrou hesla a heslovej state. Strana 57

Databázy uvádzajú pri heslovom termíne predovšetkým definíciu, oblasť<br />

zaradenia, kompletný súpis lingvistickej informácie a zdroj. Poznámky týkajúce sa<br />

používania termínov v súčasných TDB naznačujú odklon od preskriptívnej terminológie<br />

a nechávajú voľnú ruku používateľom, aby sami zvážili použitie toho ktorého termínu<br />

v konkrétnej situácii.<br />

Ideálne naplnený multifunkčný terminologický záznam by mal obsahovať<br />

niekoľko podskupín:<br />

1. heslový termín,<br />

10. lingvistická špecifikácia termínu – minimálna (skratky a varianty) alebo<br />

rozšírená (morfologické a syntaktické poznámky),<br />

11. sémantická a pojmová špecifikácia termínu (definícia, oblasť, rozsah použitia,<br />

synonymá, antonymá, vzťah k príbuzným pojmom prostredníctvom<br />

terminologických vzťahov – kognitívny kontext),<br />

12. doplnkové informácie o textovom správaní termínu – poznámky a príklady<br />

kontextového použitia,<br />

13. informáciu o zdroji všetkých excerpovaných informácií,<br />

14. informáciu o zaradení termínu do databázy – dátum, terminológ,<br />

15. ekvivalent alebo ekvivalenty v cudzom jazyku spolu s charakteristikou ich<br />

kontextového použitia.<br />

Pri dvoj- a viac jazyčných databázach sa predpokladá zaznamenanie definície pri<br />

každom z ekvivalentných termínov. Ak tieto definície vykazujú menšie rozdiely,<br />

termíny predstavujú len čiastočné ekvivalenty a v tom prípade sa hovorí o jednosmernej<br />

TDB. Obojstrannosť databáz je pritom v organizáciách ako Európska únia či v prípade<br />

viacjazykových spoločenstiev (napríklad v Kanade – TDB Termium) nevyhnutnosťou.<br />

Nakoniec ešte raz zhrnieme výhody TDB: nepomerne väčší počet termínov<br />

možno uchovať na malom priestore, možnosť paralelného využívania terminologických<br />

záznamov takmer neobmedzeným počtom používateľov (prostredníctvom internetu,<br />

diskiet, nosičov CD-ROM alebo tlače), jednoduchá obsluha a aktualizácia a najmä<br />

rýchlosť prenosu. Pre terminografiu má veľký význam možnosť generovať z jednej<br />

TDB rôzne typy terminologických slovníkov s rôzne obsiahlou štruktúrou hesla a<br />

heslovej state.<br />

Strana 57

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!