2007-levicka-terminologicke implementacie.pdf - Slovenský národný ...
2007-levicka-terminologicke implementacie.pdf - Slovenský národný ... 2007-levicka-terminologicke implementacie.pdf - Slovenský národný ...
ad hoc excerpcie. TDB si vyžaduje neustálu kontrolu a aktualizáciu, ktorá by nebola možná bez textovej dokumentácie v podobe súvislých, počítačovo spracovaných a lingvisticky označkovaných textov. Sager (1990:131) ich považuje za jediný spoľahlivý indikátor zmien významu, kolokability a frekvencie používania termínu a zároveň za predpoklad pre revíziu terminologických záznamov. V súčasnosti sa pri tvorbe terminologickej databázy upriamuje pozornosť na niekoľko kľúčových okruhov: 1. výber textových zdrojov na získanie termínov, 7. voľbu, prípadne zostavenie, klasifikačnej štruktúry, 8. výber jednotlivých položiek terminologického záznamu, 9. zloženie tímu terminológov. Selekcia relevantných primárnych a sekundárnych zdrojov vzhľadom na zvolený cieľ predstavuje základný predpoklad na vytvorenie kvalitného odborného korpusu, z ktorého sa na základe príslušného softvéru extrahujú potenciálne terminologické jednotky (Slodzianová ich nazýva termes-candidats). V posledných rokoch sa z korpusov získavajú automaticky aj definície a lexikálne vzťahy pomocou softvérových nástrojov z oblasti počítačovej lingvistiky. Získané extrahované údaje sa porovnávajú s existujúcimi glosármi a slovníkmi a zároveň sa predložia na posúdenie odborníkom, vďaka čomu možno zostaviť konečný heslár a identifikovať vzťahy medzi extrahovanými termínmi. Podľa Bourigaulta môže v rámci terminologického projektu nasledovať aj vytvorenie vlastnej ontológie 44 . V samotnej realizačnej etape sa heslár rozdelí na tematické podskupiny a začína sa vypracúvanie jednotlivých záznamov aj pomocou konkordančných korpusových nástrojov (pozri Bourigault 2000 – 2004) 45 . Hotové záznamy napokon čaká niekoľkonásobná revízia tímom redaktorov a supervízorov (pozri Schwarz 2003). spracovaný a prístupný súbor jazykových dát v štandardizovanom formáte, t.j. jednotlivých foriem a textových celkov alebo vzoriek písaného a hovoreného jazyka, cielene zhromaždených ako referenčný zdroj pre vedecké štúdium jazyka a spracovanie úžitkových jazykových nástrojov, príručiek a iných artefaktov. (Čermák 1995:52) 44 Pojem a termín „ontológia“ vznikol najprv v znalostnom inžinierstve na začiatku 90-tych rokov. Podľa Gilliama sa používa na označenie počítačovo čitateľnej reprezentácie informácií o svete v takej forme, ktorú možno prepracovať. Tvorí sa ako súbor pojmov, štrukturovaný pomocou vzťahov, pričom kľúčovým z nich je vzťah is-a, na základe ktorého sa tvorí taxonomická konštrukcia ontológie. Bourigault (2002) upozorňuje, že podoba ontológie závisí od jej tvorcu. 45 TERMINAE – prvý „progiciel“ (softvér pre profesionálov) na získavanie terminológie z korpusu, vytvorený na Université du Québec roku 1990. Funguje na báze morfosyntaktickej analýzy, pričom extrahuje len nominálne syntagmy. Okrem iného sa využíva aj na tvorbu a správu terminologickej banky. Strana 56
Databázy uvádzajú pri heslovom termíne predovšetkým definíciu, oblasť zaradenia, kompletný súpis lingvistickej informácie a zdroj. Poznámky týkajúce sa používania termínov v súčasných TDB naznačujú odklon od preskriptívnej terminológie a nechávajú voľnú ruku používateľom, aby sami zvážili použitie toho ktorého termínu v konkrétnej situácii. Ideálne naplnený multifunkčný terminologický záznam by mal obsahovať niekoľko podskupín: 1. heslový termín, 10. lingvistická špecifikácia termínu – minimálna (skratky a varianty) alebo rozšírená (morfologické a syntaktické poznámky), 11. sémantická a pojmová špecifikácia termínu (definícia, oblasť, rozsah použitia, synonymá, antonymá, vzťah k príbuzným pojmom prostredníctvom terminologických vzťahov – kognitívny kontext), 12. doplnkové informácie o textovom správaní termínu – poznámky a príklady kontextového použitia, 13. informáciu o zdroji všetkých excerpovaných informácií, 14. informáciu o zaradení termínu do databázy – dátum, terminológ, 15. ekvivalent alebo ekvivalenty v cudzom jazyku spolu s charakteristikou ich kontextového použitia. Pri dvoj- a viac jazyčných databázach sa predpokladá zaznamenanie definície pri každom z ekvivalentných termínov. Ak tieto definície vykazujú menšie rozdiely, termíny predstavujú len čiastočné ekvivalenty a v tom prípade sa hovorí o jednosmernej TDB. Obojstrannosť databáz je pritom v organizáciách ako Európska únia či v prípade viacjazykových spoločenstiev (napríklad v Kanade – TDB Termium) nevyhnutnosťou. Nakoniec ešte raz zhrnieme výhody TDB: nepomerne väčší počet termínov možno uchovať na malom priestore, možnosť paralelného využívania terminologických záznamov takmer neobmedzeným počtom používateľov (prostredníctvom internetu, diskiet, nosičov CD-ROM alebo tlače), jednoduchá obsluha a aktualizácia a najmä rýchlosť prenosu. Pre terminografiu má veľký význam možnosť generovať z jednej TDB rôzne typy terminologických slovníkov s rôzne obsiahlou štruktúrou hesla a heslovej state. Strana 57
- Page 5 and 6: PREDHOVOR Štruktúrna a kontextov
- Page 7 and 8: koncepcie prekladového ekvivalentu
- Page 9 and 10: OBSAH: Doktorandská dizertačná p
- Page 11 and 12: ”Terminológia ide ďalej než li
- Page 13 and 14: prehľade sa budeme podrobnejšie v
- Page 15 and 16: komunikáciu vedcov ako cieľových
- Page 17 and 18: Kým klasická terminologická prá
- Page 19 and 20: Holzemovej (2000:2) „sociotermino
- Page 21 and 22: uspokojiť každého používateľa
- Page 23 and 24: špecializovaný softérový termin
- Page 25 and 26: dôraz na normalizačný aspekt tej
- Page 27 and 28: potrebných na vysvetlenie vzťahu
- Page 29 and 30: vyberá heslá a heslové slová da
- Page 31 and 32: z radov odborníkov, študentov a t
- Page 33 and 34: slúžili termíny ako nástroje kl
- Page 35 and 36: pričom zmena v intenzii pojmu má
- Page 37 and 38: však v terminológii často pojem
- Page 39 and 40: a logický pojem predstavujú dva p
- Page 41 and 42: konkrétne na používateľov, ho c
- Page 43 and 44: Podotýkame, že všetky doterajši
- Page 45 and 46: 1. z lingvistického hľadiska ako
- Page 47 and 48: v súčasnosti najmä korpus, obsah
- Page 49 and 50: a vyhľadávanie terminologických
- Page 51 and 52: eflektovaní Rondeauvho Úvodu do t
- Page 53 and 54: (CAT software), ako je napríklad T
- Page 55: Machová (1995:153) považuje termi
- Page 59 and 60: najpodstatnejšia inovácia, ktorá
- Page 61 and 62: terminologické záznamy sa takmer
- Page 63 and 64: z hľadiska odborného úzu - „no
- Page 65 and 66: Déterminer un champ, en lingusitiq
- Page 67 and 68: variantnosť. Tento stav vyplýva z
- Page 69 and 70: (OP), prípadne onomaziologickými
- Page 71 and 72: Ako neskôr poznamenal Guiraud (197
- Page 73 and 74: v závislosti od skúmaných jazyko
- Page 75 and 76: zvoleného uhla pohľadu, podľa ty
- Page 77 and 78: zvolená obsahová veličina vzťah
- Page 79 and 80: do odborného slovníka, ale aj pri
- Page 81 and 82: lingvistickou operáciou v pravom s
- Page 83 and 84: Ide o tzv. ideálnu definíciu 80 ,
- Page 85 and 86: nadradenému pojmu vo vzťahu inkl
- Page 87 and 88: však, že v praxi sú rozdiely med
- Page 89 and 90: ktorá sa často kombinuje s intenz
- Page 91 and 92: a z terminologického stavebného s
- Page 93 and 94: 28. Funkčnosť - metódy definovan
- Page 95 and 96: uvádzame definície z Viganovho sl
- Page 97 and 98: podradeného pojmu. Úzkostlivé do
- Page 99 and 100: zrekonštruovanie pojmového systé
- Page 101 and 102: Bez ohľadu na nespornú váhu defi
- Page 103 and 104: a) hierarchie - zahŕňajú predov
- Page 105 and 106: zdrojov a využiť aj textové dokl
Databázy uvádzajú pri heslovom termíne predovšetkým definíciu, oblasť<br />
zaradenia, kompletný súpis lingvistickej informácie a zdroj. Poznámky týkajúce sa<br />
používania termínov v súčasných TDB naznačujú odklon od preskriptívnej terminológie<br />
a nechávajú voľnú ruku používateľom, aby sami zvážili použitie toho ktorého termínu<br />
v konkrétnej situácii.<br />
Ideálne naplnený multifunkčný terminologický záznam by mal obsahovať<br />
niekoľko podskupín:<br />
1. heslový termín,<br />
10. lingvistická špecifikácia termínu – minimálna (skratky a varianty) alebo<br />
rozšírená (morfologické a syntaktické poznámky),<br />
11. sémantická a pojmová špecifikácia termínu (definícia, oblasť, rozsah použitia,<br />
synonymá, antonymá, vzťah k príbuzným pojmom prostredníctvom<br />
terminologických vzťahov – kognitívny kontext),<br />
12. doplnkové informácie o textovom správaní termínu – poznámky a príklady<br />
kontextového použitia,<br />
13. informáciu o zdroji všetkých excerpovaných informácií,<br />
14. informáciu o zaradení termínu do databázy – dátum, terminológ,<br />
15. ekvivalent alebo ekvivalenty v cudzom jazyku spolu s charakteristikou ich<br />
kontextového použitia.<br />
Pri dvoj- a viac jazyčných databázach sa predpokladá zaznamenanie definície pri<br />
každom z ekvivalentných termínov. Ak tieto definície vykazujú menšie rozdiely,<br />
termíny predstavujú len čiastočné ekvivalenty a v tom prípade sa hovorí o jednosmernej<br />
TDB. Obojstrannosť databáz je pritom v organizáciách ako Európska únia či v prípade<br />
viacjazykových spoločenstiev (napríklad v Kanade – TDB Termium) nevyhnutnosťou.<br />
Nakoniec ešte raz zhrnieme výhody TDB: nepomerne väčší počet termínov<br />
možno uchovať na malom priestore, možnosť paralelného využívania terminologických<br />
záznamov takmer neobmedzeným počtom používateľov (prostredníctvom internetu,<br />
diskiet, nosičov CD-ROM alebo tlače), jednoduchá obsluha a aktualizácia a najmä<br />
rýchlosť prenosu. Pre terminografiu má veľký význam možnosť generovať z jednej<br />
TDB rôzne typy terminologických slovníkov s rôzne obsiahlou štruktúrou hesla a<br />
heslovej state.<br />
Strana 57