13.07.2015 Views

Zásady spracovania slovníka kolokácií slovenského jazyka - vronk.net

Zásady spracovania slovníka kolokácií slovenského jazyka - vronk.net

Zásady spracovania slovníka kolokácií slovenského jazyka - vronk.net

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

výskytu dvoch slov spolu a výskytu každého z nich nezávisle. Tento test je vhodný aj na zisťovaniezriedkavejších kolokácií. Zisťovať sa bude aj tzv. miera kontrastu (t-score), ktorá je založená narozdiele medzi pozorovaným a predpokladaným výsledkom a test určuje mieru kolokability prvku"a" a "b" vzhľadom na absolútny výskyt prvkov "a" a "b" v korpuse. Tieto dáta budú východiskomna tvorbu databázy kolokácií v slovenčine. Všetky výpočty budú archivované. Samozrejme, žiadnametóda nedokáže zistiť všetky typy kolokácií, rôzne štatistické miery sú vhodné na zisťovanierôznych typov kolokácií, preto je nevyhnutná ich kombinácia a v konečnom dôsledku jenevyhnutná lingvistická analýza a ručné triedenie.Štruktúrne typy kolokáciíZákladnou, resp. minimálnou kolokačnou štruktúrou je bigram. Pri stanovení štruktúrnych typovkolokácií vychádzame z dvojčlennej kombinácie hlavných slovných druhov podstatné meno (S),sloveso (V), adjektívum (ADJ) a adverbium (ADV) a potenciálnych binárných kombinácií ichparadigmatických tvarov.Pri podstatnom mene ako kolokačnej báze je šturktúra členenia podľa kategórie pádu a čísla akolokačnými partnermi sú S, V, ADJ, ADV. Ako regulárny výraz možeme tento vzťah zapísaťnasledovne (s tým, že pri konkrétnej analýze pochopiteľne pracujeme aj so zmenou poradia aintervalu prvkov):S.* [S.* | V.* | A.* | D.*]Pri slovese členíme kolokačnú bázu podľa kategórie osoby a čísla a kolokačnými partnermi sú S,V, ADJ, ADV. V podobe regulárneho výrazu ide o nasledovný vztah:V.* [S.* | V.* | A.* | D.*]Triediacou kategóriou kolokačnej bázy v prípade adjektíva je pád. Kolokačnými partnermi sú S, V,ADJ, ADV. Osobitosťou pri adjektíve sú predložky. V navrhovanej kolokačnej tabuľke ich všakzahŕňame pod spoločný súhrnný pojem ATR, kde sú adjektíva, zámená a aj predložky.Zjednodušuje a zjednocuje to kolokačnú tabuľku a triediacu šablónu. Regulárny výraz pre danýkolokačný vzťah má nasledovný tvar:A.* [S.* | V.* | A.* | D.* | E.*]Triediacou kategóriou kolokačnej bázy adverbia môže byť stupeň. Kolokačnými partnermi sú S,ADJ, V, ADV a osobitosťou tu je zťah k zámenám. V podobe regulárneho výrazu môžme vzťahyzapísať nasledovne:D.* [S.* | V.* | A.* | D.* | P.*]41

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!