13.07.2015 Views

Zásady spracovania slovníka kolokácií slovenského jazyka - vronk.net

Zásady spracovania slovníka kolokácií slovenského jazyka - vronk.net

Zásady spracovania slovníka kolokácií slovenského jazyka - vronk.net

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

. 1.549 147.9 0.2359 50463si 4.192 136.8 1.474 20941a 1.883 104.9 0.2974 20705na 2.214 102 0.3741 16911do 3.475 106 0.8964 13578by 4.072 105.3 1.356 12545mi 5.361 100.6 3.313 10626to 2.861 86.78 0.5856 10127mu 5.108 96.8 2.78 9938som 3.26 85.82 0.7725 9182aj 2.7 73.95 0.5239 7638čo 3.194 64.87 0.7379 5304aby 3.486 64.57 0.9034 5027sme 3.265 62.33 0.775 4840len 3.556 63.32 0.9484 4789povedať 6.352 67.25 6.585 4636nám 4.805 63.28 2.254 4307jej 3.61 59.65 0.9845 4221im 5.001 62 2.582 4096najavo 8.82 63.65 36.44 4069ho 3.333 57.13 0.8125 4023gól 7.172 54.31 11.62 2991vám 4.972 50.62 2.53 2734ti 5.568 50.25 3.824 2635prednosť 8.595 48.8 31.17 2394pozor 7.692 46.55 16.67 2188dokopy 8.935 45.58 39.47 2086pokoj 7.182 41.52 11.7 1748očakávať 7.808 40.24 18.07 1634robiť 5.346 38.34 3.279 1545poriadku 5.822 37.25 4.561 1438urobiť 5.473 36.68 3.581 1408Boh 5.597 35.49 3.903 1313meno 5.287 34.61 3.147 1262...Ako vidno, štatistické miery nedávajú na prvých miestach kolokácie lexikalizovaného typu, aleskôr typické syntaktické konštrukcie. Ďalším rušivým prvkom je výskyt diakritických znamienokna prvých pozíciách, ktoré však možno pomocou súboru negatívnych filtrov z analýzy vylúčiť.Tým sa aj zabráni nežiaducemu uvádzaniu kombinácií prvkov presahujúcich rámec vety.Nevýhodou je, že všetky štyri získané miery (MI-score, t-score, Rel. f., Abs. f.) poskytnú lenzoznam kolokátov a ich skutočné správanie sa v kolokácii treba skúmať v konkordančnomzozname, čo je pri spravidla veľkých objemoch dát veľmi prácne a neefektívne, aj keď odstránimeduplicity a usporiadame KWIC abecedne.Na účely výskumu kookurencie prvkov v korpuse sa ukazuje ako veľmi efektívna metódajednoduchá frekvenčná distribúcia, ktorá v konečnom dôsledku poskytuje lingvistickynajvhodnejšie výsledky, ktoré nie sú ovplyvnené použitým druhom štatistickej miery.Východiskom skúmania frekvenčnej distribúcie je absolútna frekvencia prvkov v zadanomintervale pri stanovenom minimálnom limite v korpuse a minimálnom limite v zadanom kontexte.29

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!