Záverečná správa - Slovenský národný korpus - SAV
Záverečná správa - Slovenský národný korpus - SAV
Záverečná správa - Slovenský národný korpus - SAV
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Komplexné spracovanie slovenského jazyka a jeho elektronizácia na účely jazykovedného výskumu<br />
20<br />
Počet tokenov<br />
200 000 000<br />
180 000 000<br />
160 000 000<br />
140 000 000<br />
120 000 000<br />
100 000 000<br />
80 000 000<br />
60 000 000<br />
40 000 000<br />
20 000 000<br />
0<br />
Vyvážené <strong>korpus</strong>y<br />
prim1-vyv prim-2.0-vyv prim-2.1-vyv prim-3.0-vyv<br />
Počet tokenov 12 000 000 56 000 000 54 000 000 200 000 000<br />
prim1-vyv, prim-2.0-vyv, prim-2.1-vyv<br />
(%)<br />
20<br />
60<br />
inf<br />
prf<br />
img<br />
Verzie<br />
3.2.3. Ručná lingvistická anotácia vybraných textov<br />
Grafické znázornenie množstva ručne morfologicky anotovaných tokenov a syntakticky<br />
anotovaných viet podľa jednotlivých rokov.<br />
Počet tokenov<br />
550 000<br />
500 000<br />
450 000<br />
400 000<br />
350 000<br />
300 000<br />
250 000<br />
200 000<br />
150 000<br />
100 000<br />
50 000<br />
0<br />
33,3<br />
Morfologická anotácia<br />
prim-3.0-vyv (%)<br />
0,01<br />
33,3<br />
2004 2005 2006 2007<br />
Počet tokenov 96 000 130 000 322 000 512 000<br />
33,3<br />
inf<br />
prf<br />
img<br />
iné<br />
11