18.07.2013 Views

Záverečná správa - Slovenský národný korpus - SAV

Záverečná správa - Slovenský národný korpus - SAV

Záverečná správa - Slovenský národný korpus - SAV

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Komplexné spracovanie slovenského jazyka a jeho elektronizácia na účely jazykovedného výskumu<br />

20<br />

Počet tokenov<br />

200 000 000<br />

180 000 000<br />

160 000 000<br />

140 000 000<br />

120 000 000<br />

100 000 000<br />

80 000 000<br />

60 000 000<br />

40 000 000<br />

20 000 000<br />

0<br />

Vyvážené <strong>korpus</strong>y<br />

prim1-vyv prim-2.0-vyv prim-2.1-vyv prim-3.0-vyv<br />

Počet tokenov 12 000 000 56 000 000 54 000 000 200 000 000<br />

prim1-vyv, prim-2.0-vyv, prim-2.1-vyv<br />

(%)<br />

20<br />

60<br />

inf<br />

prf<br />

img<br />

Verzie<br />

3.2.3. Ručná lingvistická anotácia vybraných textov<br />

Grafické znázornenie množstva ručne morfologicky anotovaných tokenov a syntakticky<br />

anotovaných viet podľa jednotlivých rokov.<br />

Počet tokenov<br />

550 000<br />

500 000<br />

450 000<br />

400 000<br />

350 000<br />

300 000<br />

250 000<br />

200 000<br />

150 000<br />

100 000<br />

50 000<br />

0<br />

33,3<br />

Morfologická anotácia<br />

prim-3.0-vyv (%)<br />

0,01<br />

33,3<br />

2004 2005 2006 2007<br />

Počet tokenov 96 000 130 000 322 000 512 000<br />

33,3<br />

inf<br />

prf<br />

img<br />

iné<br />

11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!