05.07.2014 Views

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

3.4.8 ANNOTATION MORPHOLOGIQUE<br />

donc désormais possible d’extraire <strong>du</strong> lexique A1A2 (2775 unité lexica<strong>les</strong>) un ensemble de<br />

1402 substantifs. Leur catégorie lexicale correspond au type morphologique dans la plu<strong>par</strong>t<br />

des cas à <strong>par</strong>t 6 lexèmes de déclinaison adjectivale (dovolená, spropitné, vstupné, poštovné,<br />

nájemné, průvodčí).<br />

Pour chaque substantif, son type <strong>par</strong>adigmatique lui a été attribué manuellement, souvent<br />

à l’aide des expressions régulières qui permettent de choisir un ensemble de lexèmes<br />

conformes à un patron, typique pour un certain type. Le résultat de cette recherche a été<br />

vérifié et trié manuellement pour l’élimination des erreurs et pour l’attribution éventuelle de<br />

différents sous-types. Le format d’une entrée <strong>du</strong> lexique contenu dans le fichier XML a la<br />

forme suivante :<br />

břicho<br />

bůh<br />

celer<br />

La fréquence est calculée avec le nombre de substantifs ap<strong>par</strong>tenant à un certain type<br />

<strong>par</strong>adigmatique <strong>par</strong> rapport au nombre total de substantifs dans le lexique. Ce calcul est utilisé<br />

dans <strong>les</strong> travaux sur la fréquence de types <strong>par</strong>adigmatiques que nous avons pu consulter,<br />

voir Jelínek et al. (1961) et Osolsobě et al. (1998) qui traitent des listes de mots extraits de<br />

différents corpus textuels. Cependant, <strong>les</strong> informations sur la fréquence de l’emploi effectif<br />

des types <strong>par</strong>adigmatiques dans le discours ne sont pas disponib<strong>les</strong>. Un tel calcul devrait être<br />

effectué avec <strong>les</strong> substantifs <strong>les</strong> plus employés, ce qui permettrait d’obtenir une idée sur la<br />

fréquence de l’occurrence des différents types dans le discours. Cette information permettrait<br />

d’établir la probabilité de l’occurrence de types <strong>par</strong>adigmatiques dans des textes réels et<br />

non pas dans une liste de mots comme dans notre cas. Ainsi, l’importance des types « irréguliers<br />

» qui n’englobent qu’un nombre restreint de lexèmes mais qui sont fréquents dans le<br />

discours (<strong>par</strong> exemple člověk / lidé, ruka) serait mise en relief.<br />

Les types <strong>par</strong>adigmatiques <strong>les</strong> plus représentés sont žena (435 / 31,03%) et hrad (406<br />

/ 28,96%) qui sont assignés approximativement aux deux tiers de tous <strong>les</strong> substantifs. La<br />

portion restante contient <strong>les</strong> types qui représentent chacun à leur tour moins de 8% <strong>du</strong> lexique<br />

A1A2 – <strong>les</strong> types růže (109 / 7,77%), město (109 / 7,77%), pán (83 / 5,92%), stavení (73 /<br />

5,21%), muž (43 / 5,21%), stroj (42 / 3,00 %), kost (43 / 2,43%), píseň (27 / 1,93 %), moře<br />

(15 / 1,07%), předseda (15 / 1,07%), kuře (7 / 0,50%), soudce (3 / 0,21%), klima (2 / 0,14%).<br />

Parmi <strong>les</strong> sous-types établis dans notre classification des types <strong>par</strong>adigmatiques nominaux,<br />

<strong>les</strong> suivants ne sont pas représentés dans le lexique A1A2 : džigolo (pn_d), kámen<br />

(hd_k), Hradčany (hd_h), kůň (mz_k), paňáca (pd_p), skica (zn_s), Stáňa (zn_t), idea (zn_i),<br />

Lidice (rz_l), lečo (mt_l), dvířka (mt_d). Les autres, ouverts ou fermés, sont représentés <strong>par</strong><br />

au moins un lexème pour chaque sous-type.<br />

81

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!