Acquisition du tchèque par les francophones : analyse ... - LaLIC
Acquisition du tchèque par les francophones : analyse ... - LaLIC
Acquisition du tchèque par les francophones : analyse ... - LaLIC
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
3.4.8 ANNOTATION MORPHOLOGIQUE<br />
donc désormais possible d’extraire <strong>du</strong> lexique A1A2 (2775 unité lexica<strong>les</strong>) un ensemble de<br />
1402 substantifs. Leur catégorie lexicale correspond au type morphologique dans la plu<strong>par</strong>t<br />
des cas à <strong>par</strong>t 6 lexèmes de déclinaison adjectivale (dovolená, spropitné, vstupné, poštovné,<br />
nájemné, průvodčí).<br />
Pour chaque substantif, son type <strong>par</strong>adigmatique lui a été attribué manuellement, souvent<br />
à l’aide des expressions régulières qui permettent de choisir un ensemble de lexèmes<br />
conformes à un patron, typique pour un certain type. Le résultat de cette recherche a été<br />
vérifié et trié manuellement pour l’élimination des erreurs et pour l’attribution éventuelle de<br />
différents sous-types. Le format d’une entrée <strong>du</strong> lexique contenu dans le fichier XML a la<br />
forme suivante :<br />
břicho<br />
bůh<br />
celer<br />
La fréquence est calculée avec le nombre de substantifs ap<strong>par</strong>tenant à un certain type<br />
<strong>par</strong>adigmatique <strong>par</strong> rapport au nombre total de substantifs dans le lexique. Ce calcul est utilisé<br />
dans <strong>les</strong> travaux sur la fréquence de types <strong>par</strong>adigmatiques que nous avons pu consulter,<br />
voir Jelínek et al. (1961) et Osolsobě et al. (1998) qui traitent des listes de mots extraits de<br />
différents corpus textuels. Cependant, <strong>les</strong> informations sur la fréquence de l’emploi effectif<br />
des types <strong>par</strong>adigmatiques dans le discours ne sont pas disponib<strong>les</strong>. Un tel calcul devrait être<br />
effectué avec <strong>les</strong> substantifs <strong>les</strong> plus employés, ce qui permettrait d’obtenir une idée sur la<br />
fréquence de l’occurrence des différents types dans le discours. Cette information permettrait<br />
d’établir la probabilité de l’occurrence de types <strong>par</strong>adigmatiques dans des textes réels et<br />
non pas dans une liste de mots comme dans notre cas. Ainsi, l’importance des types « irréguliers<br />
» qui n’englobent qu’un nombre restreint de lexèmes mais qui sont fréquents dans le<br />
discours (<strong>par</strong> exemple člověk / lidé, ruka) serait mise en relief.<br />
Les types <strong>par</strong>adigmatiques <strong>les</strong> plus représentés sont žena (435 / 31,03%) et hrad (406<br />
/ 28,96%) qui sont assignés approximativement aux deux tiers de tous <strong>les</strong> substantifs. La<br />
portion restante contient <strong>les</strong> types qui représentent chacun à leur tour moins de 8% <strong>du</strong> lexique<br />
A1A2 – <strong>les</strong> types růže (109 / 7,77%), město (109 / 7,77%), pán (83 / 5,92%), stavení (73 /<br />
5,21%), muž (43 / 5,21%), stroj (42 / 3,00 %), kost (43 / 2,43%), píseň (27 / 1,93 %), moře<br />
(15 / 1,07%), předseda (15 / 1,07%), kuře (7 / 0,50%), soudce (3 / 0,21%), klima (2 / 0,14%).<br />
Parmi <strong>les</strong> sous-types établis dans notre classification des types <strong>par</strong>adigmatiques nominaux,<br />
<strong>les</strong> suivants ne sont pas représentés dans le lexique A1A2 : džigolo (pn_d), kámen<br />
(hd_k), Hradčany (hd_h), kůň (mz_k), paňáca (pd_p), skica (zn_s), Stáňa (zn_t), idea (zn_i),<br />
Lidice (rz_l), lečo (mt_l), dvířka (mt_d). Les autres, ouverts ou fermés, sont représentés <strong>par</strong><br />
au moins un lexème pour chaque sous-type.<br />
81