05.07.2014 Views

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ANNOTATION MORPHOLOGIQUE<br />

3.4.7 Déclinaison numérale<br />

La flexion numérale (la valeur de l’attribut tagMorph est N) contient un ensemble de <strong>par</strong>adigmes<br />

fermés des expressions <strong>du</strong> nombre qui ne peuvent pas être déclinées d’après aucun<br />

type nominal, adjectival et pronominal. Il s’agit des types fermés dva (dv) (voir l’annexe C.5,<br />

p. 324– 324), pět (nu_i) (voir l’annexe C.5, p. 325–325), kolik (nu_a) (voir l’annexe C.5, p.<br />

326–326) et málo (nu_o) (voir l’annexe C.5, p. 327–327).<br />

3.4.8 Fréquence des types <strong>par</strong>adigmatiques<br />

Les substantifs dans le lexique A1A2, extrait de Hádková et al. (2005) et Bidlas et al.<br />

(2005), ont été examinés <strong>par</strong> rapport à leur ap<strong>par</strong>tenance aux types <strong>par</strong>adigmatiques. La<br />

connaissance de leur ré<strong>par</strong>tition dans le lexique recommandé aux apprenants débutants permet<br />

d’établir une correspondance entre ce lexique – qui est un ensemble de lexèmes choisis<br />

selon des critères communicationnels et pragmatiques – et <strong>les</strong> moyens morphologiques qui<br />

sont mis en exercice dans l’emploi des lexèmes qu’il contient.<br />

D’après <strong>les</strong> résultats de la couverture <strong>du</strong> lexique A1A2 <strong>par</strong> rapport au lexique des mots<br />

<strong>tchèque</strong>s <strong>les</strong> plus fréquents 16 , nous pouvons supposer que la ré<strong>par</strong>tition des types <strong>par</strong>adigmatiques<br />

devrait correspondre à leur ré<strong>par</strong>tition pour la langue <strong>tchèque</strong> en général.<br />

Pour obtenir l’information sur la fréquence des types, il est nécessaire d’abord d’extraire<br />

<strong>les</strong> substantifs <strong>du</strong> lexique et de leur attribuer leur type <strong>par</strong>adigmatique. Cette tâche a été<br />

effectuée <strong>par</strong> des procédés semi-automatiques utilisés pour le traitement des données textuel<strong>les</strong>.<br />

Les lexèmes dans le lexique A1A2 ont été annotés <strong>par</strong> l’<strong>analyse</strong>ur morphologique de<br />

Hajič 17 . La sortie est un texte avec une annotation morphologique non désambiguïsée, voir<br />

un extrait :<br />

bratrbratrNNMS1-----A----<br />

budíkbudíkNNIS1-----A----NNIS4-----A----<br />

bufetbufetNNIS1-----A----NNIS4-----A----<br />

bundabundaNNFS1-----A----<br />

L’indication de la catégorie lexicale et <strong>du</strong> genre grammatical est fiable dans la plu<strong>par</strong>t<br />

des cas, <strong>les</strong> erreurs éventuel<strong>les</strong> ont été enlevées à la main pendant la vérification manuelle<br />

<strong>du</strong> fichier. Le lexique annoté, transformé automatiquement à l’aide d’un script Perl en un<br />

fichier au format XML, contient le lemme et <strong>les</strong> informations grammatica<strong>les</strong> associées. Il est<br />

16 Voir la section 3.1.3.2, pp. 38–43.<br />

17 L’<strong>analyse</strong>ur est disponible sur http://ufal.mff.cuni.cz/pdt/Morphology_and_Tagging/<br />

Morphology/index.html. Pour l’explication des étiquettes voir http://ufal.mff.cuni.cz/pdt/<br />

Morphology_and_Tagging/Doc/hmptagqr.html.<br />

80

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!