Acquisition du tchèque par les francophones : analyse ... - LaLIC
Acquisition du tchèque par les francophones : analyse ... - LaLIC
Acquisition du tchèque par les francophones : analyse ... - LaLIC
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
3.1.2 ANNOTATION MORPHOLOGIQUE<br />
cadres théoriques à la base de l’annotation. En effet, l’interprétation de l’annotation peut<br />
être considérée comme biaisée <strong>par</strong> l’approche choisie. Aujourd’hui, il est enten<strong>du</strong> qu’un corpus<br />
annoté est un outil précieux pour un linguiste. Cependant, le répertoire des étiquettes,<br />
<strong>les</strong> règ<strong>les</strong> de leur attribution aux unités dans le texte, et la théorie linguistique sous-jacente,<br />
doivent être clairement exposés 5 . La description <strong>du</strong> répertoire des étiquettes et la spécification<br />
de la terminologie utilisée sont des outils nécessaires de « tra<strong>du</strong>ction », qui permettent<br />
de se servir d’une annotation dans des travaux sur des fonds théoriques divers.<br />
Dans le cadre de CETLEF, une annotation linguistique accompagne <strong>les</strong> formes requises<br />
dans <strong>les</strong> tâches d’exercices grammaticaux : la forme à décliner est accompagnée <strong>par</strong> la valeur<br />
de la catégorie lexicale, des catégories morphologiques, <strong>par</strong> son type <strong>par</strong>adigmatique et <strong>par</strong><br />
l’indication d’une éventuelle alternance. Le rôle de l’annotation dans CETLEF est triple :<br />
• Accompagner <strong>les</strong> pro<strong>du</strong>ctions des apprenants <strong>par</strong> des métadonnées linguistiques qui<br />
seraient uti<strong>les</strong> pour leur <strong>analyse</strong>. Comme dans le cas des corpus annotées, la première<br />
motivation est de faciliter la recherche de l’information qui peut se baser sur <strong>les</strong><br />
étiquettes linguistiques. Ainsi, il sera possible de rechercher, <strong>par</strong> exemple, toutes <strong>les</strong><br />
erreurs dans <strong>les</strong> substantifs ap<strong>par</strong>tenant à un certain type <strong>par</strong>adigmatique dans une<br />
forme casuelle spécifique ; toutes <strong>les</strong> occurrences d’une certaine alternance, etc.<br />
• Servir pour le diagnostic automatique des erreurs. L’indication des valeurs des catégories<br />
grammatica<strong>les</strong>, <strong>du</strong> type <strong>par</strong>adigmatique et de l’alternance est une information<br />
cruciale pour l’interprétation automatique d’une erreur de déclinaison. Un modèle formel<br />
de la déclinaison <strong>du</strong> <strong>tchèque</strong>, qui puisse être implémenté dans une procé<strong>du</strong>re automatique,<br />
est nécessaire pour effectuer cette tâche.<br />
• Être affichée, dans un format adapté pour une présentation didactique, sur la plateforme<br />
apprenant de CETLEF. Pendant la correction des exercices et lors de l’avancement<br />
de l’apprenant dans une enquête, <strong>les</strong> informations grammatica<strong>les</strong> sont affichées<br />
pour l’aider à intégrer la structure grammaticale et <strong>les</strong> propriétés formel<strong>les</strong> de la déclinaison<br />
<strong>du</strong> <strong>tchèque</strong> 6 .<br />
Dans le cadre de ce travail, nous avons élaboré une annotation spécifique, adaptée aux<br />
objectifs établis : décrire de manière la plus exhaustive <strong>les</strong> erreurs de déclinaison reflétant le<br />
processus de l’acquisition de la déclinaison <strong>du</strong> <strong>tchèque</strong> en tant que langue étrangère. Avant<br />
de présenter ce modèle qui, nous allons nous pencher sur l’éten<strong>du</strong>e <strong>du</strong> matériau linguistique<br />
qui doit être couvert <strong>par</strong> cette annotation.<br />
5 Voir Hajičová et al. (2002b,a), Hajičová (2006). Pour un exemple de spécification <strong>du</strong> répertoire des étiquettes<br />
morphologiques, voir Hana et al. (2005).<br />
6 A propos de l’emploi des outils <strong>du</strong> TAL pour l’intégration des informations grammatica<strong>les</strong> explicites dans<br />
<strong>les</strong> plateformes d’enseignements des langues intelligemment assistés <strong>par</strong> ordinateur voir <strong>par</strong> exemple Zock<br />
(1994), Dokter et al. (1998), Nerbonne et Smit (1996), Nerbonne et Dokter (1999). L’utilisation de l’annotation<br />
linguistique <strong>du</strong> PDT dans une application pédagogique est présentée dans Kučera (2006).<br />
35