Acquisition du tchèque par les francophones : analyse ... - LaLIC

More documents

Recommendations

Info

$Université de Paris-Sorbonne $Paris IV$ - LaLIC - Université Paris ...$

3.1.3 ANNOTATION MORPHOLOGIQUE peu fréquents (par exemple rozedma, kramle). Cependant la fréquence des unités est naturellement influencée par la composition du corpus dans lequel elle a été calculée. Ainsi, il est possible qu’en respectant strictment la fréquence des unités dans un certain corpus, les matériaux pédagogiques se trouvent orientés vers des problématiques (par exemple la politique, l’économie pour un corpus de textes journalistiques) qui ne sont pas toujours conformes aux besoins d’un apprenant débutant. La compilation du lexique A1A2 pour le tchèque a été dirigée par des facteurs communicationnels et pragmatiques communs pour toutes les langues, établis dans CECRL (2001), et qui vise à couvrir les besoins immédiats d’un apprenant. Le critère de la fréquence des éléments n’est pas mentionné. Nous nous proposons donc d’examiner le lexique A1A2 du point de vue de la fréquence des unités qu’il contient. S’il existe une correspondance entre les différentes unités dans ce lexique et leur fréquence dans un corpus de langue générale, la pertinence de l’approche quantitative serait vérifiée par un argument indépendant : la liste des éléments choisis sur des critères extra-linguistiques correspondrait à une liste, établie sur la fréquence des éléments. Dans le cas idéal, le lexique A1A2 contenant à peu près 2700 mots serait donc égal à la liste des 2700 mots tchèques les plus fréquents. Afin de déterminer s’il existe une telle correspondance, il est nécessaire d’attribuer à chaque mot du lexique A1A2 une valeur V exprimant son ordre dans une liste L, ordonnée d’après la fréquence décroissante des unités dans un corpus donné. Ensuite, il faut classer les mots du lexique A1A2 en ordre croissant d’après la valeur V et comparer la suite de ces valeurs pour les 2700 unités du lexique A1A2 avec la même suite pour les premiers 2700 éléments de la liste L, qui est nécessairement une suite incrémentée d’un point pour chaque élément – pour le mot le plus fréquent, la valeur V égale à 1, pour le deuxième mot le plus fréquent, la valeur V égale à 2, pour le troisième à 3 etc. Dans le cas d’une correspondance complète, la valeur V du mot de l’ordre 2700 dans lexique A1A2 serait égale à la valeur V du mot de l’ordre 2700 dans la liste L, c’est-à-dire 2700, ce qui impliquerait que cette valeur est nécessairement la même pour toutes les unités précédentes. Pour pouvoir effectuer cette expérience, Frekvenční slovník češtiny (FSČ), Čermák et Křen (2004) a été utilisé. Il s’agit d’un dictionnaire de fréquence, disponible en format numérique sur CD-ROM, élaboré à partir des textes contenus dans le Corpus national tchèque. Il contient les 50 000 mots communs les plus fréquents, dont la fréquence a été calculée dans le SYN2000 (corpus représentative du tchèque écrit contemporain contenant 100 millions de mots). Le dictionnaire FSČ offre un classement d’après la fréquence absolue, c’est-à-dire d’après le nombre total d’occurrence d’une unité lexicale donnée, mais également d’après la fréquence moyenne réduite – Average Reduced Frequency (ARF), qui est une mesure plus intéressante pour notre objectif, voir Hlaváčová et Savický (2002). La valeur ARF, considé- 39
ANNOTATION MORPHOLOGIQUE rée comme plus fiable, est basée évidemment sur la fréquence des unités mais elle reflète également la répartition des occurrences d’une certaine unité dans l’ensemble du corpus, ce qui permet de diminuer l’influence des textes avec une fréquence trop importante d’une unité spécifique, employée uniquement dans un contexte donné. Si la liste de 50 000 mots de FSČ est ordonnée d’après la valeur ARF, l’ordre des différents mots dans cette liste est exprimé par la valeur appelée rank ARF – elle est égale à 1 pour le lexème le plus fréquent, à 2 pour le deuxième lexème le plus fréquent etc. Dans les calculs suivants, cette liste va correspondre à la liste L, introduite ci-dessus. Pour donner un exemple de l’organisation de cette liste, une dizaines de mots classée d’après ARF à partir de l’unité sur la 961 e position (rank ARF) d’après la fréquence est présentée ici : 961 student, 961 študent, 962 probíhat, 963 potíž, 964 občanský, 965 stavět, 966 novinář, 967 zboží, 968 instituce, 969 tiskový, 970 tvorba, 971 bohatý Le chiffre correspond à la valeur du rank ARF et d’après la conception choisi dans FSČ, cette valeur est égale pour les différentes variantes d’un seul lexème. Il est maintenant nécessaire d’extraire le lexique A1A2, disponible à l’origine dans un document en format PDF (Portable Document File) et le formater en XML pour faciliter les manipulations informatiques. Ce fichier a ensuite été traité par un script Perl qui a attribué à chaque unité sa valeur du rank ARF, lue dans la liste L. Voici un extrait du fichier résultant, contenant les lexèmes de A1A2, ayant comme point de départ l’unité avec le rank ARF 961, comme dans l’exemple précédent : 961 student, 964 občanský, 966 novinář, 967 zboží, 972 dívat se, 974 poslat, 975 únor, 977 červenec, 979 červený, 986 radost En observant la différence entre les deux extraits, nous pouvons constater que le lexique A1A2 ne contient pas la variante študent de l’élément avec le rank ARF égale à 961, il ne contient ni l’élément 962 probíhat et 963 potíž, il contient l’élément 964 občanský etc. – cette comparaison révèle rapidement qu’il y a des unités présentes dans la liste L et absentes dans le lexique A1A2. Ainsi, la valeur du rank ARF des unités du lexique A1A2 n’est pas égale à leur ordre – la plus grande valeur du rank ARF n’est pas égale au nombre d’unités, comme nous l’avons supposé plus haut pour le cas idéal, mais il dépasse largement la limite de 2700 mots les plus fréquents dans le FSČ, voir fig. 3.1. Il est évident que le lexique A1A2 contient des lexèmes qui sont beaucoup moins fréquents qu’un ensemble de lexèmes correspondant qui serait délimité uniquement sur la base de la fréquence – la courbe correspondrait à la flèche pointillée sur la fig. 3.1. La valeur du rank ARF monte d’une façon régulière jusqu’aux alentours de la valeur 10 000, atteinte autour du lexème de l’ordre 2 000 dans le lexique A1A2, les 700 éléments restants sont des lexèmes repartis sur une plage entre 10 000 et 50 000 de la valeur ARF. Les derniers lexèmes entre 40 000 et 50 000 sont les suivants : 40381 nastydlý, 40631 nahustit, 40
Page 1: Institut National des Langues et Ci
Page 4 and 5: Table des matières 1 Introduction
Page 6 and 7: 4.4 Message d’erreur . . . . . .
Page 8: D.1 Alternances consonantiques . .
Page 11 and 12: INTRODUCTION L’exemple (1) montre
Page 13 and 14: INTRODUCTION gère. Nous nous situo
Page 15 and 16: CADRE MÉTHODOLOGIQUE 2.1 Tchèque
Page 17 and 18: CADRE MÉTHODOLOGIQUE Hrdlička (20
Page 19 and 20: CADRE MÉTHODOLOGIQUE pour nous, ca
Page 21 and 22: CADRE MÉTHODOLOGIQUE teurs extra-l
Page 23 and 24: CADRE MÉTHODOLOGIQUE simplificatio
Page 25 and 26: CADRE MÉTHODOLOGIQUE déclinaison
Page 27 and 28: CADRE MÉTHODOLOGIQUE exemple, pour
Page 29 and 30: CADRE MÉTHODOLOGIQUE alternative
Page 31 and 32: CADRE MÉTHODOLOGIQUE sur ce princi
Page 33 and 34: CADRE MÉTHODOLOGIQUE par une annot
Page 35 and 36: CADRE MÉTHODOLOGIQUE du nombre et
Page 37 and 38: CADRE MÉTHODOLOGIQUE 2.4.2.7 Produ
Page 40 and 41: Chapitre 3 Annotation morphologique
Page 42 and 43: 3.1.1 ANNOTATION MORPHOLOGIQUE D’
Page 44 and 45: 3.1.2 ANNOTATION MORPHOLOGIQUE cadr
Page 46 and 47: 3.1.3 ANNOTATION MORPHOLOGIQUE inte
Page 50 and 51: 3.1.3 ANNOTATION MORPHOLOGIQUE FIG.
Page 52 and 53: 3.1.4 ANNOTATION MORPHOLOGIQUE des
Page 54 and 55: 3.1.4 ANNOTATION MORPHOLOGIQUE trou
Page 56 and 57: 3.2 ANNOTATION MORPHOLOGIQUE Pour f
Page 58 and 59: 3.2 ANNOTATION MORPHOLOGIQUE appart
Page 60 and 61: 3.2 ANNOTATION MORPHOLOGIQUE adject
Page 62 and 63: 3.3.2 ANNOTATION MORPHOLOGIQUE cas
Page 64 and 65: 3.3.3 ANNOTATION MORPHOLOGIQUE pér
Page 66 and 67: 3.4.1 ANNOTATION MORPHOLOGIQUE par
Page 68 and 69: 3.4.1 ANNOTATION MORPHOLOGIQUE Il p
Page 70 and 71: 3.4.1 ANNOTATION MORPHOLOGIQUE éve
Page 72 and 73: 3.4.1 ANNOTATION MORPHOLOGIQUE comp
Page 74 and 75: 3.4.2 ANNOTATION MORPHOLOGIQUE 3.4.
Page 76 and 77: 3.4.2 ANNOTATION MORPHOLOGIQUE
Page 78 and 79: 3.4.3 ANNOTATION MORPHOLOGIQUE La v
Page 80 and 81: 3.4.3 ANNOTATION MORPHOLOGIQUE anim
Page 88 and 89: 3.4.6 ANNOTATION MORPHOLOGIQUE pl.
Page 90 and 91: 3.4.8 ANNOTATION MORPHOLOGIQUE donc
Page 92 and 93: 3.5 ANNOTATION MORPHOLOGIQUE 3.5 Al
Page 94 and 95: 3.5.3 ANNOTATION MORPHOLOGIQUE Cett
Page 96 and 97: 3.5.3 ANNOTATION MORPHOLOGIQUE (2)
Page 98 and 99:
3.5.4 ANNOTATION MORPHOLOGIQUE •
Page 100 and 101:
3.5.4 ANNOTATION MORPHOLOGIQUE dans
Page 102 and 103:
3.5.4 ANNOTATION MORPHOLOGIQUE # >
Page 104 and 105:
3.5.4 ANNOTATION MORPHOLOGIQUE étr
Page 106 and 107:
3.5.4 ANNOTATION MORPHOLOGIQUE Les
Page 108 and 109:
3.5.5 ANNOTATION MORPHOLOGIQUE
Page 110 and 111:
3.5.5 ANNOTATION MORPHOLOGIQUE •
Page 112 and 113:
3.6.1 ANNOTATION MORPHOLOGIQUE radi
Page 114 and 115:
3.6.2 ANNOTATION MORPHOLOGIQUE } }
Page 116 and 117:
3.6.2 ANNOTATION MORPHOLOGIQUE 10.
Page 118 and 119:
3.6.2 ANNOTATION MORPHOLOGIQUE alor
Page 120 and 121:
3.7 ANNOTATION MORPHOLOGIQUE de la
Page 122 and 123:
3.7.2 ANNOTATION MORPHOLOGIQUE inco
Page 124:
3.7.3 ANNOTATION MORPHOLOGIQUE mlad
Page 127 and 128:
DIAGNOSTIC DES ERREURS Un cadre int
Page 129 and 130:
DIAGNOSTIC DES ERREURS tionnée par
Page 131 and 132:
DIAGNOSTIC DES ERREURS ěti, ho, i,
Page 133 and 134:
DIAGNOSTIC DES ERREURS [ ] dia : sc
Page 135 and 136:
DIAGNOSTIC DES ERREURS L’interpr
Page 137 and 138:
DIAGNOSTIC DES ERREURS r ⎡ cas :
Page 139 and 140:
DIAGNOSTIC DES ERREURS r ⎡ cas :
Page 141 and 142:
DIAGNOSTIC DES ERREURS r ⎡ ⎤ ca
Page 143 and 144:
DIAGNOSTIC DES ERREURS r ⎡ ⎤ ca
Page 145 and 146:
DIAGNOSTIC DES ERREURS ‘Il a parl
Page 147 and 148:
DIAGNOSTIC DES ERREURS Les interpr
Page 149 and 150:
DIAGNOSTIC DES ERREURS et la procé
Page 151 and 152:
DIAGNOSTIC DES ERREURS 4.4.1 Attrib
Page 153 and 154:
DIAGNOSTIC DES ERREURS valeurs poss
Page 155 and 156:
DIAGNOSTIC DES ERREURS valeur possi
Page 157 and 158:
DIAGNOSTIC DES ERREURS à la diffé
Page 159 and 160:
DIAGNOSTIC DES ERREURS Remarque 3 D
Page 161 and 162:
DIAGNOSTIC DES ERREURS dans le lemm
Page 163 and 164:
DIAGNOSTIC DES ERREURS manifeste pa
Page 165 and 166:
DIAGNOSTIC DES ERREURS radical dés
Page 167 and 168:
DIAGNOSTIC DES ERREURS n o spec dia
Page 169 and 170:
DIAGNOSTIC DES ERREURS erreur de ca
Page 171 and 172:
DIAGNOSTIC DES ERREURS n o spec dia
Page 173 and 174:
DIAGNOSTIC DES ERREURS La composant
Page 175 and 176:
DIAGNOSTIC DES ERREURS Pour les err
Page 177 and 178:
DIAGNOSTIC DES ERREURS (2) Toho De
Page 180 and 181:
Chapitre 5 Évaluation Dans ce chap
Page 182 and 183:
5.1.3 ÉVALUATION exercices ont ét
Page 184 and 185:
5.1.3 ÉVALUATION leur emploi, par
Page 186 and 187:
5.1.3 ÉVALUATION Parmi les erreurs
Page 188 and 189:
5.1.3 ÉVALUATION Nous pouvons voir
Page 190 and 191:
5.1.3 ÉVALUATION Dans la tâche (2
Page 192 and 193:
5.1.3 ÉVALUATION Le diagnostic aut
Page 194 and 195:
5.1.3 ÉVALUATION pour ces producti
Page 196 and 197:
5.2.2 ÉVALUATION (13 tâches) et p
Page 198 and 199:
5.2.4 ÉVALUATION attribut erreur t
Page 200 and 201:
5.2.5 ÉVALUATION production vůní
Page 202:
5.2.5 ÉVALUATION construction impe
Page 205 and 206:
IMPLÉMENTATION La solution de dév
Page 207 and 208:
IMPLÉMENTATION • la plateforme a
Page 209 and 210:
IMPLÉMENTATION 6.2.2 Tables dans l
Page 211 and 212:
IMPLÉMENTATION 6.2.3 Table apprena
Page 213 and 214:
IMPLÉMENTATION situation « statut
Page 215 and 216:
IMPLÉMENTATION un nombre entier en
Page 217 and 218:
IMPLÉMENTATION Remarque : Le titre
Page 219 and 220:
IMPLÉMENTATION ordre_tache « ordr
Page 221 and 222:
IMPLÉMENTATION Attributs de la tab
Page 223 and 224:
IMPLÉMENTATION tâche (par exemple
Page 225 and 226:
IMPLÉMENTATION Remarque : Cet attr
Page 227 and 228:
IMPLÉMENTATION prod_taches Field T
Page 229 and 230:
IMPLÉMENTATION contient la valeur
Page 231 and 232:
IMPLÉMENTATION nom score LIEN_id_e
Page 233 and 234:
IMPLÉMENTATION LIEN_id_app product
Page 235 and 236:
IMPLÉMENTATION 6.3.1 Plateforme au
Page 237 and 238:
IMPLÉMENTATION requis). L’auteur
Page 239 and 240:
IMPLÉMENTATION l’aide d’un for
Page 241 and 242:
IMPLÉMENTATION en fonction du nomb
Page 243 and 244:
IMPLÉMENTATION taches et dans les
Page 245 and 246:
IMPLÉMENTATION d’abord le cas et
Page 247 and 248:
CONCLUSION ou -i et -y (les types
Page 250 and 251:
Annexe A CETLEF Plateforme auteur C
Page 252 and 253:
CETLEF PLATEFORME AUTEUR FIG. A.2 -
Page 254 and 255:
Page 256 and 257:
Page 258 and 259:
Annexe B CETLEF Plateforme apprenan
Page 260 and 261:
CETLEF PLATEFORME APPRENANT FIG. B.
Page 262 and 263:
Page 264 and 265:
Page 266 and 267:
Page 268 and 269:
Page 270 and 271:
Page 272 and 273:
Page 274 and 275:
Page 276 and 277:
Page 278 and 279:
Annexe C Paradigmes Cette annexe co
Page 280 and 281:
C.1 PARADIGMES mnemo pdgm ouvert A1
Page 282 and 283:
Page 284 and 285:
Page 286 and 287:
C.1 PARADIGMES Type muž mnemo pdgm
Page 288 and 289:
C.1 PARADIGMES Type stroj mnemo pdg
Page 290 and 291:
Page 292 and 293:
Page 294 and 295:
Page 296 and 297:
Page 298 and 299:
Page 300 and 301:
Page 302 and 303:
Page 304 and 305:
Page 306 and 307:
Page 308 and 309:
Page 310 and 311:
C.2 PARADIGMES C.2 Flexion adjectiv
Page 312 and 313:
C.2 PARADIGMES cas num gen var term
Page 314 and 315:
Page 316 and 317:
Page 318 and 319:
C.3 PARADIGMES C.3 Flexion mixte Ty
Page 320 and 321:
Page 322 and 323:
C.4 PARADIGMES C.4 Flexion pronomin
Page 324 and 325:
C.4 PARADIGMES Type se mnemo pdgm o
Page 326 and 327:
Page 328 and 329:
Page 330 and 331:
Page 332 and 333:
Page 334 and 335:
C.5 PARADIGMES Type pět mnemo pdgm
Page 336:
Page 339 and 340:
ALTERNANCES Dépalatalisation @mnem
Page 341 and 342:
ALTERNANCES Alternance de -e- inter
Page 344 and 345:
Bibliographie ABEILLÉ, A. (1993).
Page 346 and 347:
BIBLIOGRAPHIE BIBLIOGRAPHIE ČERMÁ
Page 348 and 349:
BIBLIOGRAPHIE BIBLIOGRAPHIE FORTMAN
Page 350 and 351:
BIBLIOGRAPHIE BIBLIOGRAPHIE HOLLAND
Page 352 and 353:
BIBLIOGRAPHIE BIBLIOGRAPHIE LUKÁŠ
Page 354 and 355:
BIBLIOGRAPHIE BIBLIOGRAPHIE RAGUSIC
Page 356:
BIBLIOGRAPHIE BIBLIOGRAPHIE WHITE,
show all

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Create successful ePaper yourself

Delete template?

Save as template?