Acquisition du tchèque par les francophones : analyse ... - LaLIC
Acquisition du tchèque par les francophones : analyse ... - LaLIC
Acquisition du tchèque par les francophones : analyse ... - LaLIC
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
4.2.1 DIAGNOSTIC DES ERREURS<br />
• Soit un langage L*, ensemble infini de toutes <strong>les</strong> chaînes possib<strong>les</strong> sur l’alphabet L :<br />
L* = {A, AÁ, Aa, Aá, ..., BcD, ..., commençer, ... , slovo, ...} ;<br />
• Soit un alphabet L CZ ⊂ L, ensemble fini contenant tous <strong>les</strong> caractères <strong>du</strong> <strong>tchèque</strong> à <strong>par</strong>t<br />
l’espace, <strong>les</strong> chiffres et <strong>les</strong> signes de ponctuation, et qui est une union des ensemb<strong>les</strong><br />
de caractères minuscu<strong>les</strong>, majuscu<strong>les</strong>, minuscu<strong>les</strong> diacritées et majuscu<strong>les</strong> diacritées :<br />
L CZ = {A, Á, a, á, B, b, C, c, Č, č, D, d, Ď, d’, E, e, ě, É, é, F, f, G, g, H, h, I, i, J, j, K,<br />
k, L, l, M, m, N, n, Ň, ň, O, o, Ó, ó, P, p, R, r, Ř, ř, S, s, Š, š, T, t, Ť, t’, U, u, Ú, ú, ů, V, v,<br />
Y, y, Z, z, Ž, ž} ;<br />
• Soit un langage L CZ * ⊂ L*, ensemble infini de toutes <strong>les</strong> chaînes possib<strong>les</strong> sur l’alphabet<br />
L CZ : L CZ * = {A, AÁ, Aa, ... , mládovi, ..., ův, ..., zžŽŽŽ} ;<br />
• Soit une fonction Min, opération de minusculisation qui attribue à chaque mot m ∈ L CZ *<br />
sa forme correspondante uniquement en minuscu<strong>les</strong> : <strong>par</strong> exemple, pour un mot m =<br />
ČžčRs, le résultat de l’opération de minusculisation est Min(ČžčRs) = čžčrs.<br />
• Soit une fonction Dia, opération d’enlèvement <strong>du</strong> diacritique qui attribue à chaque<br />
mot m ∈ L CZ * sa forme correspondante en caractères sans diacritique : <strong>par</strong> exemple,<br />
pour un mot m = ČžčRs, le résultat de l’opération d’enlèvement <strong>du</strong> diacritique est<br />
Dia(ČžčRs) = CzcRs.<br />
• Soit une fonction St, opération de standardisation telle que St(m) = Dia(Min(m)) :<br />
<strong>par</strong> exemple, pour un mot m = ČžčRs, le résultat de l’opération de standardisation est<br />
St(ČžčRs) = czcrs.<br />
• Soit un langage N ⊂ L CZ *, ensemble fini de toutes <strong>les</strong> formes lexica<strong>les</strong> des mots<br />
<strong>tchèque</strong>s ap<strong>par</strong>tenant aux types morphologiques nominal, adjectival, adjectival mixte,<br />
pronominal ou numéral : N = {abatyše, ..., mládě, mláděte, ..., žížalami}.<br />
• Soit un ensemble R ⊂ L CZ *, ensemble fini de tous <strong>les</strong> radicaux extraits <strong>par</strong> l’enlèvement<br />
de la désinence casuelle de la forme <strong>du</strong> lemme des mots <strong>tchèque</strong>s ap<strong>par</strong>tenant au<br />
type morphologique nominal, adjectival, adjectival mixte, pronominal ou numéral : R<br />
= {abatyš, ..., mlád, ..., pán, ..., žížal}.<br />
• Soit un ensemble D ⊂ L CZ *, ensemble fini de toutes <strong>les</strong> désinences des types <strong>par</strong>adigmatiques<br />
des mots <strong>tchèque</strong>s ap<strong>par</strong>tenant au type morphologique nominal, adjectival,<br />
adjectival mixte, pronominal 6 ou numéral : N = {#, a, á, ách, ám, ama, ami, at, ata,<br />
atama, atami, atech, atem, atu, atum, atům, aty, e, é, ě, ech, ěch, eho, ého, ej, ejch,<br />
ejm, ejma, ejo, em, ém, ěm, ema, ěma, emi, ěmi, emu, ému, en, ete, ěte, etem, ětem, eti,<br />
6 Les <strong>par</strong>adigmes des pronoms spécifiques já, ty, my, vy, se, kdo, co, nic, on, jenž, všechen, qui sont inscrits<br />
dans le fichier pdgm.xml comme des listes de formes lexica<strong>les</strong> complètes (voir la section 3.4.6, p. 79), font<br />
<strong>par</strong>tie de l’ensemble D au niveau technique (pour <strong>les</strong> procé<strong>du</strong>res automatiques). Pour des raisons de place, el<strong>les</strong><br />
sont représentées comme un ensemble S qui est l’ensemble des formes lexica<strong>les</strong> des pronoms spécifiques.<br />
121