05.07.2014 Views

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4.2.1 DIAGNOSTIC DES ERREURS<br />

• Soit un langage L*, ensemble infini de toutes <strong>les</strong> chaînes possib<strong>les</strong> sur l’alphabet L :<br />

L* = {A, AÁ, Aa, Aá, ..., BcD, ..., commençer, ... , slovo, ...} ;<br />

• Soit un alphabet L CZ ⊂ L, ensemble fini contenant tous <strong>les</strong> caractères <strong>du</strong> <strong>tchèque</strong> à <strong>par</strong>t<br />

l’espace, <strong>les</strong> chiffres et <strong>les</strong> signes de ponctuation, et qui est une union des ensemb<strong>les</strong><br />

de caractères minuscu<strong>les</strong>, majuscu<strong>les</strong>, minuscu<strong>les</strong> diacritées et majuscu<strong>les</strong> diacritées :<br />

L CZ = {A, Á, a, á, B, b, C, c, Č, č, D, d, Ď, d’, E, e, ě, É, é, F, f, G, g, H, h, I, i, J, j, K,<br />

k, L, l, M, m, N, n, Ň, ň, O, o, Ó, ó, P, p, R, r, Ř, ř, S, s, Š, š, T, t, Ť, t’, U, u, Ú, ú, ů, V, v,<br />

Y, y, Z, z, Ž, ž} ;<br />

• Soit un langage L CZ * ⊂ L*, ensemble infini de toutes <strong>les</strong> chaînes possib<strong>les</strong> sur l’alphabet<br />

L CZ : L CZ * = {A, AÁ, Aa, ... , mládovi, ..., ův, ..., zžŽŽŽ} ;<br />

• Soit une fonction Min, opération de minusculisation qui attribue à chaque mot m ∈ L CZ *<br />

sa forme correspondante uniquement en minuscu<strong>les</strong> : <strong>par</strong> exemple, pour un mot m =<br />

ČžčRs, le résultat de l’opération de minusculisation est Min(ČžčRs) = čžčrs.<br />

• Soit une fonction Dia, opération d’enlèvement <strong>du</strong> diacritique qui attribue à chaque<br />

mot m ∈ L CZ * sa forme correspondante en caractères sans diacritique : <strong>par</strong> exemple,<br />

pour un mot m = ČžčRs, le résultat de l’opération d’enlèvement <strong>du</strong> diacritique est<br />

Dia(ČžčRs) = CzcRs.<br />

• Soit une fonction St, opération de standardisation telle que St(m) = Dia(Min(m)) :<br />

<strong>par</strong> exemple, pour un mot m = ČžčRs, le résultat de l’opération de standardisation est<br />

St(ČžčRs) = czcrs.<br />

• Soit un langage N ⊂ L CZ *, ensemble fini de toutes <strong>les</strong> formes lexica<strong>les</strong> des mots<br />

<strong>tchèque</strong>s ap<strong>par</strong>tenant aux types morphologiques nominal, adjectival, adjectival mixte,<br />

pronominal ou numéral : N = {abatyše, ..., mládě, mláděte, ..., žížalami}.<br />

• Soit un ensemble R ⊂ L CZ *, ensemble fini de tous <strong>les</strong> radicaux extraits <strong>par</strong> l’enlèvement<br />

de la désinence casuelle de la forme <strong>du</strong> lemme des mots <strong>tchèque</strong>s ap<strong>par</strong>tenant au<br />

type morphologique nominal, adjectival, adjectival mixte, pronominal ou numéral : R<br />

= {abatyš, ..., mlád, ..., pán, ..., žížal}.<br />

• Soit un ensemble D ⊂ L CZ *, ensemble fini de toutes <strong>les</strong> désinences des types <strong>par</strong>adigmatiques<br />

des mots <strong>tchèque</strong>s ap<strong>par</strong>tenant au type morphologique nominal, adjectival,<br />

adjectival mixte, pronominal 6 ou numéral : N = {#, a, á, ách, ám, ama, ami, at, ata,<br />

atama, atami, atech, atem, atu, atum, atům, aty, e, é, ě, ech, ěch, eho, ého, ej, ejch,<br />

ejm, ejma, ejo, em, ém, ěm, ema, ěma, emi, ěmi, emu, ému, en, ete, ěte, etem, ětem, eti,<br />

6 Les <strong>par</strong>adigmes des pronoms spécifiques já, ty, my, vy, se, kdo, co, nic, on, jenž, všechen, qui sont inscrits<br />

dans le fichier pdgm.xml comme des listes de formes lexica<strong>les</strong> complètes (voir la section 3.4.6, p. 79), font<br />

<strong>par</strong>tie de l’ensemble D au niveau technique (pour <strong>les</strong> procé<strong>du</strong>res automatiques). Pour des raisons de place, el<strong>les</strong><br />

sont représentées comme un ensemble S qui est l’ensemble des formes lexica<strong>les</strong> des pronoms spécifiques.<br />

121

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!