05.07.2014 Views

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ANNOTATION MORPHOLOGIQUE<br />

La complexité d’un document XML est déterminée <strong>par</strong> la propriété récursive des éléments<br />

qui peuvent à leur tour contenir un ou plusieurs éléments. La seule condition est<br />

que <strong>les</strong> balises de deux éléments distincts ne se chevauchent pas : il n’est pas possible<br />

d’écrire contenu Acontenu B mais il est<br />

nécessaire d’écrire contenu Acontenu B.<br />

Un fichier DTD (Document Type Definition) peut être assigné à un document XML. Il<br />

spécifie <strong>les</strong> noms des éléments et des attributs, <strong>les</strong> restrictions sur leur contenu et l’organisation<br />

hiérarchique des éléments. Un document XML est bien formé, s’il observe <strong>les</strong> règ<strong>les</strong><br />

de la syntaxe XML ; il est valide, s’il observe <strong>les</strong> règ<strong>les</strong> établies dans un fichier DTD <strong>par</strong><br />

l’auteur <strong>du</strong> document.<br />

L’avantage de la structuration des données avec le format XML est la facilité de la création<br />

et de la modification d’un tel fichier. Grâce aux noms des balises qui reflètent leur<br />

contenu, <strong>les</strong> éléments sont facilement repérab<strong>les</strong> « à l’œil nu », ce qui permet un contrôle<br />

des données et leur modification directement dans le fichier. La prise en charge <strong>du</strong> format<br />

XML est <strong>par</strong>faitement assurée <strong>par</strong> le langage PHP (le langage de programmation utilisé pour<br />

le développement <strong>du</strong> CETLEF) : <strong>les</strong> données en XML sont facilement accessib<strong>les</strong> pour <strong>les</strong><br />

traitements linguistiques sur CETLEF ainsi que pour leur affichage sur <strong>les</strong> pages HTML 15 .<br />

3.4.2.2 Structure <strong>du</strong> fichier pdgm.xml<br />

Le fichier pdgm.xml (voir un extrait de ce fichier sur la fig. 3.5, p. 68) reflète l’organisation<br />

des types <strong>par</strong>adigmatiques qui viennent d’être présentés. Sa structure ainsi que <strong>les</strong> valeurs<br />

permises de certains attributs sont définis dans le fichier pdgm.dtd (voir la fig. 3.4).<br />

L’élément racine contient plusieurs éléments , chaque élément <br />

contient plusieurs éléments . La valeur de l’attribut @tagMorph des éléments <br />

frères est identique. Ainsi, chaque élément contient tous <strong>les</strong> types <strong>par</strong>adigmatiques<br />

qui ap<strong>par</strong>tiennent à un certain type morphologique. Par exemple, pour la déclinaison nominale,<br />

l’attribut @tagMorph de l’élément a la valeur N ; pour la déclinaison adjectivale,<br />

l’attribut @tagMorph de l’élément a la valeur A) et ainsi de suite. Chaque<br />

élément est donc défini <strong>par</strong> la valeur de l’attribut @tagMorph ainsi que <strong>par</strong> la valeur<br />

de l’attribut @modèle qui contient le mot modèle défini pour chaque type <strong>par</strong>adigmatique<br />

(<strong>par</strong> exemple pán, předseda, jarní, ten).<br />

Chaque élément contient un ou plusieurs éléments qui sont définis<br />

<strong>par</strong> <strong>les</strong> attributs @mnemo et @pdgm. L’attribut @mnemo contient un lexème qui sert pour marquer<br />

15 Pour plus de détails sur <strong>les</strong> moyens de programmation utilisés pour le développement <strong>du</strong> CETLEF, voir le<br />

chapitre 5 Implémentation, pp. 195–236.<br />

66

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!