05.07.2014 Views

Présentation de connaissances linguistiques pour le ... - LaLIC

Présentation de connaissances linguistiques pour le ... - LaLIC

Présentation de connaissances linguistiques pour le ... - LaLIC

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Connaissances <strong>pour</strong> l’extraction <strong>de</strong> citations<br />

dans une base <strong>de</strong> données et organisées selon un formalisme <strong>de</strong> règ<strong>le</strong>s en format déclaratif<br />

dans un premier temps et ensuite codées en Java.<br />

4.1. Les classes <strong>de</strong>s indicateurs déc<strong>le</strong>ncheurs<br />

4.1.1. Les indicateurs typographiques<br />

- : « chaîne <strong>de</strong> caractères » : ceci est <strong>le</strong> marqueur par excel<strong>le</strong>nce d’introduction d’une<br />

citation directe.<br />

- « chaine <strong>de</strong> caractères (Chiffre arabe ou/et donnée bibliographique) » : ce<br />

marqueur renvoie à la source <strong>de</strong> la citation dans <strong>le</strong> cas où il est précédé par <strong>de</strong>s<br />

guil<strong>le</strong>mets.<br />

- « chaine <strong>de</strong> caractères (…) » ou « chaine <strong>de</strong> caractères […] », incise elliptique (...)<br />

ou [...], signa<strong>le</strong> la présence <strong>de</strong> données omises dans une citation.<br />

Ces trois marqueurs ne nécessitent pas <strong>de</strong>s indices complémentaires. Leur présence suffit <strong>pour</strong><br />

détecter une citation directe.<br />

4.1.2. Les indicateurs langagiers<br />

-Les verbes d’introduction <strong>de</strong> la citation : nous avons repéré 209 verbes<br />

d’introduction <strong>de</strong> citation (annexe A).<br />

-Les noms et <strong>le</strong>s prépositions (tab<strong>le</strong> 1). Ce sont <strong>de</strong>s introducteurs <strong>de</strong> citation dans <strong>le</strong>s<br />

cas où ils sont suivis ou précédés d’une entité nommée.<br />

À ces yeux De la part <strong>de</strong> L'affirmation <strong>de</strong> L'opinion <strong>de</strong><br />

Aux yeux <strong>de</strong> La conclusion <strong>de</strong> L'avis <strong>de</strong> Pour<br />

Ce vœu <strong>de</strong> La déclaration <strong>de</strong> Le jugement <strong>de</strong> Par ces mots<br />

Conformément à La position <strong>de</strong> Le terme <strong>de</strong> Selon<br />

D'après La thèse <strong>de</strong> L'observation <strong>de</strong> Suivant<br />

4.2. Les classes <strong>de</strong>s indices complémentaires<br />

4.2.1. Les indices typographiques<br />

Tab<strong>le</strong> 1: <strong>le</strong>s noms et <strong>le</strong>s prépositions<br />

- : l’“italique” est souvent utilisé <strong>pour</strong> insérer une citation directe entre<br />

guil<strong>le</strong>mets.<br />

- ! et ? sont, souvent, <strong>de</strong>s signes <strong>de</strong> discours rapporté dans <strong>le</strong>s romans.<br />

4.2.2. Les indices langagiers<br />

- Les entités nommées, incluent <strong>le</strong>s noms propres, <strong>le</strong>s abréviations et <strong>le</strong>s noms<br />

d’organismes (sociétés, institutions…). Cette classe fait partie d’un modu<strong>le</strong> développé par<br />

Slim BEN-HAZEZ (BEN-HAZEZ 00).<br />

- Les activités professionnel<strong>le</strong>s, (« Activity_Attribution ») incluent <strong>le</strong>s noms <strong>de</strong>s<br />

différents métiers. (directeur, journaliste, avocat, etc.).<br />

- La complétive : que ; (déclare que, dit que, annonce que, disait que, etc.).<br />

- La classe référentiel<strong>le</strong> : lui, el<strong>le</strong>, eux ; (selon lui, <strong>pour</strong> eux, etc.).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!