Présentation de connaissances linguistiques pour le ... - LaLIC
Présentation de connaissances linguistiques pour le ... - LaLIC
Présentation de connaissances linguistiques pour le ... - LaLIC
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Connaissances <strong>pour</strong> l’extraction <strong>de</strong> citations<br />
dans une base <strong>de</strong> données et organisées selon un formalisme <strong>de</strong> règ<strong>le</strong>s en format déclaratif<br />
dans un premier temps et ensuite codées en Java.<br />
4.1. Les classes <strong>de</strong>s indicateurs déc<strong>le</strong>ncheurs<br />
4.1.1. Les indicateurs typographiques<br />
- : « chaîne <strong>de</strong> caractères » : ceci est <strong>le</strong> marqueur par excel<strong>le</strong>nce d’introduction d’une<br />
citation directe.<br />
- « chaine <strong>de</strong> caractères (Chiffre arabe ou/et donnée bibliographique) » : ce<br />
marqueur renvoie à la source <strong>de</strong> la citation dans <strong>le</strong> cas où il est précédé par <strong>de</strong>s<br />
guil<strong>le</strong>mets.<br />
- « chaine <strong>de</strong> caractères (…) » ou « chaine <strong>de</strong> caractères […] », incise elliptique (...)<br />
ou [...], signa<strong>le</strong> la présence <strong>de</strong> données omises dans une citation.<br />
Ces trois marqueurs ne nécessitent pas <strong>de</strong>s indices complémentaires. Leur présence suffit <strong>pour</strong><br />
détecter une citation directe.<br />
4.1.2. Les indicateurs langagiers<br />
-Les verbes d’introduction <strong>de</strong> la citation : nous avons repéré 209 verbes<br />
d’introduction <strong>de</strong> citation (annexe A).<br />
-Les noms et <strong>le</strong>s prépositions (tab<strong>le</strong> 1). Ce sont <strong>de</strong>s introducteurs <strong>de</strong> citation dans <strong>le</strong>s<br />
cas où ils sont suivis ou précédés d’une entité nommée.<br />
À ces yeux De la part <strong>de</strong> L'affirmation <strong>de</strong> L'opinion <strong>de</strong><br />
Aux yeux <strong>de</strong> La conclusion <strong>de</strong> L'avis <strong>de</strong> Pour<br />
Ce vœu <strong>de</strong> La déclaration <strong>de</strong> Le jugement <strong>de</strong> Par ces mots<br />
Conformément à La position <strong>de</strong> Le terme <strong>de</strong> Selon<br />
D'après La thèse <strong>de</strong> L'observation <strong>de</strong> Suivant<br />
4.2. Les classes <strong>de</strong>s indices complémentaires<br />
4.2.1. Les indices typographiques<br />
Tab<strong>le</strong> 1: <strong>le</strong>s noms et <strong>le</strong>s prépositions<br />
- : l’“italique” est souvent utilisé <strong>pour</strong> insérer une citation directe entre<br />
guil<strong>le</strong>mets.<br />
- ! et ? sont, souvent, <strong>de</strong>s signes <strong>de</strong> discours rapporté dans <strong>le</strong>s romans.<br />
4.2.2. Les indices langagiers<br />
- Les entités nommées, incluent <strong>le</strong>s noms propres, <strong>le</strong>s abréviations et <strong>le</strong>s noms<br />
d’organismes (sociétés, institutions…). Cette classe fait partie d’un modu<strong>le</strong> développé par<br />
Slim BEN-HAZEZ (BEN-HAZEZ 00).<br />
- Les activités professionnel<strong>le</strong>s, (« Activity_Attribution ») incluent <strong>le</strong>s noms <strong>de</strong>s<br />
différents métiers. (directeur, journaliste, avocat, etc.).<br />
- La complétive : que ; (déclare que, dit que, annonce que, disait que, etc.).<br />
- La classe référentiel<strong>le</strong> : lui, el<strong>le</strong>, eux ; (selon lui, <strong>pour</strong> eux, etc.).