05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 6 : Annotation et fiches <strong>de</strong> synthèse catégorisées<br />

les besoins <strong>de</strong> l’utilisateur ou du type <strong>de</strong> <strong>résumé</strong> <strong>de</strong>mandé (indicatif,<br />

informatif, etc.)<br />

– les fiches <strong>de</strong> synthèse qui, nous le verrons, permettent <strong>de</strong> présenter <strong>de</strong><br />

telles informations d’une manière fortement structurée et ordonnée.<br />

<strong>Le</strong>ur principal intérêt est qu’elles offrent à l’utilisateur la possibilité <strong>de</strong><br />

mieux faire apparaître par rapport aux <strong>résumé</strong>s <strong>de</strong>s informations<br />

pertinentes provenant d’un ou plusieurs <strong>textes</strong>.<br />

Nous allons maintenant revenir plus particulièrement sur la notion <strong>de</strong> fouille<br />

sémantique <strong>de</strong> <strong>textes</strong> dans le contexte <strong>de</strong> notre travail, car la notion <strong>de</strong> fiches <strong>de</strong><br />

synthèse, que nous proposerons, découlera en gran<strong>de</strong> partie <strong>de</strong> celle-ci.<br />

1.3. Fouille sémantique <strong>de</strong> texte<br />

L’annotation sémantique que nous effectuons <strong>automatique</strong>ment sur les <strong>textes</strong> à<br />

partir d’EXCOM est, comme nous l’avons vu, la principale étape dans la construction<br />

<strong>de</strong> <strong>résumé</strong>s selon notre approche. Toutefois, l’annotation sémantique <strong>de</strong> <strong>textes</strong> peut<br />

servir à bien d’autres tâches, comme celle plus générale <strong>de</strong> fouille textuelle <strong>de</strong> niveau<br />

sémantique. En effet, à partir <strong>de</strong>s règles d’exploration contextuelle que nous avons<br />

présentées au chapitre 3 et avec leur annotation correspondante, il est possible<br />

d’exploiter ces annotations sur les <strong>textes</strong> en fonction <strong>de</strong> points <strong>de</strong> vue <strong>de</strong> fouille<br />

sémantique [Blais et Desclés 2008]. Un point <strong>de</strong> vue <strong>de</strong> fouille sémantique correspond à<br />

une recherche textuelle à travers une ou plusieurs catégories sémantiques (discursives<br />

plus précisément) déterminées par les besoins d’un type d’utilisateur. Un lecteur qui<br />

recherche dans un texte <strong>de</strong>s informations appartenant à <strong>de</strong>s catégories discursives<br />

précises (opinions, résultats, etc.) élabore lui aussi un point <strong>de</strong> vue <strong>de</strong> fouille sémantique<br />

qui va se focaliser sur certains éléments du texte. <strong>Le</strong> lecteur exécute généralement pour<br />

cela une lecture superficielle et rapi<strong>de</strong> du texte en s’arrêtant sur <strong>de</strong>s marques<br />

linguistiques <strong>de</strong> surface qui lui indiquent, grâce aux catégories discursives auxquelles<br />

elles se réfèrent, si le ou les segments concernés contiennent les informations qu’il<br />

recherche ou non. Dans EXCOM, le lancement d’une annotation sur un texte à partir <strong>de</strong><br />

règles associées à l’i<strong>de</strong>ntification <strong>de</strong> certaines catégories discursives (comme les<br />

327

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!