22.06.2013 Views

Analyse syntaxique à l'aide des tables du Lexique ... - Accueil

Analyse syntaxique à l'aide des tables du Lexique ... - Accueil

Analyse syntaxique à l'aide des tables du Lexique ... - Accueil

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ShP1 et StP1<br />

2.1 <strong>Analyse</strong> <strong>syntaxique</strong><br />

Les deux analyseurs ShP1 et StP1 (Vanrullen et al., 2006) sont inclus dans une<br />

chaîne de traitement qui est composée d’un segmenteur par règles, et d’un lexique<br />

couvrant <strong>du</strong> français, qui alimentent l’entrée d’un étiqueteur morpho-<strong>syntaxique</strong><br />

probabiliste. Ce sont deux analyseurs de surface, l’un symbolique et l’autre stochastique.<br />

L’analyseur symbolique ShP1 est un analyseur déterministe. Il repose sur les<br />

Grammaire de Propriétés avec une stratégie de coin gauche. La grammaire utilisée<br />

est complète en ce sens qu’elle peut être utilisée indifféremment pour une analyse<br />

profonde ou superficielle. La particularité de ShP1 est de s’appuyer sur un sousensemble<br />

de contraintes de la grammaire (en particulier les propriétés de linéarité et<br />

de constituance) pour identifier les coins gauches. La stratégie consiste <strong>à</strong> repérer <strong>à</strong><br />

partir <strong>des</strong> coins gauches la frontière droite <strong>du</strong> chunk sur la base <strong>des</strong> autres propriétés.<br />

L’analyseur stochastique StP1, comme leur étiqueteur, est basé sur le modèle <strong>des</strong><br />

patrons (Blache et Rauzy, 2006), un modèle de Markov caché plus performant que<br />

les modèles de type N-grammes.<br />

Cordial<br />

Cordial (CORrecteur D’Imprécisions et <strong>Analyse</strong>ur Lexico-sémantique) (Laurent<br />

et al., 2009) est un analyseur <strong>syntaxique</strong> et sémantique développé par la société<br />

Synapse Développement. Il est conçu <strong>à</strong> l’origine pour la correction orthographique<br />

et grammaticale. Il associe <strong>à</strong> <strong>des</strong> règles générales et très peu liées aux attributs de<br />

genre et de nombre (analyseur <strong>à</strong> relâchement de contraintes) un ensemble d’outils<br />

statistiques, en particulier pour effectuer la désambiguïsation grammaticale.<br />

Développé au début <strong>des</strong> années 90 mais constamment maintenu et enrichi depuis,<br />

Cordial est le fondement de nombreux développements : composants linguistiques<br />

de nettoyage automatique de texte, extracteur de mots-clés et de phrases-clés, extracteur<br />

de thèmes et de concepts, extracteur de terminologie et d’entités nommées,<br />

moteur de question-réponse. Conçu pour la langue française, Cordial est devenu bilingue,<br />

l’analyseur <strong>syntaxique</strong> et de nombreuses ressources ayant été progressivement<br />

adaptées pour la langue anglaise.<br />

SYGMART<br />

L’analyseur SYGFRAN (Béchet, 2009) est basé sur le système SYGMART<br />

(Système Grammatical de Manipulation Algorithmique et Récursive de Texte). C’est<br />

un système transformationnel prenant en entrée une chaîne de caractères et proposant<br />

en sortie une structure arborescente. Il se fonde sur les algorithmes de Markov,<br />

éten<strong>du</strong>s aux arbres. Il permet d’analyser tout langage dont la grammaire pourrait<br />

être écrite sous forme de trans<strong>du</strong>cteurs d’arbres. L’analyseur SYGFRAN génère une<br />

analyse en constituants d’un énoncé en français. Il est constitué de plus de 11 000<br />

règles dans le but de pro<strong>du</strong>ire une analyse morpho-<strong>syntaxique</strong> de la langue française.<br />

25

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!