Algorithmique & Programmation (INF 431) - Analyse syntaxique ...

INF 431 

Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Algorithmique & Programmation 

(INF 431) 

Analyse syntaxique récursive descendante 

Benjamin Werner François Pottier 

22 mai 2013


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

La semaine dernière, nous avons présenté : 

• la notion de grammaire algébrique ; 

• des algorithmes de reconnaissance non directionnels 

et non déterministes. 

Résumé 

Ces algorithmes sont coûteux : O(n 2 ) en espace et O(n 3 ) en temps.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Peut-on avoir autant pour moins cher ? 

Peut-on espérer obtenir mieux que O(n 3 ) ? 

Valiant a donné en 1975 une variante de l’algorithme de Cocke, Younger et 

Kasami dont la complexité est celle de la multiplication de matrices 

booléennes, soit O(n 2,... ). 

Malheureusement, cela reste trop cher.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

D’où provient ce coût ? 

Les algorithmes que nous avons présentés étudient de nombreux 

sous-problèmes. 

Face au choix d’une production A → β et d’un indice de coupure j, 

ils étudient toutes les possibilités : 

 

x(Aα)ik = 

xβij ∧ xαjk 

A→β∈P i≤j≤k 

Ce non-déterminisme coûte très cher, en temps et en espace (toute l’entrée 

et tous les x(Aα)ik sont stockés en mémoire).


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Peut-on avoir moins pour moins cher ? 

Ne stockons plus l’entrée ni les résultats intermédiaires. 

Revenons à un algorithme récursif naïf et tentons de le rendre : 

• directionnel – une « tête de lecture » évoluera de gauche à droite ; 

• déterministe – face à un choix, on devra déterminer immédiatement 

quelle possibilité est « la bonne » ! 

Bien sûr, cela ne sera pas toujours possible : cette approche ne sera 

applicable qu’à certaines grammaires.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Vers un algorithme directionnel 

Dans un premier temps, reformulons notre mise en équations pour tenter 

d’introduire l’idée de directionnalité.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Vers un algorithme directionnel 

Nous avons jusqu’ici raisonné en termes de sous-problèmes booléens : 

« Étant donnés α, i et k, la phrase α engendre-t-elle input [i,k) ? » 

Nous pourrions poser une question qui appelle une réponse ensembliste : 

« Étant donnés α et i, quels sont les indices k tels que α engendre 

input [i,k) ? » 

Cela suggère cette interprétation : 

« Si la tête de lecture est en position i, et si elle consomme un mot 

engendré par α, quelles positions k peut-elle atteindre ? »


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Système d’équations ensemblistes 

Écrivons donc un système d’équations dont les inconnues Xαi dénotent des 

ensembles d’entiers : 

Xɛi = { i } 

 

Xα(i+1) 

∅ 

 

si i < n et a = input i 

sinon 

{ k | ∃j. j ∈ Xβi ∧ k ∈ Xαj } 

X(aα)i = 

X(Aα)i = 

= 

A→β∈P 

 

 

{k} 

A→β∈P j∈Xβi k∈Xαj


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Analyse descendante non déterministe 

Appliquons naïvement la technique récursive (également appelée 

descendante) pour tenter de résoudre ces équations. 

On écrit une famille de fonctions consumeα qui : 

• attendent la position i de la tête de lecture ; 

• renvoient l’ensemble des positions k que la tête de lecture peut 

atteindre après avoir consommé un mot de L(α). 

Les cas où α est un symbole a ou A suffisent.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


Pour mieux fixer les idées, voyons cela en Java. 

On se donne une classe Terminal dotée d’une méthode equals. 

On suppose donnée l’entrée : 

final Vector < Terminal > input ; 

On représente les ensembles d’entiers par des listes dont on ne cherche 

pas à éliminer les éventuels doublons.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


La fonction consumea associée à un terminal a renvoie soit l’ensemble vide, 

qui représente un échec, soit un singleton, qui représente une réussite : 

// This method recognizes the terminal symbol a. 

LinkedList < Integer > consumeTerminal ( Terminal a, int i) 

{ 

LinkedList < Integer > results = 

new LinkedList < Integer > () ; 

if (i < input . size () && a. equals ( input . get (i ))) 

results . add (i+1) ; 

return results ; 

} 

Un échec est une liste (vide) de réussites !


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


Voici consumeE pour la grammaire d’expressions arithmétiques. 

LinkedList < Integer > consumeExpression ( int i) 

{ 

LinkedList < Integer > results = 

new LinkedList < Integer > () ; 

} 

// Try E -> E + E. 

for ( int j : consumeExpression (i)) 

for ( int k : consumeTerminal ( Terminal .PLUS , j)) 

for ( int l : consumeExpression (k)) 

results . add (l) ; 

// Try every other production in the same way , 

// adding more and more results to the set . 

return results ; 

Le code est une traduction directe de la grammaire.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Que penser de ce code ? 

Cet analyseur descendant naïf est simple mais très inefficace. 

Si la grammaire est récursive à gauche, il ne termine pas. C’est le cas ici ! 

Même lorsqu’il termine, il peut avoir un coût exponentiel, à cause du 

non-déterminisme. 

Il n’est pas directionnel, à nouveau à cause du non-déterminisme.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Comment l’améliorer ? 

On souhaiterait conserver la simplicité de cette approche mais éliminer le 

non-déterminisme.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Et si un oracle nous aidait ? 

Si, au moment où se présentent n possibilités, un « oracle » pouvait garantir 

que n − 1 d’entre elles vont échouer, alors aucun choix ne serait nécessaire. 

On étudierait la dernière possibilité (qui peut encore échouer ou réussir). 

On obtiendrait un analyseur simple, déterministe, directionnel. 

On peut espérer qu’il termine toujours et soit efficace.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Et si un oracle nous aidait ? 

Concrètement, c’est la fonction consumeA qui va faire appel à l’oracle. 

Parmi toutes les productions A → β, l’oracle doit désigner « la bonne » : la 

seule qui a une chance de réussir.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Bien sûr, cela n’est pas possible en général. 

Est-ce possible ? 

D’abord, si un tel oracle existe, alors nous avons un algorithme d’analyse 

déterministe, donc, pour toute entrée input, il existe au plus un arbre de 

production. 

Donc, la grammaire doit être non ambiguë.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Est-ce possible ? 

Ensuite, on souhaite que l’oracle soit un dispositif simple, efficace, qui n’a 

accès qu’à très peu d’information. 

Ceci va restreindre encore la classe des grammaires pour lesquelles un 

oracle existe.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Qu’utilise l’oracle ? 

À quelles informations l’oracle doit-il ou peut-il avoir accès ? 

• certainement au non-terminal A dont on doit choisir l’une des 

productions ; 

• certainement à une partie de l’entrée au-delà de la tête de lecture. 

Le minimum est d’autoriser l’oracle à consulter le premier symbole de 

l’entrée au-delà de la tête de lecture (# si la fin de l’entrée est atteinte). 

Un oracle est donc une fonction qui à A et a associe (au plus) une 

production A → β. 

On peut le représenter par un tableau à deux dimensions. 

Un analyseur basé sur un tel oracle est appelé LL(1).


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Existence d’un oracle 

Pouvons-nous construire un oracle pour notre petite grammaire des 

expressions arithmétiques ? 

E → E + E 

E → E - E 

E → E * E 

E → E / E 

E → ( E ) 

E → int 

Non : cette grammaire est ambiguë, donc n’appartient pas à la classe 

LL(1).


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


Pouvons-nous construire un oracle pour la version reformulée et non 

ambiguë ? 

E → E + T T → T / F 

E → E - T T → F 

E → T F → ( E ) 

T → T * F F → int 

Non : elle n’appartient pas non plus à la classe LL(1). Pourquoi ? 

Il y a intuitivement deux raisons à cela...


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Cette grammaire est récursive à gauche. 

Récursivité à gauche 

Si à (E, a) l’oracle associe E → E + T, l’analyseur ne terminera pas. 

Mais si l’oracle ne propose jamais E → E + T, alors certains mots valides 

ne seront jamais reconnus. 

Une grammaire récursive à gauche, où E → + Eα, n’est pas LL(1).


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Cette grammaire présente des facteurs à gauche. 

Facteurs à gauche 

Pour choisir entre E → E + T et E → E - T, l’oracle devrait avoir accès au 

symbole + ou - , qui n’est pas en général le premier symbole de l’entrée. 

Une grammaire qui présente un facteur non trivial à gauche, c’est-à-dire 

deux productions A → βγ1 et A → βγ2 où L(β) {ɛ}, n’est pas LL(1).


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Élimination de la récursivité à gauche 

Pouvons-nous proposer une grammaire : 

• équivalente à la précédente – elle engendre le même langage ; 

• qui ne présente ni facteurs à gauche ni récursivité à gauche ?


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Nous avons : 


E → E + T 

E → E - T 

E → T 

Une expression E est donc « une liste de T, séparés par des + ou - . » 

En d’autres termes, c’est « un T, suivi d’un certain nombre de +T ou - T ». 

Si l’on s’autorise la répétition et le choix (notation « EBNF »), on peut écrire : 

E → T ( + T | - T ) ⋆ 

On peut aussi écrire, sous forme ordinaire : 

E → T E ′ 

E ′ → + T E ′ | - T E ′ | ɛ


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


En appliquant la même idée à T, on obtient cette nouvelle grammaire : 

E → T E ′ T → F T ′ 

E ′ → + T E ′ T ′ → * F T ′ 

E ′ → - T E ′ T ′ → / F T ′ 

E ′ → ɛ T ′ → ɛ 

F → int F → ( E ) 

qui n’est pas récursive à gauche et n’a pas de facteurs à gauche. 

Il est toujours possible de transformer une grammaire, sans modifier le 

langage engendré, pour éliminer récursivité à gauche et facteurs à gauche. 

Travail pénible si effectué manuellement !


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


Existe-t-il un oracle pour cette nouvelle grammaire ? 

La réponse est oui, comme nous allons le montrer. 

Ainsi, même si deux grammaires sont équivalentes, il se peut que l’une 

admette un oracle, donc appartienne à la classe LL(1), et l’autre pas.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Construisons un oracle 

L’existence d’un oracle n’est pas aussi immédiate qu’on pourrait le croire. 

Sachant que le prochain symbole de l’entrée est a, comment choisir entre 

les trois productions associés à E ′ ? 

E ′ → + T E ′ 

E ′ → - T E ′ 

E ′ → ɛ 

Si a { +, - }, alors il est évident que seule E ′ → ɛ peut réussir. 

Mais si a est + (par exemple), que dire ?


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


Si le prochain symbole de l’entrée est +, on voudrait annoncer que seule 

E ′ → + T E ′ peut réussir. 

Il faut donc se convaincre que E ′ → ɛ doit échouer. 

Pour cela, il faut vérifier que « + ne peut pas suivre E ′ », c’est-à-dire que le 

symbole de départ n’engendre aucune phrase de la forme αE ′ + β. 

On se convainc que E ′ ne peut être suivi que de ) ou #.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


On étudie de même le cas des symboles T ′ et F, et on obtient une table : 

E ′ T ′ F 

int F → int 

( F → ( E ) 

) E ′ → ɛ T ′ → ɛ 

+ E ′ → + T E ′ T ′ → ɛ 

- E ′ → - T E ′ T ′ → ɛ 

* T ′ → * F T ′ 

/ T ′ → / F T ′ 

# E ′ → ɛ T ′ → ɛ 

L’oracle répond en temps constant par simple consultation de cette table. 

Les cases vides de la table indiquent une erreur : l’entrée est incorrecte.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Nous avons construit un oracle 

La dernière version de notre grammaire appartient donc à la classe LL(1). 

Ceci démontre qu’elle est non ambiguë. 

La version précédente était donc déjà non ambiguë, puisqu’équivalente à 

celle-ci, mais n’appartenait pas à la classe LL(1). 

Toute grammaire LL(1) est non ambiguë ; la réciproque est fausse.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Les choses se simplifient 

Le code de l’analyseur non déterministe naïf se simplifie en deux temps. 

D’abord, il devient déterministe, donc chaque fonction renvoie une seule 

position finale (ou bien échoue via une exception). 

Ensuite, au lieu de demander une position initiale et renvoyer une position 

finale, il suffit de maintenir la position courante dans une variable globale. 

// This is the position of the read head . 

int i ; 

C’est possible car il n’y a plus de retour en arrière (« backtracking »).


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Consommer un symbole terminal 

La fonction consumea avance la tête de lecture ou échoue. 

// This method recognizes the terminal symbol a. 

void consumeTerminal ( Terminal a) 

{ 

if (i < input . size () && a. equals ( input . get (i ))) 

i++ ; 

else 

throw new Error (" Syntax error at " + i) ; 

}


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Consulter le prochain symbole terminal 

La fonction peek, utilisée par l’oracle, consulte le prochain symbole sans 

avancer la tête de lecture. 

Terminal peek () 

{ 

return i< input . size () ? input . get (i) : Terminal . EOS ; 

} 

Le symbole spécial Terminal.EOS représente #.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Consulter l’oracle et agir 

L’oracle prend la forme d’un simple switch. Voici la fonction consumeE ′ : 

void consumeExpressionTail () 

{ 

switch ( peek ()) { // Examine the next input symbol . 

case PLUS : // E ’ -> + T E ’ 

consumeTerminal ( Terminal . PLUS) ; 

consumeTerm() ; 

consumeExpressionTail() ; 

break ; 

case MINUS : // E ’ -> - T E ’ 

consumeTerminal ( Terminal . MINUS) ; 



break ; 

case RPAR : 

case EOS : // E ’ -> epsilon 

break ; // Nothing is consumed . 

default : // Error . 

throw new Error (" Syntax error at " + i) ; 

} 

}


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Agir sans consulter l’oracle 

Lorsqu’il n’y a qu’une production, inutile de consulter l’oracle. 

Voici la fonction consumeE : 

void consumeExpression () 

{ 

// E -> T E ’ 



}


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

L’algorithme est directionnel 

La tête de lecture évolue uniquement de gauche à droite. 

On peut donc modifier le code pour représenter l’entrée non pas par un 

tableau mais par un flot (« stream ») de symboles. 

interface TerminalStream { 

} 

// Returns the next symbol without consuming it . 

// Returns EOS if the end has been reached . 

Terminal peek () ; 

// Discards the next symbol , if there is one . 

// Throws Error otherwise . 

void consume () ; 

L’espace occupé par l’entrée est alors O(1).


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Terminaison 

Si consumeA a appelé (directement ou indirectement) consumeB sans que 

la tête de lecture ait avancé, alors on a A → + Bγ pour un certain γ. 

Si l’algorithme ne termine pas, alors consumeA a appelé consumeA sans 

avancer, pour un certain A. Donc, on a A → + Aγ pour un certain γ : la 

grammaire est récursive à gauche. 

Ceci contredit l’hypothèse que la grammaire est LL(1). 

Donc, l’algorithme termine toujours.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Complexité 

Mieux, le nombre d’appels de fonctions effectués sans que la tête de 

lecture avance est borné par le nombre de symboles non-terminaux. 

Il en découle que la complexité de l’algorithme est O(n) en temps et en 

espace. 

• ne pas oublier l’espace occupé par la pile des appels de fonctions !


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Optimisation des appels terminaux 

Les appels à consumeExpressionTail sont terminaux. Cette fonction peut 

être remplacée par une boucle : 

void consumeExpression () 

{ 

// E -> T E ’ 


// consumeExpressionTail : 

while ( true ) { 

switch ( peek ()) { 

case PLUS : // E ’ -> + T E ’ 



break ; // Continue looping . 

case RPAR : 


return ; // Exit the loop . 

... 

} 

} 

} 

Dans le cas de Java, cela diminue l’espace utilisé sur la pile.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Construire un arbre 

Jusqu’ici, j’ai parlé de reconnaissance : répondre par « oui » ou « non ». 

Pour l’analyse syntaxique, il faut de plus construire un arbre : 

• soit un arbre de production, 

• soit directement un arbre de syntaxe abstraite. 

La fonction consumeA renvoie alors non pas void mais un objet, parfois 

appelé « valeur sémantique ».


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


Par exemple, consumeExpression construit et renvoie une expression : 

Expression consumeExpression () 

{ 

// E -> T E ’ 

Expression head = consumeTerm() ; 

return consumeExpressionTail ( head) ; 

} 

On décide de passer head à consumeExpressionTail pour qu’elle puisse 

construire un arbre au-dessus.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 


consumeExpressionTail attend une expression left, reconnaît une partie 

de l’entrée conforme à E ′ , et construit une expression plus complexe : 

Expression consumeExpressionTail ( Expression left ) 

{ 

switch ( peek ()) { 

case MINUS : // E ’ -> - T E ’ 


Expression right = consumeTerm() ; 

// Subtraction is left - associative ! 

left = new ESubtraction (left , right) ; 

return consumeExpressionTail ( left) ; 

case RPAR : 


return left ; // Nothing is recognized . 

... 

} 

} 

Exercice : combiner ceci avec l’optimisation des appels terminaux.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Apercevant a, faut-il essayer A → β ? 

Comment construit-on l’oracle dans le cas général ? 

On doit savoir répondre, pour une production A → β et un symbole 

terminal a, à la question : 

« si le prochain symbole d’entrée est a, faut-il essayer A → β ? » 

Si pour plusieurs productions A → β la réponse est « oui », alors la 

construction échoue : il n’existe pas d’oracle. 

Sinon, on peut construire une table qui à chaque paire (A, a) associe soit 

une production A → β soit « erreur » : c’est l’oracle.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Apercevant a, faut-il essayer A → β ? 

Pour répondre à cette question, on se demande : 

« β engendre-t-il un mot qui débute par a ? » 

Si oui, on répond : « oui, il faut essayer ». 

Si non, on se demande : 

« β engendre-t-il ɛ et a peut-il suivre A ? » 

Si oui, on répond : « oui, il faut essayer », sinon, « non, échec garanti ».


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Questions à propos de la grammaire 

Il faut donc savoir répondre à trois types de questions : 

• « β engendre-t-il ɛ ? » 

• « β engendre-t-il un mot qui débute par a ? » 

• « a peut-il suivre A ? » 

Fort heureusement, ces informations sont données par la plus petite 

solution de certains systèmes d’équations booléennes (encore !).


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Écrivons nullable(α) ssi α engendre ɛ. Alors : 

nullable(ɛ) = vrai 

Caractérisation de nullable 

nullable(aα) = faux 

⎛ 

⎞ 

 

nullable(Aα) = ⎜⎝ 

nullable(β) ⎟⎠ 

∧ nullable(α) 

A→β∈P 

et les nullable(α) sont la plus petite solution de ces équations.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Caractérisation de first 

Écrivons a ∈ first(α) ssi α engendre une phrase de la forme aβ. Alors : 

a ∈ first(ɛ) = faux 

a ∈ first(bα) = a = b 

⎛ 

⎞ 

 

a ∈ first(Aα) = ⎜⎝ 

a ∈ first(β) ⎟⎠ 

∨ (nullable(A) ∧ a ∈ first(α)) 

A→β∈P 

et c’est à nouveau la plus petite solution qui nous intéresse.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Caractérisation de follow 

On ajoute à la grammaire G la production S ′ → S#. 

Écrivons a ∈ follow(B) ssi S ′ engendre une phrase de la forme αBaβ. 

Ici, a appartient à Σ ∪ {#}. On a : 

a ∈ follow(B) = 

⎛ 

⎜⎝ 

 

⎞ 

a ∈ first(β) ∨ (nullable(β) ∧ a ∈ follow(A)) ⎟⎠ 

A→αBβ∈P 

et c’est à nouveau la plus petite solution qui nous intéresse.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

En résumé 

Déterminer si G appartient à la classe LL(1), et si oui construire l’oracle, se 

fait en temps O(| G | . | Σ |).


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

Ce que nous avons vu 

Il existe une hiérarchie de formalismes plus ou moins expressifs. 

Plus le formalisme est expressif, plus la reconnaissance est coûteuse : 

• expressions régulières : espace O(1), temps O(n) ; 

• grammaires LL(1) : espace O(n), temps O(n) ; 

• grammaires algébriques arbitraires : espace O(n 2 ), temps O(n 3 ). 

Le choix d’un formalisme est donc important et demande un compromis 

entre expressivité et coût.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

D’autres échelons de cette hiérarchie. 

Ce que nous n’avons pas vu 

• la classe LR(1) : espace et temps O(n) ; contient strictement LL(1), 

autorise la récursivité et les facteurs à gauche. (Voir INF564 !) 

D’autres algorithmes d’analyse syntaxique. 

• Earley : non déterministe, directionnel, « adaptatif » : 

• O(n) si la grammaire est LR(1), 

• O(n 2 ) si elle est non ambiguë, 

• O(n 3 ) dans le cas général. 

Les outils qui transforment une grammaire en un analyseur. 

• JavaCUP, ANTLR, JavaCC, et d’autres encore (clic !) ; 

• voir le code de CalculiX pour quelques exemples.


Benjamin 

Werner, 

François 

Pottier 

Descente 

naïve 

Descente 

déterministe 

LL(1) 

Oracle 

Exemple 

Java 

Cas général 

Conclusion 

• L’analyse syntaxique est partout ! 

• décoder un fichier, décoder un message, . . . 

Que retenir ? 

• Écrivez la grammaire, vous obtiendrez un analyseur. 

• utiliser un outil existant 

• ne pas réinventer la roue ! 

• Certains formalismes sont plus expressifs que d’autres. 

• expressions régulières < LL(1) < LR(1) < grammaires arbitraires < . . . 

• choisir un formalisme adapté

Algorithmique & Programmation (INF 431) - Analyse syntaxique ...

Create successful ePaper yourself

Delete template?

Save as template?