IG3 â€œLangages, Automates, Expressions rÃ©guliÃ¨resâ€ RÃ©sumÃ© des ...

Polytech-IG3 — Langages, Automates, Grammaires, Expressions Régulières avril 2009 p. 2/ 7Définition 3 Ordre lexicographiqueSoit < Σ un ordre total arbitraire sur Σ. L’ordre lexicographique < L sur Σ ∗ est défini par :∀u, v ∈ Σ ∗ , u < L v ssi∃ w, u ′ ∈ Σ ∗ , ∃ v ′ ∈ Σ ∗ \ {ɛ} tels queu = w.u ′ , v = w.v ′ et (u ′ = ɛ ou u ′ (1) < Σ v ′ (1))1.3 LangagesDéfinition 4 Un langage sur un alphabet Σ est une partie de Σ ∗ .Les opérations sur les langages sont :– les opérations ensemblistes : l’union (∪), intersection (∩), la différence ensembliste (\), le complémentaire(dans Σ ∗ ).– le produit ou concaténation de deux langages L 1 et L 2 définis sur un alphabet Σ est le langage surΣ noté L 1 .L 2 , défini par : L 1 .L 2 = {m 1 .m 2 /m 1 ∈ L 1 et m 2 ∈ L 2 }– la fermeture de Kleene (ou étoile) d’un langage L ⊆ Σ ∗ est le langage de Σ ∗ noté L ∗ et définipar :– L 0 = {ɛ}– L n+1 = L.L n (∀n ∈ N)– L ∗ = ⋃ L ii∈N– la fermeture positive d’un langage L ⊆ Σ ∗ est le langage noté L + avec L + =2 Automates d’états finis2.1 Définitions⋃L ii∈N,i>0Définition 5 Un automate fini (en abrégé AF) A est un quintuplet < Σ, E, I, F, ∆ > où :– Σ est l’alphabet d’entrée– E est un ensemble fini dont les éléments sont appelés états– I ⊆ E est l’ensemble des états initiaux (ou états de départ)– F ⊆ E est l’ensemble des états finaux (ou états d’arrivée)– ∆ ⊆ E × Σ × E est l’ensemble des transitionsOn représente un AF A = < Σ, E, I, F, ∆ > par un graphe étiqueté tel que :– les sommets sont les états de E– à chaque transition (e 1 , a, e 2 ) ∈ ∆ correspond un arc entre les sommets e 1 et e 2 étiqueté par a ; pouréviter de dessiner trop d’arcs (et d’avoir un multi-graphe), on s’autorise à étiqueter les arcs par desensembles de symboles.– les sommets de I sont repérés par une flèche entrante et ceux associés aux états de F sont marquésd’un double cercle.Mots et chemins dans un automateDéfinition 6 Soit A =< Σ, E, I, F, ∆ > un automate d’états fini.Un chemin est une séquence de la forme (e 0 , a 0 , e 1 , a 1 , . . . , e k−1 , a k−1 , e k ) avec k ≥ 0, où les e i sont desétats, les a i des lettres de Σ et ∀i ∈ [0, k − 1], (e i , a i , e i+1 ) ∈ ∆.On dit que (e 0 , a 0 , e 1 , a 1 , . . . , e k−1 , a k−1 , e k ) est un chemin de longueur k entre les états e 0 et e k , qui a pourétiquette le mot de Σ ∗ : a 0 a 1 . . . a k−1 .En particulier pour tout état e, (e) est un chemin de longueur 0 entre e et e dont l’étiquette est ɛ.

Polytech-IG3 — Langages, Automates, Grammaires, Expressions Régulières avril 2009 p. 4/ 7Dans le cas des automates déterministes, pour simplifier les notations, nous modifions la définition dela fonction de transition en prenant comme co-domaine les états à la place des parties d’états.Ainsi pour un AFD A =< Σ, E, I = {i}, F, ∆ > la signature de la fonction de transition est :δ : E × Σ ∗ −→ E ∪ {∅} .Avec ces notations le langage reconnu par A =< Σ, E, I = {i}, F, ∆ > est L(A) = {m ∈ Σ ∗ : δ(i, m) ∈ F }.Définition 14 Soit A =< Σ, E, I, F, ∆ > un AF. L’AFD associé à A est A ′ =< Σ, E ′ , I ′ , F ′ , ∆ ′ > telque : – E ′ = 2 E– I ′ = {I}– F ′ = {Y ∈ E ′ /Y ∩ F ≠ ∅}– ∆ ′ = {(Y, a, ⋃ δ(e, a)) /Y ∈ E ′ , a ∈ Σ}e∈YOn remarquera que par construction A ′ est déterministe et complet.Lemme 1 Soient A =< Σ, E, I, F, ∆ > un AF et A ′ =< Σ, E ′ , I ′ , F ′ , ∆ ′ > l’AFD associé à A, δ et δ ′leur fonction de transition. On a :∀m ∈ Σ ∗ , ∀Y ∈ E ′ , δ ′ (Y, m) = ⋃ δ(e, m).Propriété 4 Soient A un AF et A ′ l’AFD associé à A ; alors A et A ′ sont équivalents.Théorème 1 Un langage est reconnaissable si et seulement si il est reconnu par un AFD.e∈YDéfinition 15 Un état e est accessible si et seulement si il existe un chemin de l’état initial à e.Un état e est co-accessible si et seulement si il existe un chemin de e à un état final.Propriété 5 Soit A un automate déterministe ; l’automate obtenu à partir de A en supprimant les étatsnon accessibles reconnaît le même langage que AAlgorithme de constructionL’automate construit est un automate déterministe équivalent à l’automate de départ, ne contenantque des états accessibles.Données : AFN A =< Σ, E, I, F, ∆ >Résultat : AFD A ′ =< Σ, E ′ , I ′ , F ′ , ∆ ′ > un AFD complet, sans état inaccessible et équivalent àA tq L(A) = L(A ′ ) /* E ′ ⊆ 2 E , c’est un ensemble de parties de E */I ′ = {I} ; ∆ ′ ←− ∅ ; marque(I ′ ) ←− faux ; E ′ ←− I ′ ;tant que ∃ Y ∈ E ′ et not(marque(Y )) fairemarque(Y ) ←− vrai ;pour chaque a⋃∈ Σ faireZ ←−z ;y∈Y, (y,a,z)∈∆si Z ∉ E ′ alorsrajouter Z à E ′ ; marque(Z) ←− faux ;Rajouter (Y, a, Z) à ∆ ′ ;F ′ ←− {Y ∈ E ′ /Y ∩ F ≠ ∅} ;

Polytech-IG3 — Langages, Automates, Grammaires, Expressions Régulières avril 2009 p. 6/ 7– L(∅) = ∅– L(ɛ) = {ɛ}– ∀a ∈ Σ, L(a) = {a}– r et s étant 2 expressions régulières qui décrivent les langages L(r) et L(s),– L((r)) = L(r)– L((r)|(s)) = L(r) ∪ L(s)– L((r)(s)) = L(r).L(s)– L((r) ∗ ) = (L(r)) ∗On utilisera également un autre opérateur unaire, noté +, dont le sens est (r) + = (r)((r) ∗ ).Pour simplifier les notations, on convient que :– l’opérateur unaire ∗ a la priorité maximum et son opérande est à sa gauche– la concaténation a la priorité juste inférieure et est associative à gauche– | a la plus faible priorité et est associatif à gauche– l’opérateur unaire + a la même priorité que ∗ et son opérande est à gaucheavec ces conventions : (a)|((b) ∗ (c) s’écrit a|b ∗ cRemarqueDes expressions régulières qui décrivent le même langage sont dites équivalentes ; Ex : (a|b) et (b|a).Définition 19 Un langage sur l’alphabet Σ est rationnel ssi il peut être décrit par une expression régulièresur Σ. On note Rat(Σ ∗ ) la classe des langages rationnels sur l’alphabet Σ.4.2 Théorème de KleeneD’après les propriétés de fermeture des langages reconnaissables, on sait que tout langage rationnel estreconnaissable. Le théorème suivant, dû à Kleene, établit la réciproque et montre donc l’égalité des classesdes langages reconnaissables et rationnels.Dans la suite une ER désignera également le langage qu’elle décrit. Autrement dit on confondra lesécritures r et L(r).Théorème 2 Rat(Σ ∗ ) = Rec(Σ ∗ ).5 Grammaires régulières - Langages réguliers5.1 Grammaires : définitionsDéfinition 20 Une grammaire "hors contexte" G est un quadruplet 〈A N , Σ, P, S〉 où :– A N est un ensemble de symboles ( symboles non terminaux)– Σ est un ensemble de symboles ( symboles terminaux) ; les ensembles A N et Σ n’ont pas de symbolesen commun.– S est un élément de A N appelé axiome– P est l’ensemble des productions.Chaque production est de la forme X → α avec X ∈ A N et α ∈ (A N ∪ Σ) ∗ ; X est appelé partiegauche de la production, α est appelé partie droite de la production.Pour alléger un peu l’écriture des grammaires, on peut regrouper les productions ayant même partiegauche en "règles", en utilisant le symbole | : une règle est de la forme X → α 1 |α 2 | . . . |α n et correspondà l’ensemble de n productions : {X → α 1 , X → α 2 , . . . , X → α n }.Ex : G = 〈A N = {S}, Σ = {a, b}, P = {S → a S b | ɛ}, S〉

Polytech-IG3 — Langages, Automates, Grammaires, Expressions Régulières avril 2009 p. 7/ 7Définition 21 Dérivation.– Une étape de dérivation utilisant la production X → α de P consiste à remplacer X par α dansune chaîne où figure X. D’une chaîne de la forme βXγ (où β, γ ∈ (A N ∪ Σ) ∗ ) on obtient donc pardérivation βαγ.On note βXγ ⇒ βαγ.– Une dérivation de longueur n est une séquence de n étapes de dérivation de la forme :β 0 ⇒ β 1 ⇒ . . . ⇒ β n où chaque β i ⇒ β i+1 est une étape de dérivation.– Notations :β n ⇒ γ signifie "β se dérive en γ en n étapes"β ∗ ⇒ γ signifie "β se dérive en γ en un nombre quelconque d’étapes, éventuellement nul"Définition 22Langage engendré par une grammaire.Le langage engendré par une grammaire G, noté L(G), est l’ensemble des suites d’éléments de Σ quisont dérivables à partir de l’axiome.Plus formellement, L(G) = {m ∈ Σ ∗ tq S ∗ ⇒ m}5.2 Grammaires régulières à droiteDéfinition 23 G = 〈A N , Σ, (P ), S〉 est une grammaire régulière à droite si toute production est de l’unedes formes suivantes :X → aYX → aX → ɛoù X, Y ∈ A N et a ∈ Σoù X ∈ A N et a ∈ Σoù X ∈ A NDéfinition 24 Langages réguliers.L est un langage régulier sur Σ s’il existe une grammaire G régulière à droite telle que L = L(G). Onnote Reg(Σ ∗ ) la classe des langages réguliers.Propriété 13Les langages ∅, {ɛ}, {a} sont des langages réguliers.Propriété 14 Propriétés de fermeture des langages réguliers.Si L 1 et L 2 sont des langages réguliers, alors L 1 ∪ L 2 , L 1 L 2 et L ∗ 1sont des langages réguliers.Théorème 3 Tout langage rationnel est régulier : Rat(Σ ∗ ) ⊆ Reg(Σ ∗ )Théorème 4 Tout langage régulier est reconnaissable : Reg(Σ ∗ ) ⊆ Rec(Σ ∗ )Théorème 5 Rat(Σ ∗ ) = Reg(Σ ∗ ) = Rec(Σ ∗ )

IG3 â€œLangages, Automates, Expressions rÃ©guliÃ¨resâ€ RÃ©sumÃ© des ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?

IG3 â€œLangages, Automates, Expressions rÃ©guliÃ¨resâ€ RÃ©sumÃ© des ...