MASTER MVA Dynamique et contrÃ´le des systÃ¨mes non-linÃ©aires

ENS CACHAN: MASTER MVA 

Dynamique et contrôle 

des systèmes non-linéaires 

(en collaboration avec Karine Beauchard) 

Pierre Rouchon 

Mines ParisTech 

Deux liens pour télécharger les documents du cours: 

http://www.cmla.ens-cachan.fr/Membres/beauchard/enseignements.html 

http://cas.ensmp.fr/~rouchon/index.html 

2009/2010

Linéarisation et systèmes différentiellement plats 

Linéarisation par bouclage statique 

Systèmes différentiellement plats 

Observateurs asymptotiques et filtrage 

Observabilité 

Systèmes linéaires 

Observateurs asymptotiques linéaires 

Observateurs asymptotiques non-linéaires 

Observateur/contrôleur linéaire: le double pendule de la 

Villette 

Observateurs invariants 

Invariance et fusion de données inertielles/images 

Modèle cinématique à base d’accéléromètres et gyromètres 

Fusion après un premier traitement d’images 

Fusion à partir d’images brutes 

Références utiles

La linéarisation par bouclage statique 

Pour d dt 

x = f (x, u), trouver le changement de variable sur x et 

le bouclage statique régulier sur u 

[ [ ] 

x z = φ(x) 

↦→ 

u] 

v = k(x, u) 

tels que les équations deviennent linéaires (système linéaire 

commandable, voir le cours de Karine Beauchard): 

d 

z = Az + Bv 

dt 

On parle alors de système linéarisable par bouclage statique. 

Pour les robots complètement actionnés, on se ramène par 

simple bouclage (sans changement d’état) à la forme de 

Brunovsky 

d 2 

dt 2 q = v.

Un résultat simple sur la linéarisation par bouclage statique 

Les deux propositions suivantes sont équivalentes 

1. Le système étendu : 

⎧ 

d ⎪⎨ x = f (x, u) 

dt 

⎪⎩ d 

dt u = v 

est linéarisable par bouclage statique (v est ici la 

commande) 

2. Le système : 

d 

x = f (x, u) 

dt 

est linéarisable par bouclage statique. 

Exo: Prouvez cette équivalence.

Système affine en contrôle 

d 

dt x = f (x) + g 1(x)u 1 + . . . + g m (x)u m 

où f et les g i sont des champs de vecteurs. 

On définit une suite de distributions, suite croissante pour l’inclusion, 

par la récurrence suivante 1 : 

E 0 = span{g 1 , . . . , g m }, E i = span{E i−1 , [f , E i−1 ]} i ≥ 1 

où [f , g] est le crochet de Lie de deux champs de vecteurs. Ces 

distributions et le crochet sont invariants par changement de 

coordonnées. 

Le crochet [f , g] correspond à Df .g − Dg.f : 

∑ 

( ∂fi 

g j − ∂g ) 

i 

f j . 

∂x j ∂x j 

j 

Calcul différentiel intrinsèque, i.e., indépendant du choix des 

coordonnées locales x. 

1 En chaque pour x, E O (x) corresponds à l’espace vectoriel engendré par 

les vecteurs (g 1 (x), g 2 (x), . . . , g m(x)).

La CNS de linéarisation par bouclage statique 

Théorème de Jakubczyk et Respondek (1980): autour de 

l’équilibre (x, u) = (0, 0), le système 

d 

dt x = f (x) + g 1(x)u 1 + . . . + g m (x)u m 

est linéarisable par bouclage statique régulier si, et seulement 

si, les distributions E i , i = 1, . . . , n − 1 définies ci-dessus sont 

involutives, c’est à dire stables par le crochet de Lie, de rang 

constant autour de x = 0 et le rang de E n−1 vaut n, la 

dimension de x.

Systèmes plats: une définition élémentaire (FLMR, 1992,. . . ,1999) 

Le système explicite d’état 

d 

x = f (x, u) 

dt 

est plat, ssi, il existe m = dim(u) fonctions de sortie 

y = h(x, u, . . . , u (p) ), dim(h) = dim(u), telle que l’inverse du système 

u ↦→ y soit sans dynamique. Cela signifie simplement que la solution 

de 

d 

dt x = f (x, u), y = h(x, u, . . . , u(p) ) 

où t ↦→ y(t) est la donnée et (x, u) est l’inconnue s’écrit 

( 

x = Λ y, ẏ, . . . , y (q)) ( 

, u = Υ y, ẏ, . . . , y (q+1)) . 

La sortie y est appelée sortie plate. 

Exo: Montrer que le robot "E=M6" 

d 

dt x 1 = u 1 + u 2 

cos x 3 , 

2 

d 

dt x 2 = u 1 + u 2 

sin x 3 , 

2 

d 

dt x 3 = u 2 − u 1 

p 

admet (x 1 , x 2 ) comme sortie plate (p > est une longueur).

Inversion et algorithme de structure 

⎧ 

⎪⎨ 

⎪⎩ 

x = f (x, u) et 

y = h(x) avec dim y = dim u (u est 

l’entrée et y la sortie). 

On suppose t ↦→ y(t) donné. On 

cherche à calculer x et u. Le principe: 

Inversion du système d 

d 

dt x dt 

1 = x 1 x 2 + u 1 

d 

dt x 2 = x 1 x 2 + x 3 + u 1 

d 

dt x 3 = x 3 + x 4 + u 2 

d 

dt x 4 = x 3 x 4 + λx 4 + u 2 

y 1 = x 1 

y 2 = x 2 

les dérivées successives de y(t) = 

h(x) donnent des équations reliant x 

et u.

Le critère des variétés réglées (R.1994) 

Si on élimine u des n = dim x équations d’état d dt 

x = f (x, u) on 

obtient un système sous-déterminé de n − m équations 

différentielles et n inconnues x (système implicite 

sous-déterminé): F ( x, d dt x) = 0. 

Critère des variétés réglées: si F ( x, d dt x) = 0 est plat, alors 

pour tout (x, p) tel que F(x, p) = 0, existe a ≠ 0 tel que, pour 

tout λ ∈ R, F(x, p + λa) = 0. 

Caractérisation pour dim F = dim x − 1 (système à un seul 

contrôle): la CNS de linéarisation par bouclage statique (les 

seules variétés réglées de dimension 1 sont des droites). 

Exo: Sous quelle(s) condition(s) sur le paramètre α, le système 

d 

dt x 1 = u 1 , 

d 

dt x 2 = u 2 , 

d 

dt x 3 = (u 1 ) 2 − α (u 2 ) 2 

vérifie-t-il le critère des variétés réglées. Quand ces conditions 

sont satisfaites, montrer que le système est alors effectivement 

plat en exhibant une sortie plate.

Un peu d’histoire 

◮ Monge (1784) montre que la solution générale de l’équation du 

premier ordre (équation qui porte son nom) 

( 

dy 

dx = F x, y, z, dz ) 

dx 

s’exprime via une fonction arbitraire d’une variable et de ses 

dérivées jusqu’à l’ordre 2. Monge dit que le système est 

intégrable bien qu’il soit sous-déterminé. Exemple: dy 

dx = x dz 

dx 

avec y = w(z) et x = w ′ (z). 

◮ Hilbert (1912) se demandait si la solution ( générale) 

de l’équation 

de Monge du second ordre d 2 y 

d 2 x = F x, y, z, dy 

dx , dz 

dx 

s’exprime 

sans intégrale comme celle de l’équation du premier ordre. Il 

montre qu’en général ce n’est pas le cas et que ce problème est 

lié à la classification des systèmes sous-déterminés via un 

groupe de transformations inversibles et sans intégrale. Il 

propose une analogie suggestive avec la classification des 

variétés algébriques via le groupe des transformations 

bi-rationnelles.

Cinématique de la voiture 

Intérêt essentiel des systèmes plats: la planification de 

trajectoires illustrée ici sur la voiture (avec remorques). 

P 

⎧ 

⎪⎨ 

⎪⎩ 

d 

dt x = v cos θ 

d 

dt y = v sin θ 

d 

dt θ = v l 

tan ϕ = ω 

⎧ 

⎪⎨ 

⎪⎩ 

v 

[ 

= ±‖ 

] 

d dt P‖ 

cos θ 

= d dt P 

sin θ v 

tan ϕ = l det(¨P,Ṗ) √ v |v|

Symétrie par changement d’échelle de temps 

Pour tout changement d’échelle de temps T ↦→ σ(T ), la 

transformation 

t = σ(T ), (x, y, θ) = (X, Y , Θ), (v, ω) = (V , Ω)/σ ′ (T ) 

laisse les équations 

inchangées : 

d 

d 

x = v cos θ, 

dt 

d 

y = v sin θ, 

dt 

dt θ = ω 

d 

d 

X = V cos Θ, 

dT 

d 

Y = V sin Θ, 

dT 

dT Θ = Ω. 

Prototype d’invariance d’un système par rapport à un groupe 

de transformations.

Le groupe des déplacements du plan SE(2), comme groupe de 

symétries 

Pour tout (a, b, α), la transformation 

[ [ ] 

x X cos α − Y sin α + a 

= 

, θ = Θ − α, (v, ω) = (V , Ω) 

y] 

X sin α + Y cos α + b 

laisse les équations 

inchangées : 

d 

d 

x = v cos θ, 

dt 

d 

d 

X = V cos Θ, 

dt 

d 

y = v sin θ, 

dt 

d 

Y = V sin Θ, 

dt 

dt θ = ω 

dt Θ = Ω. 

Il faut que notre méthode de contrôle préserve cette invariance.

Systèmes invariants et symétries 

◮ Les données sont un système commandé d dt 

x = f (x, u), 

x ∈ X ⊂ R n et u ∈ U ⊂ R m et un groupe G (a priori non 

commutatif) dont la loi de composition est notée g 1 .g 2 ∈ G pour 

tout g 1 , g 2 ∈ G et l’élément neutre est noté e (e.g = g et 

g −1 .g = g.g −1 pour tout g ∈ G). 

◮ On considère, associé G, le groupe de transformations sur 

l’espace d’état X , (ϕ g ) g∈G où pour chaque g, ϕ g est un 

difféomorphisme régulier (au moins C 1 ) sur X avec ϕ −1 

g = ϕ g −1 

et ϕ g1 ◦ ϕ g2 = ϕ g1 .g 2 

. On parle alors de l’action de G sur X via le 

groupe de transformations (ϕ g ). On considère de même l’action 

de G sur U via le groupe de transformations (ψ g ) g∈G . 

◮ On en déduit l’action de G sur X × U via (X, U) = ( ϕ g (x), ψ g (u)). 

Le système d dt 

x = f (x, u) est dit invariant si, et seulement si, 

f ( ϕ g (x), ψ g (u) ) = Dϕ g (x) · f (x, u) pour tout g, x, u. Cela signifie 

que les équations en (X, U) d dt 

X = f (X, U) sont les mêmes que 

celles en (x, u). G est simplement un groupe de symétries du 

système: si (x(t), u(t)) est une trajectoire, alors ∀g ∈ G, 

(ϕ g (x(t)), ψ g (u(t))) est aussi une trajectoire du système.

Le suivi de trajectoire invariant 

translation 

+ rotation 

Le contrôleur ne doit pas dépendre des origines prises pour les 

positions et pour l’orientation: la dynamique par rapport à la 

trajectoires de référence doit être indépendante de ce choix 

d’origines.

Construction du suivi invariant 

Soit une trajectoire de référence décrite ainsi (s r est l’abscisse 

curviligne) 

t ↦→ s r ↦→ P r (s r ), θ r (s r ), v r = d dt s r , ω r = κ r (s r ) d dt s r 

et l’état actuel de la voiture (P, θ) 

Trouver des corrections invariantes 

v = v r + . . . , ω = ω r + . . . 

de sorte que P ↦→ P r quand t augmente.

Invariance par changement d’échelle de temps 

On pose 

v = ¯v d dt s r , 

ω = ¯ω d dt s r 

avec ′ pour la dérivée par rapport à s r . 

Les équations restent les mêmes 

P ′ = ¯v ⃗τ, 

⃗τ ′ = ¯ω ⃗ν 

avec P = (x, y), ⃗τ = (cos θ, sin θ) et ⃗ν = (− sin θ, cos θ).

Les erreurs invariantes 

On construit le bouclage de suivi en utilisant des techniques de 

découplage entrée/sortie avec comme sorties les deux erreurs 

suivantes : 

e ‖ = (P − P r ) · ⃗τ r , 

e ⊥ = (P − P r ) · ⃗ν r 

et comme les entrées ¯v et ¯ω.

Calcul des dérivées de e ‖ et e ⊥ 

Comme e ‖ = (P − P r ) · ⃗τ r et e ⊥ = (P − P r ) · ⃗ν r on a (avec 

′ = d/ds r ) 

e ′ ‖ = (P′ − P ′ r ) · ⃗τ r + (P − P r ) · ⃗τ ′ r . 

Mais P ′ = ¯v⃗τ, P ′ r = ⃗τ r et ⃗τ ′ r = κ r ⃗ν r , donc 

De même pour e ′ ⊥ on a : 

e ′ ‖ = ¯v⃗τ · ⃗τ r − 1 + κ r (P − P r ) · ⃗ν r . 

e ′ ‖ = ¯v cos(θ − θ r ) − 1 + κ r e ⊥ , e ′ ⊥ = ¯v sin(θ − θ r ) − κ r e ‖ .

Calcul approché pour e ‖ avec θ ≈ θ r 

Comme e ′ ‖ ≈ ¯v − 1 + κ r e ⊥ , le bouclage ¯v = 1 − κ r e ⊥ − e ‖ /L ‖ 

avec L ‖ le gain qui est ici une longueur à choisir du même ordre 

que celle de la voiture, conduit, pour e ‖ à une dynamique 

exponentiellement stable en boucle fermée : 

e ′ ‖ = −e ‖/L ‖

Calcul approché pour e ⊥ avec θ ≈ θ r , e ‖ ≈ 0 et ¯v ≈ 1 

Comme e ′ ⊥ ≈ (θ − θ r ), il faut dériver une fois de plus pour voir 

apparaître l’autre contrôle ¯ω = θ ′ . A des termes d’ordre 2 près, 

on a donc 

e ′′ ⊥ ≈ (¯ω − ¯ω r ) 

Alors le bouclage (les gains ξ et 1/ϖ sont autour de 1 et de la 

dimension de la voiture) 

¯ω = ¯ω r − 2ξϖe ′ ⊥ − ϖ2 e ⊥ 

assure une dynamique du second ordre linéaire et 

exponentiellement stable pour e ⊥ 

e ′′ ⊥ = −2ξϖe′ ⊥ − ϖ2 e ⊥

Les calculs rigoureux 

La dérivation de 

e ′ ‖ = ¯v cos(θ − θ r ) − 1 + κ r e ⊥ , 

e ′ ⊥ = ¯v sin(θ − θ r ) − κ r e ‖ 

par rapport à s r donne 

e ′′ 

‖ = ¯v ′ cos(θ − θ r ) − ¯ω¯v sin(θ − θ r ) 

+ 2κ r ¯v sin(θ − θ r ) + κ ′ r e ⊥ − κ 2 r e ‖ 

e ′′ ⊥ = ¯v ′ sin(θ − θ r ) + ¯ω¯v cos(θ − θ r ) 

− 2κ r ¯v cos(θ − θ r ) − κ ′ r e ‖ + κ r + κ 2 r e ‖ .

Le feedback dynamique en échelle s r 

On a 

e ′′ 

‖ = ¯v ′ cos(θ − θ r ) − ¯ω¯v sin(θ − θ r ) + W ‖ 

e ′′ ⊥ = ¯v ′ sin(θ − θ r ) + ¯ω¯v cos(θ − θ r ) + W ⊥ 

On choisit ¯v ′ et ¯ω de sorte que 

( ) ( 

e 

‖ ′′ = − 1 

L 1 + 1 

‖ 

L 2 e 

‖ ′ − 

‖ 

( 1 

e ⊥ ′′ = − L 1 + 1 

⊥ 

L 2 ⊥ 

1 

L 1 ‖ L2 ‖ 

) 

) 

e ′ ⊥ − ( 1 

L 1 ⊥ L2 ⊥ 

e ‖ 

) 

e ⊥ 

C’est possible pour une large plage autour de la trajectoire de 

référence car ¯v ≈ 1.

Le feedback dynamique en échelle t 

En échelle s r on a 

¯v ′ = Φ(¯v, P, P r , θ, θ r , κ r , κ ′ r ) 

¯ω = Ψ(¯v, P, P r , θ, θ r , κ r , κ ′ r ) 

Comme ′ = d/ds r = d/( d dt s r dt) on a 

d ¯v 

= Φ(¯v, P, P r , θ, θ r , κ r , κ ′ r ) ṡ r (t) 

dt 

¯ω = Ψ(¯v, P, P r , θ, θ r , κ r , κ ′ r ) 

avec 

v = ¯v d dt s r (t), 

tan φ = l ¯ω¯v 

Rien n’explose pour d dt s r (t) proche de 0: une utilisation de 

l’invariance par échelle de temps.

Véhicule à n remorques 

◮ Roulement sans glissement: 

la vitesse de chaque P i est 

parallèle à la direction θ i de la 

remorque i de longueur 

d i > 0. 

◮ P 0 de coordonnées 

cartesiennes (x 0 , y 0 ); les deux 

contrôles scalaires sont v la 

vitesse et φ l’angle de 

braquage. 

d 

dt x 0 = v cos θ 0 , 

⎛ 

d 

dt θ i = v d i 

d 

dt y 0 = v sin θ 0 , 

⎞ 

∏ 

cos(θ j−1 − θ j ) ⎠ sin(θ i−1 − θ i ) 

i−1 

⎝ 

j=1 

d 

dt θ 0 = v d 0 

tan φ = ω 

(i = 1, . . . , n), 

Sortie plate: P n ; preuve uniquement avec un dessin et les 

formules de Frénet.

La construction géométrique 

◮ Invariance par rapport au groupe SE(2). 

P n−1 = P n + d n 

dP n 

ds n 

◮ Sortie plate non unique: (ξ = x n , ζ = y n + d dt x n) est une 

autre sortie plate car x n = ξ et y n = ζ − d dt ξ. 

◮ La sortie plate (x n , y n ) formée par les coordonnées 

cartésiennes de P n est plus naturelle que (ξ, ζ). Elle 

repose sur une fonction de sortie h équivariante.

Le robot jongleur 2kπ: prototype de systèmes implicites et plats 

S 

S 

Dynamique du pendule ponctuel H 

isochrone de Huygens : 

mg 

equivalent 

to 

mg 

H 

m d 2 

dt 2 H = T ⃗ + m⃗g 

⃗T // HS ⃗ 

‖ HS‖ ⃗ = l 

◮ Le point de suspension S ∈ R 3 est le contrôle 

◮ Le centre d’oscillation H ∈ R 3 est la sortie plate: comme 

⃗T /m = d 2 

H − ⃗g et T ⃗ // −→ HS, S est solution du système 

dt 2 

algébrique suivant: 

−→ 

HS // d 2 

dt 2 H − ⃗g et ‖ ⃗ HS‖ 2 = l.

Gilet stabilisateur en plongée autonome (correction le 6 novembre) 

Exo: 

La dynamique verticale d’un plongeur équipé d’un gilet stabilisateur 

piloté par le débit de gaz u est 

m d 2 ( ( 

dt 2 h = m − ρ V 0 + 

N )) 

gRθ 

g − C d p 0 + ρh dt h, 

d 

dt N g = u 

où C ≥ 0 est le coefficient de frottement avec l’eau, R la constante 

des gaz parfaits et θ la température.

Gilet stabilisateur en plongée autonome (fin) 

1. Discuter ce modèle et expliquer l’origine des équations. 

Pourquoi est-il important d’avoir m > ρV 0 (ce que l’on supposera 

dans toute la suite) ? 

2. On suppose ici u = 0. Quels sont les points d’équilibre et étudier 

leur stabilité. 

3. Montrer qu’avec le bouclage u = (v − N g )/ɛ avec ɛ > 0 petit on 

se ramène à un second ordre non-linéaire avec comme 

commande v. Comment choisir ɛ en fonction des paramètres. 

4. Montrer que y = h est une sortie plate de ce système du second 

ordre avec comme control v. En déduire une commande en 

boucle ouverte [0, T ] ∋ t ↦→ v r (t) et une trajectoire de référence 

[0, T ] ∋ t ↦→ h r (t) qui assurent la transition entre les deux 

d’équilibres h = a > 0 et h = b > 0. Discuter en fonction de T la 

faisabilité de cette trajectoire de référence sachant que v doit 

rester positif. 

5. Donner le bouclage non-linéaire d’état qui met le système sous 

la forme d 2 

h = w où w est un nouveau contrôle. En déduire le 

dt 2 

bouclage de suivi de la trajectoire de référence (h r , v r ).

Distinguabilité et observabilité 

Le système est d dt 

x = f (x, u) avec comme mesure y = h(x). 

Définition (distinguabilité) 

Deux états initiaux x et ˜x sont dits indistinguables (notés xI˜x) si 

pour tout t ≥ 0, les sorties y(t) et ỹ(t) sont identiques pour 

toute entrée u(t) admissible. Ils sont dits distinguables sinon. 

L’indistinguabilité est une relation d’équivalence. Notons I(x) la 

classe d’équivalence de x. 

Définition (observabilité globale) 

Le système est dit observable en x si I(x) = {x} et il est 

observable si I(x) = {x} pour tout x. 

Ainsi le système est observable si pour tous les états initiaux x 

et ˜x, il existe une entrée admissible u qui distingue x et ˜x, c’est 

à dire telle que y(t) ≠ ỹ(t) pour au moins un temps t ≥ 0 

(injectivité).

Le système d dt x 1 = ux 2 , d dt x 2 = 0, y = x 1 est observable (pour 

u = 1 par exemple). Cependant l’entrée u = 0 ne distingue pas 

les points x et ˜x tels que x 1 = ˜x 1 et x 2 ≠ ˜x 2 . Plus généralement, 

il peut être nécessaire d’aller très loin dans le temps et dans 

l’espace d’état pour distinguer deux états initiaux, d’où 

Définition (observabilité locale en temps et en espace) 

L’état x est localement observable, si pour tout ε > 0 et pour 

tout voisinage U de x, il existe η > 0 plus petit que ε et un 

voisinage V de x contenu dans U, tel que pour tout ˜x ∈ V , il 

existe une entrée [0, η] ∋ t ↦→ u(t) qui distingue x et ˜x, i.e. telle 

que y(η) ≠ ỹ(η). Le système est localement observable s’il 

l’est pour tout x. 

Le système est localement observable si on peut 

instantanément distinguer chaque état de ses voisins en 

choisissant judicieusement l’entrée u.

Un test simple (dans un monde idéal) 

Les données sont t ↦→ (y(t), u(t)) et le modèle d dt 

x = f (x, u) 

avec y = h(x). L’inconnue est x. On suppose que tout est 

dérivable. Par dérivation successive de y on a pour ν entier 

⎧ 

h(x) ≡ h 0 (x) = y 

⎪⎨ 

(Σ ν ) 

⎪⎩ 

∂h 0 

∂x f (x, u) ≡ h 1(x, u) = d dt y 

∂h 1 

∂x f (x, u) + ∂h 1 

∂x ˙u ≡ h 2(x, u, ˙u) = d 2 

dt 2 y 

h ν (x, u, . . . , u (ν−1) ) = y (ν) = d ν 

dt ν y 

Si à partir d’un certain ν on peut résoudre le système (Σ ν ) en 

x, alors le système est observable et x s’exprime comme une 

fonction de y, u et un nombre fini de leurs dérivées. 

Difficile à utiliser en pratique car y est en général bruité. 

.

Exemple d’un réacteur exothermique 

d 

dt x 1 = D(x1 in − x 1) − k 0 exp(−E/RT )x 1 

d 

dt T = D(T in − T ) + α∆H exp(−E/RT )x 1 + u 

y(t) = T . 

On a facilement x 1 en fonction de (y, d dt 

y) et u : 

x 1 = 

d 

dt y − D(T in − y) − u 

α∆H exp(−E/Ry) 

Le système est donc observable. y et u sont reliés par une 

équation différentielle du second ordre en y et du premier ordre 

en u. On l’obtient en utilisant l’équation donnant d dt x 1 : 

d 

dt 

( d 

dt y − D(T ) 

in − y) − u 

α∆H exp(−E/Ry) 

= Dx in 

1 − (D + k 0 exp(−E/Ry)) 

d 

dt y − D(T in − y) − u 

α∆H exp(−E/Ry) . 

Il( 

s’agit d’une condition ) de compatibilité 

F y, d dt y, d 2 

y, u, d dt 2 dt u = 0 entre y et u à la base du diagnostic 

et de la détection de panne (relation non-linéaire entrée/sortie).

Systèmes linéaires à coefficients constants 

On part de d dt 

x = Ax + Bu, y = Cx avec u et y connus à 

chaque instant t et x inconnu.La méthode de base: on dérive la 

sortie pour faire apparaître x. On obtient une infinité 

d’équations pour x, 

y = Cx 

ẏ = CAx + CBu 

ÿ = CA 2 x + CABu + CB ˙u 

. 

y (ν) = CA ν x + CA ν−1 Bu + . . . + CBu (ν−1) . . . 

dont seules les n premières (0 ≤ ν ≤ n − 1) donnent a priori 

des informations sur x. Justification par le théorème de 

Cayley-Hamilton qui dit qu’une matrice est solution de son 

polynôme caractéristique: si P(s) = det(sI − A) alors P(A) ≡ 0 

et donc A n est une combinaison linéaire des (A ν ) 0≤ν≤n−1 .

Le système en x à résoudre 

Par Cayley-Hamilton, il suffit de regarder seulement les n − 1 

premières dérivées de y: 

y = Cx 

ẏ = CAx + CBu 

ÿ = CA 2 x + CABu + CB ˙u 

. 

y (n−1) = CA n−1 x + CA n−1 Bu + . . . + CBu (n−2) 

Ce système a au plus une solution en 

x, et seulement si, le rang de la matrice 

"colonne" pn × n (p = dim y) cicontre 

est égal à celui de ses colonnes 

(opérateur injectif), à savoir n. 

⎛ 

O = ⎜ 

⎝ 

⎞ 

C 

CA 

⎟ 

. ⎠ 

CA n−1

Kalman et Dualité 

Théorème (Critère de Kalman) 


x = Ax + Bu, 

⎛ ⎞ 

y = Cx (A: n × n; B: n × m; 

C 

C: p × n) est observable si, et 

CA 

O = ⎜ ⎟ 

seulement si, le rang de la matrice 

d’observabilité O est égal à 

CA n−1 

⎝ . ⎠ 

n = dim(x). 

Pour abréger, on dit souvent que la paire (A, C) est observable 

lorsque le rang de la matrice d’observabilité O est maximum. 

Dualité 


x = Ax + Bu, y = Cx est observable (resp. 

d 

commandable) si et seulement si 

dt x = AT x + C T u, y = B T x 

est commandable (resp. observable). 

(A T et B T sont les transposées de A et B).

Forme normale (canonique) observateur (cas "SISO") 

d 

x = Ax + Bu, y = Cx, (dim C = 1 × n) 

dt 

Changement de variables sur x et sur y (x ↦→ Mx et y ↦→ Ny 

avec M et N inversibles) mettant le système sous forme 

canonique observateur: il suffit de transposer les formules 

conduisant à la forme normale de Brunovsky. 

La forme canonique est donc (B est arbitraire ici): 

A = 

⎛ 

⎜ 

⎝ 

⎞ 

0 ... 0 a 0 

1 0 0 ... 

... 1 0 ... 

0 ... 1 a n−1 

C = ( 0 ... 0 1 ) 

⎛ 

⎟ 

⎠ , B = ⎝ 

⎞ 

b 0 

... ⎠ 

b n−1

Observateur asymptotique sur la forme canonique (mono-sortie) 

Avec 

⎛ 

⎞ 

0 ... 0 a 

⎛ ⎞ 

0 

L A = ⎜ 1 0 0 ... 

0 

⎟ 

⎝ ... 1 0 ... ⎠ , C = (0, . . . , 0, 1) et L = ⎜ ⎟ 

⎝ . ⎠ 

0 ... 1 a L n−1 n−1 

on a 

A − LC = 

⎛ 

⎜ 

⎝ 

dont le polynôme caractéristique est: 

⎞ 

0 ... 0 a 0 − L 0 

1 0 0 ... 

⎟ 

... 1 0 ... ⎠ 

0 ... 1 a n−1 − L n−1 

s n − (a n−1 − L n−1 )s n−1 − ... − (a 1 − L 1 )s − (a 0 − L 0 ) = 0 

On peut librement choisir les pôles de A − LC si (A, C) est 

observable (transposition de la stabilisation par feedback et 

placement de pôles)

Observateur asymptotique pour d dt 

x = Ax + Bu, y = Cx. 

Soit ˆx solution de: 

d ˆx = Aˆx + Bu(t) −L(Cˆx − y(t)) , ŷ = Cˆx 

dt } {{ } } {{ } 

prédiction correction 

Alors on voit que d dt 

(x − ˆx) = (A − LC)(x − ˆx). Avec (A, C) 

observable on peut imposer les valeurs propres de A − LC avec L. 

On les choisit stables. Alors ˆx est l’état d’un filtre stable des signaux 

y(t) et u(t) (passe bas) avec en plus lim t→+∞ (x(t) − ˆx(t)) = 0. On 

reconstitue asymptotiquement x via ˆx son estimée. 

Le filtre de Kalman est une autre façon de calculer L en fonction des 

bruits Gaussiens sur le modèle et sur la mesure: 

d 

x(t) = Ax(t) + Bu(t) + Dξ(t), y(t) = Cx(t) + ϱ(t) 

dt 

ξ(t) et ϱ(t) sont des bruits blancs gaussiens centrés 

E (ξ(t)) = 0, cov (ξ(t), ξ(τ)) = E(ξ(t)ξ T (τ)) = M ξ (t) δ(t − τ) 

E (ϱ(t)) = 0, cov (ϱ(t), ϱ(τ)) = E(ϱ(t)ϱ T (t)) = M ϱ (t) δ(t − τ) 

δ mesure de Dirac, M ξ , M ϱ matrices de covariance sym. déf. 

positives.

Observateur asymptotique pour d dt 

x = f (x, u), y = h(x). 

On cherche une estimation de ˆx solution de: 

d ˆx = f (ˆx, u(t)) −L(ˆx, y(t), u(t)) , ŷ = h(ˆx) 

dt } {{ } } {{ } 

prédiction correction 

avec un terme L(ˆx, y(t), u(t)) vérifiant 

◮ L(x, h(x), u(t)) ≡ 0 pour tout x et u: facile à satisfaire en 

général. 

◮ lim t↦→+∞ ˆx − x = 0: c’est la stabilité du filtre non-linéaire 

d’état ˆx; on ne dispose pas de méthode générale 

garantissant sa convergence. 

Le filtre de Kalman étendu est une méthode heuristique pour 

calculer les termes correctifs L. Elle est très utilisée par les 

ingénieurs. Elle nécessite des calculs assez lourds. Elle ne 

repose sur aucune preuve générale de convergence. En 

pratique, son bon fonctionnement repose sur un réglage adapté 

de ses paramètres et surtout sur le choix des bonnes variables 

pour écrire les équations du système. Ce choix dépend alors la 

nature des non-linéarités de f (x, u) et h(x).

Filtre de Kalman étendu pour les systèmes non-linéaires 

On part de 

d 

x = f (x, u), 

dt y = h(x) 

où t ↦→ y(t) et t ↦→ u(t) sont des signaux connus du temps. A chaque 

instant, on cherche une estimation de x(t), notée ˆx(t) connaissant le 

modèle ci-dessus et aussi les valeurs passées des signaux 

] − ∞, t] ∋ τ ↦→ (y(τ), u(τ)) (estimation causale et temps-réel). 

Le filtre de Kalman étendu d’état ˆx est donné par 

d 

dt ˆx = f (ˆx, u) − L · (h(ˆx) − y ) 

où la matrice de gain de correction L est le résultat de l’intégration 

numérique d’une équation différentielle matricielle: 

A = ∂ x f (ˆx, u) 

C = ∂ x h(ˆx) 

L = −PC T N 

d 

dt P = AP + PAT + M −1 − PC T NCP 

où les matrices symétriques positives M et N sont des paramètres de 

réglage.

Observateur asymptotique non linéaire pour un réacteur exothermique 

d 

dt x 1 = D(x1 in −x 1 )−k 0 e − E d 

RT x1 , 

dt T = D(T in −T )+k 1 e − E RT x1 +u, y = T . 

Il est alors naturel de prendre (linéarisation par injection de sortie) 

d 

dt ˆx 1 = D(x1 in −ˆx 1 )−k 0 e − E d 

RT ˆx 1 , 

dt ˆT = D(T in −ˆT )+k 1 e − E RT ˆx 1 +u+L T (T −ˆT ) 

où L T est un gain > 0. Voici un raisonnement heuristique 

garantissant la convergence en deux étapes: 

◮ comme k 0 e − E RT > 0 et D > 0, la dynamique ( sur ˆx 1 est) 

stable et 

ˆx 1 converge vers x 1 car d dt (ˆx 1 − x 1 ) = − D + k 0 e − E RT (ˆx 1 − x 1 ). 

◮ on peut donc remplacer ˆx 1 par x 1 dans l’équation donnant d dt ˆT et 

ainsi obtenir d dt (ˆT − T ) = −(D + L T )(ˆT − T ) qui montre la 

convergence exponentielle vers 0 de ˆT − T . 

Ce raisonnement heuristique peut être rendu parfaitement rigoureux 

mais au prix d’un obscurcissement quasi-total des arguments 

ci-dessus. Ces derniers utilisent la structure des non-linéarités du 

système pour se ramener à une forme triangulaire et au linéaire . . .

Stabilité et contraction 

On peut toujours écrire d dt ˆx = f (ˆx, u(t)) − L(ˆx, y(t), u(t)) sous 

la forme d dt ˆx = ˆf (ˆx, t) avec x est une solution particulière 

( d dt x = ˆf (x, t)). La convergence de l’observateur veut dire 

heuristiquement qu’il oublie sa condition initiale: ˆx converge 

vers x quand t tend vers +∞. Une condition suffisante de 

convergence souvent utile repose la notion de contraction. 

Supposons que la partie symétrique du jacobien 

⎛ ( ) ⎞ T 

S(ˆx, t) = 1 ⎝ ∂ˆf 

2 ∂ˆx + ∂ˆf 

⎠ 

∂ˆx 

soit négative. Alors d dt ‖x − ˆx‖2 ≤ 0 pour la norme euclidienne. 

Si pour tout ˆx et t, S(ˆx, t) ≤ −λI d avec λ > 0 constant alors 

d 

dt ‖x − ˆx‖2 ≤ −2λ‖x − ˆx‖ 2 et donc ˆx converge vers x 

exponentiellement ‖ˆx(t + τ) − x(t + τ))‖ ≤ ‖ˆx(t) − x(t)‖ e −λτ 

pour tout t et τ > 0.

Preuve de la contraction (cas euclidien) 

Montrons que si S(ˆx, t) = 1 2 

( 

∂ˆf 

∂ˆx + ( 

∂ˆf 

∂ˆx 

) ) T 

≤ 0, alors d dt ‖x − ˆx‖2 ≤ 0. 

Soient ¯t, ˆx(¯t), x(¯t) et le segment γ¯t(σ) = σx(¯t) + (1 − σ)ˆx(¯t) allant de 

ˆx(¯t) à x(¯t) pour σ ∈ [0, 1]. On note par γ t (σ) la solution de 

d 

dt ξ = ˆf (ξ, t) qui passe par γ¯t(σ) en t = ¯t. Pour t fixé, la longueur de la 

courbe γ t (σ) est donnée par L t = ∫ 1 

∥ ∂ 

∂σ γ t(σ) ∥ dσ. Un simple calcul 

donne 

∫ 

d 

1 

dt L t = 

0 

0 

〈 

〉 

∂ 2 

∂t∂σ γ ∂ 

t(σ) , 

∂σ γ t(σ) 

∥ ∂ 

∂σ γ t(σ) ∥ dσ ≤ 0 

car 

∂ 2 

∂t∂σ γ t(σ) = ∂ˆf 

∂ξ 

∂ 

∂σ γ t(σ). Comme ‖ˆx(t) − x(t)‖ ≤ L t et L t ≤ L¯t pour 

t > ¯t, on en déduit que ‖ˆx(t) − x(t)‖ ≤ ‖ˆx(¯t) − x(¯t)‖ pour tout t > ¯t. 

D’où d dt ‖x − ˆx‖2 ≤ 0 en t = ¯t avec ¯t arbitraire. 

Exo: Reprendre la preuve avec comme hypothèse S(ˆx, t) ≤ −λI d et 

comme conclusion d dt ‖x − ˆx‖2 ≤ −2λ‖x − ˆx‖ 2 .

Contraction dans le cas Riemannien 

Supposons que x (et ˆx) corresponds aux coordonnées locales 

sur une variété Riemannienne dont la métrique est donnée par 

la forme quadratique définie positive G(x). Alors l’observateur 

asymptotique d dt ˆx = ˆf (ˆx, t) est dit contractant pour cette 

métrique si et seulement si, 

⎛ ( ) ⎞ 

T 

∀t, ˆx, S(ˆx, t) = 1 ⎝G ∂ˆf 

2 ∂ˆx + ∂ˆf 

G + ∂G 

∂ˆx ∂ˆx ˆf ⎠ ≤ 0. 

Ainsi la distance riemannienne d G (ˆx, x) entre ˆx et x décroît au 

cours du temps. Si de plus S(ˆx, t) ≤ −λG(ˆx) avec λ > 0 

constant alors 

d G (ˆx(t + τ), x(t + τ)) ≤ d G (ˆx(t), x(t)) e −λτ 

pour t et τ > 0. 

Exo: Montrer ce résultat en reprenant la preuve du cas 

euclidien où G(x) ≡ I d .

Exemple d’observateur non linéaire asymptotique par contraction 

Soit le système mécanique 

d 

dt x 1 = x 2 , 

d 

dt x 2 = F(x 1 , x 2 , t), y = x 1 

avec ∂F 

∂x 2 

≤ 0. On considère l’observateur 

d 

dt ˆx 1 = ˆx 2 − L 1 (ˆx 1 − y(t)), 

d 

dt ˆx 2 = F(y(t), ˆx 2 ) − L 2 (ˆx 1 − y(t)) 

avec 

( 

L 1 , L 2 > 0 

) 

deux paramètres de réglage. Avec comme métrique 

1 0 

G = 1 on a 

0 

L 2 

( ) ( T ∂f 

G + G ∂f −2L1 

∂ˆx ∂ˆx = 0 

0 

) 

2 ∂F 

∂x 2 

L 2 

≤ 0 

Nous n’avons qu’une contraction au sens large. Si, en plus, 

∂F 

∂x 2 

≤ β < 0 uniformément pour tout x avec β > 0, on a alors une 

contraction stricte avec la convergence exponentielle de ˆx vers x.

Observateur/Contrôleur sur l’exemple du double pendule de la cité des 

sciences de Paris la Villette 

2 

Approximation des petits angles 

|θ 1 | ≪ 1 et |θ 2 | ≪ 1: 

1 

d 2 

dt 2 (D + lθ 1 + lθ 2 ) = gθ 2 

d 2 

dt 2 ( 

D + lθ1 + l 2 θ 2) 

= gθ1

On pose y 1 = D + lθ 1 , y 2 = D + lθ 1 + lθ 2 , Dans la bonne unité 

de temps pour avoir g/l = 1: 

ÿ 2 = y 2 − y 1 , 

ÿ 1 = 3y 1 − y 2 − 2D 

où D est le contrôle et la mesure est y 1 (angle du bas θ 1 ). 

Problème: maintenir les deux pendules en équilibre en ne 

mesurant que y 1 , l’état de dimension 4 , x étant 

(y 2 , v 2 = ẏ 2 , y 1 , v 1 = ẏ 1 ).

Le contrôleur 

On écrit tout en fonction de y 2 et D car y 1 = y 2 − ÿ 2 : 

Changement de variables: 

y (4) 

2 

= 4ÿ 2 − 2y 2 + 2D 

(y 2 , ẏ 2 , ÿ 2 , y (3) 

2 ) ↦→ x = [y 2, v 2 = ẏ 2 , y 1 = y 2 − ÿ 2 , v 1 = ẏ 2 − y (3) 

2 ]. 

Feedback stabilisant: 

4ÿ 2 − 2y 2 + 2D = s 1 y (3) 

2 

− s 2 ÿ 2 + s 3 ẏ 2 − s 4 y 2 

où, les pôles étant (p 1 , p 2 , p 3 , p 4 ) ∈ C à parties réelles 

négatives, 

s 1 = p 1 + p 2 + p 3 + p 4 , s 2 = ∑ 

p i p j 

s 3 = 

∑ 

1≤i

L’observateur 

Il s’agit d’estimer x = (y 2 , v 2 , y 1 , v 1 ) connaissant y 1 (t) et D(t). 

L’observateur asymptotique est 

d 

dt ŷ2 = ˆv 2 + k y2 (ŷ 1 − y 1 (t)) 

d 

dt ˆv 2 = ŷ 2 + k v2 (ŷ 1 − y 1 (t)) − y 1 (t) 

d 

dt ŷ1 = ˆv 1 + k y1 (ŷ 1 − y 1 (t)) 

d 

dt ˆv 1 = −ŷ 2 + k v1 (ŷ 1 − y 1 (t)) + 3y 1 (t) − 2D(t) 

où les gains k sont choisis pour que la dynamique de l’erreur 

ỹ 2 = ŷ 2 − y 2 , soit asymptotiquement stable 

d 

dt ỹ2 = ṽ 2 + k y2 ỹ 1 , 

d 

dt ỹ1 = ṽ 1 + k y1 ỹ 1 , 

d 

dt ṽ2 = ỹ 2 + k v2 ỹ 1 

d 

dt ṽ1 = −ỹ 2 + k v1 ỹ 1

Navigation inertielle dans un plan vertical (correction le 13 novembre) 

Exo: 

Un corps solide (un avion par exemple) se déplace dans un 

plan vertical. On dispose à bord de deux accéléromètres 

et d’un gyromètre. Ces trois capteurs fournissent avec une 

fréquence d’échantillonnage rapide (de l’ordre du kHz) les 

deux composantes a 1 (t) et a 2 (t) de ¨P − ⃗g dans le répère 

mobile (k) et la vitesse de rotation ω(t) de (k) par rapport 

au repère fixe (K ). On dispose aussi d’un GPS, qui fournit 

avec une fréquence d’échantillonnage bien plus lente (de 

l’ordre de quelques fractions de Hz) les coordonnées (X 1 , X 2 ) 

de P dans (K ). L’objectif est de faire la fusion des données 

issues de ces deux types de capteurs pour en déduire une 

estimation, à la fréquence rapide, de la position (X 1 , X 2 ) et 

de l’orientation θ. On souhaite aussi être robuste à des biais 

constants sur les accéléromètres et sur le gyromètre. 

Le modèle du système est alors simplement (g > 0 paramètre) 

⎧ 

⎪⎨ 

⎪⎩ 

d 2 

X 

dt 2 1 = a 1 (t) cos θ − a 2 (t) sin θ 

d 2 

X 

dt 2 2 = a 1 (t) sin θ + a 2 (t) cos θ − g 

(1) 

d 

dt θ = ω(t) 

où t ↦→ (a 1 (t), a 2 (t), ω(t)) sont des signaux connus du temps et la 

sortie y = (X 1 , X 2 ) correspond à la position de P.

Navigation inertielle dans un plan vertical (suite et fin) 

1. Montrer que (1) est observable avec comme données d’entrée 

t ↦→ (a 1 (t), a 2 (t), ω(t)) et comme mesure (sortie) y(t) = (X 1 , X 2 ). 

2. On suppose θ petit, |a 1 | ≪ g et |a 2 − g| ≪ g. Montrer que 

d 2 

d 2 

dt 2 X 1 = a 1 (t) − gθ, 

dt 2 X 2 = a 2 (t) − g, 

est alors une bonne approximation de (1). 

d 

θ = ω(t) (2) 

dt 

3. Vérifier que (2) reste bien observable (au sens de la question 1) 

et construire un observateur asymptotique qui reconstruit l’état 

(X 1 , Ẋ1 = V 1 , X 2 , Ẋ2 = V 2 , θ). 

4. On suppose que les mesures en temps quasi-continu a 1 , a 2 et ω 

ont des biais constants mais inconnus. Ainsi (2) devient: 

d 2 

dt 2 X 1 = a 1 (t) + p 1 − gθ, d 2 

dt 2 X d 

2 = a 2 (t) + p 2 − g, 

dt θ = ω(t) + p 

où (p 1 , p 2 , p) sont trois paramètres constants inconnus. Ce 

système avec biais est-il observable avec y = (X 1 , X 2 ) comme 

sortie ? Quel nombre de biais peut-on espérer estimer à partir 

de y ?

Observateur invariant: exemple de la voiture 

d 

dt x 1 = u cos θ 

d 

dt x 2 = u sin θ 

d 

dt θ = uv 

y = (y 1 , y 2 ) = (x 1 , x 2 ) 

2 

u et v = tan ϕ 

l 

connus 

Un observateur "géométrique": 

⎛ 

⎝ 

d 

dt ˆx 1 

d 

dt ˆx 2 

d 

dt ˆθ 

⎞ ⎛ ⎞ ⎛ 

u cos ˆθ 

⎠ = ⎝ u sin ˆθ ⎠ + ⎝ R −ˆθ 

uv 

0 

0 0 1 

1 

⎞ 

0 

) (ˆx1 

⎠ 

− y 

· L · Rˆθ · 1 

ˆx 2 − y 2 

( cos 

où L est une matrice 3 × 2 de gains Rˆθ := ˆθ 

− sin ˆθ 

) 

sin ˆθ 

cos ˆθ

Analyse de la convergence dans les bonnes variables 

La bonne erreur (η 1 , η 2 , η θ ) entre l’état et son estimée: 

( 

η1 

η 2 

) 

) (ˆx1 − x 

= Rˆθ · 

1 

, η 

ˆx 2 − x θ = ˆθ − θ, Rˆθ 

:= 

2 

( cos ˆθ 

) 

sin ˆθ 

− sin ˆθ cos ˆθ 

La dynamique de l’erreur ne dépend que de u, v: 

⎛ 

d 

dt η ⎞ ⎛ 

⎞ 

1 u(1 − cos η θ ) + (uv + L 31 η 1 + L 32 η 2 )η 2 

( ) 

⎝ d 

dt η ⎠ 

1 = ⎝ u sin η θ − (uv + L 31 η 1 + L 32 η 2 )η 1 

⎠ η1 

+ L · 

d 

dt η η 

θ 

0 

2 

Choix des gains L sur l’approximation au premier ordre: 

⎛ ⎞ ⎛ 

⎞ ⎛ 

⎞ 

d 

dt 

δη 1 uvδη 2 −|u|a −uv ( ) 

⎝ d 

dt 

δη 2 

⎠ = ⎝uδη θ − uvδη 1 

⎠ + ⎝ uv −|u|c⎠ δη1 

d 

δη 

dt 

δη θ 0 

0 −ub 2 

avec les paramètres a, b, c > 0 directement liés aux constantes de 

temps de convergence locale.

Groupe de transformations et invariance 

Soit G un groupe de Lie avec comme élément neutre e et Σ un 

ouvert dans R ν . Un groupe de transformations (locales) 

(φ g ) g∈G sur Σ est une application régulière 

telle que : 

◮ φ e (ξ) = ξ pour tout ξ 

(g, ξ) ∈ G × Σ ↦→ φ g (ξ) ∈ Σ 

◮ φ g2 ◦ φ g1 (ξ) = φ g2 g 1 

(ξ) pour tout g 1 , g 2 , ξ 

Une application Σ ∋ ξ ↦→ J(ξ) ∈ R est invariante ssi 

J(φ g (ξ)) = J(ξ) 

pour tout g, ξ 

Un champs de vecteurs sur Σ 2 ξ ↦→ w(ξ) est invariant ssi 

w(φ g (ξ)) = Dφ g (ξ) · w(ξ) 

pour tout g, ξ 

2 On peut voir un champ de vecteurs comme une équation différentielle 

d 

dt ξ = w(ξ).

Calcul d’invariants par la méthode du repère mobile de Darboux/Cartan 

On suppose dim g ≤ dim ξ. On pose φ g = (φ a g, φ b g), ξ = (ξ a , ξ b ) avec, 

pour chaque ξ ∈ Σ, g ↦→ φ a g(ξ) inversible par rapport à g: 3 

◮ On normalise i.e. on résout φ a g(ξ) = ¯ξ a pour g, soit g = γ(ξ) (i.e. 

φ a γ(ξ) (ξ) = ¯ξ a où la normalisation ¯ξ a est fixée une fois pour toute). 

Alors l’application ξ ↦→ I(ξ) := φ b γ(ξ) 

(ξ) est invariante. On a 

même plus: toute autre fonction invariante K (ξ), il existe une 

fonction Φ telle que K (ξ) = Φ(I(ξ)); On dit que les composantes 

de I forment un ensemble complet d’invariants scalaires. 

◮ Le champ de vecteurs ξ ↦→ w(ξ) := ( Dφ γ(ξ) (ξ) ) −1 

· e, où e est 

un vecteur constant, est invariant. 

◮ En particulier la collection des dim ξ champs de vecteurs 

invariants, w i (ξ) := [ Dφ γ(ξ) (ξ) ] −1 

· ei , i = 1, . . . , dim ξ forme un 

répère (mobile) invariant dès que les vecteurs e i forment une 

base de R dim ξ . 

◮ Tout champ de vecteurs invariant w(ξ) est une combinaison 

linéaire des w i , w(ξ) = ∑ i K i(ξ)w i (ξ) les fonctions K i (ξ) étant 

des invariants scalaires. 

3 On a dim φ a g = dim g = dim ξ a et dim φ b g = dim φ g − dim g = dim ξ b .

Systèmes et observateurs invariants 

Les données sont un système d’entrée u, d’état x, de sortie y 

d 

x = f (x, u), 

dt x y = h(x, u), 

∈ X ⊂ Rn , u ∈ U ⊂ R m 

y ∈ Y ⊂ R p 

et un groupe de transformations associé au groupe de Lie G de 

dimension r: (X, U, Y ) = ( ϕ g (x), ψ g (u), ϱ g (y) ) 


x = f (x, u) est invariant ssi 

f ( ϕ g (x), ψ g (u) ) = Dϕ g (x) · f (x, u) 

pour tout g, x, u 

La sortie y = h(x, u) est équivariante ssi 

h ( ϕ g (x), ψ g (u) ) = ϱ g 

( 

h(x, u) 

) 

pour tout g, x, u 

Le système d dt ˆx = F(ˆx, u, y) est un pré-observateur ssi 

F ( x, u, h(x, u) ) = f (x, u) pour tout x, u 

Le pré-observateur d dt ˆx = F(ˆx, u, y) est invariant ssi 

F ( ϕ g (ˆx), ψ g (u), ϱ g (y) ) = Dϕ g (ˆx) · F(ˆx, u, y) pour tout g, ˆx, u, y

Forme générale des pré-observateurs invariants 

Chaque pré-observateur invariant s’écrit 

d 

( 

) 

ˆx = f (ˆx, u) + W (ˆx) · L I(ˆx, u), E(ˆx, u, y) 

dt 

} {{ } 

n×1 

} {{ } 

n×n 

} {{ } 

n×p 

avec dim x = n, dim u = m, dim y = p et où 

· E(ˆx, u, y) 

} {{ } 

p×1 

◮ E(ˆx, u, y) est une erreur de sortie invariante (voir ci-dessous la 

définition) 

◮ W (ˆx) = ( w 1 (ˆx), .., w n (ˆx) ) est un repère mobile invariant et 

I(ˆx, u) est invariant 

◮ L(I, E) est une matrices n × p de gains dont les éléments 

dépendent de I et E. Il faut les choisir astucieusement de façon 

à assurer la convergence de ˆx vers x. 

(ˆx, u, y) ↦→ E(ˆx, u, y) ∈ Y est une erreur de sortie invariante ssi 

◮ y ↦→ E(ˆx, u, y) est inversible pour tout ˆx, u 

◮ E (ˆx, u, h(ˆx, u) ) = 0 pour tout ˆx, u 

◮ E ( ϕ g (ˆx), ψ g (u), ϱ g (y) ) = E(ˆx, u, y) pour tout ˆx, u, y

Construction de pré-observateurs invariants 

d 

( 

) 

dt ˆx = f (ˆx, u) + W (ˆx) · L I(ˆx, u), E(ˆx, u, y) · E(ˆx, u, y) 

Lorsque l’action de G sur X est de rang r = dim G (implique 

r ≤ dim X ) alors on sait construire (méthode du repère mobile) 

◮ une normalisation g = γ(x) via l’action de G sur X : 

ϕ g = (ϕ a g, ϕ b g) avec g ↦→ ϕ a g(x) inversible par rapport à g et γ(x) 

défini par ϕ a γ(x) (x) = ¯x a où ¯x a est une normalisation portant sur r 

composantes de x = (x a , x b ). 

◮ un repère invariant comme par exemple 

W (ˆx) = (w 1 (ˆx), . . . , w n (ˆx)) = ( Dφ γ(ˆx) (ˆx) ) −1 

. 

◮ un ensemble complet d’invariants ( I(ˆx, u) liés) 

à l’action de G sur 

(ˆx, u) ∈ X × U: I(ˆx, u) = ϕ b γ(ˆx) (ˆx), ψ γ(ˆx)(u) . 

◮ Une erreur de sortie invariante E(ˆx, u, y) en considérant l’action 

de G sur (ˆx, y) ∈ X × Y: 

E(ˆx, u, y) = ϱ γ(ˆx) (h(ˆx, u)) − ϱ γ(ˆx) (y).

Dynamique de l’erreur invariante sur l’état 

(ˆx, x) ↦→ η(ˆx, x) ∈ X est une erreur d’état invariante ssi 

◮ pour tout ˆx, x ↦→ η(ˆx, x) est inversible (ou pour tout x, 

ˆx ↦→ η(ˆx, x) inversible ) et η(x, x) = 0 pour tout x. 

◮ η ( ϕ g (ˆx), ϕ g (x) ) = η(ˆx, x) pour tout ˆx, x. 

Lorsque l’action de G sur X est de rang r = dim G 

◮ On considère l’action de G sur (x, ˆx) ∈ X × X , on utilise la 

normalisation γ(x) et alors η(ˆx, x) = ϕ γ(x) (ˆx) − ϕ γ(x) (x) (ou 

η(ˆx, x) = ϕ γ(ˆx) (ˆx) − ϕ γ(ˆx) (x)) est une erreur invariante sur l’état. 

◮ la dynamique de l’erreur η est de la forme d dt η = Q( η, I(ˆx, u) ) où 

I(ˆx, u) est un ensemble complet d’invariants I(ˆx, u) liés à l’action 

de G sur (ˆx, u) ∈ X × U. 

Lorsque dim G = dim X alors on peut considérer que G ≡ X , que 

l’action de G sur X correspond à ϕ g (x) = g · x (translations à 

gauche). Alors I = I(u) et la dynamique de l’erreur est alors 

d 

autonome: 

dt 

η = Q(η, I(u)).4 

4 Les gains L de l’observateur sont alors ajustés pour garantir la 

convergence locale autour des points d’équilibres de d η = Q(η, I(u)) 

dt 

(trajectoires permanentes associées à u constant).

Retour à l’exemple de la voiture 

L’invariance par rotations/translations (G = SE(2), groupe de Lie à 

r = 3 paramètres g ≡ (g 1 , g 2 , g 3 )) vient de 

⎛ 

ϕ (g1 ,g 2 ,g 3 )(x 1 , x 2 , θ) ≡ ⎝ g ⎞ ⎛ 

1 

g 2 

⎠ · ⎝ x ⎞ ⎛ 

1 

x 2 

⎠ = ⎝ x ⎞ 

1 cos g 3 − x 2 sin g 3 + g 1 

x 1 sin g 3 + x 2 cos g 3 + g 2 

⎠ 

g 3 θ 

θ + g 3 

ψ (g1 ,g 2 ,g 3 )(u, v) = 

( ( ) 

u y1 cos g 

, ϱ 

v) 

(g1 ,g 2 ,g 3 )(y 1 , y 2 ) = 

3 − y 2 sin g 3 + g 1 

. 

y 1 sin g 3 + y 2 cos g 3 + g 2 

L’observateur géométrique est en fait un observateur invariant: 

⎛ 

⎝ 

d ˆx dt 1 

d 

dt ˆx 2 

d 

dt ˆθ 

⎞ ⎛ ⎞ ⎛ ⎞ 

u cos ˆθ 

⎠ = ⎝ u sin ˆθ ⎠ + ⎝ R 0 

−ˆθ 0⎠ 

uv 0 

} 

0 

{{ 

1 

} 

W (ˆx) 

) (ˆx1 

·L · Rˆθ · − y 1 

ˆx 2 − y 2 

} {{ } 

E(ˆx,y,u) 

( cos 

où L est une matrice de gains 3 × 2 et Rˆθ := ˆθ 

− sin ˆθ 

) 

sin ˆθ 

cos ˆθ

Navigation inertielle et invariance (correction le 20 novembre) 

Exo: On reprend ici l’exercice précédent sur la navigation inertielle 

en notant (u 1 , u 2 ) = (a 1 , a 2 ), (u 3 , u 4 ) = (0, −g grav ) et u 5 = ω. Avec la 

sortie y = (X 1 , X 2 ) le système s’écrit d 2 

dt 2 X 1 = u 1 cos θ − u 2 sin θ + u 3 , 

d 2 

dt 2 X 2 = u 1 sin θ + u 2 cos θ + u 4 , d dt θ = u 5. 

1. Montrer que ce système est invariant par rapport à l’action du 

groupe G = SE(2) des translations/rotations du plan. Donner 

les formules pour les transformations ϕ g , ψ g et ρ g sur l’espace 

d’état X , l’espace des entrées U et l’espace de sortie Y. On 

notera x = (X 1 , X 2 , Ẋ1 = V 1 , Ẋ2 = V 2 , θ) l’état du système et 

g = (g 1 , g 2 , g 3 ) les trois paramètres de G (translation (g 1 , g 2 ) et 

rotation g 3 ). 

2. Reprendre l’observateur asymptotique sur le système linéarisé 

d 2 

X 

dt 2 1 = u 1 + g grav θ, d 2 

X 

dt 2 2 = u 2 − g grav , d dt θ = u 5 et y = (X 1 , X 2 ) 

liés aux hypothèses θ petit, (u 1 − u 3 ) 2 + (u 2 − u 4 ) 2 ≪ g 2 grav 

(u 3 = 0, u 4 = −g grav ). 

3. Construire un observateur invariant d’état ayant le même linéaire 

tangent que l’observateur linéaire de la question précédente.

Correction de l’exercice 

Question 1: Il suffit de remarquer que y = (X 1 , X 2 ) sont les coordonnées 

d’un point dans le repère fixe, que (u 1 , u 2 ) celles d’un vecteur dans le repère 

engin et (u 3 , u 4 ) celles d’un vecteur dans le repère fixe. On a alors 

⎛ ( ) ( ) ⎞ 

⎛ ( ) ⎞ 

X1 g1 

u1 

R −g3 + 

X 2 g 2 ( ) 

ϕ g(x) = 

⎜ V1 

⎝ R −g3 

⎟ 

V 2 

⎠ , ψg(u) = u 2 ( ) 

⎜ u3 

⎝R −g3 

⎟ 

u 4 

⎠ 

ϱ g(y) = 

θ + g 3 

( ( ) 

y1 

R −g3 + 

y 2 

( 

g1 

g 2 

)) 

, R g3 = 

u 5 

( ) 

cos g3 sin g 3 

− sin g 3 cos g 3 

où R g3 est associée à une rotation d’angle g 3 partant du repère fixe. 

Question 2: On a affaire à deux sous-systèmes indépendants: avec 

L X2 , L V2 > 0, les estimées ˆX 2 et ˆV 2 vérifiant 

d 

dt ˆX 2 = ˆV 2 − L X2 ( ˆX d 

2 − y 2 ), 

dt ˆV 2 = u 2 − g grav − L V2 ( ˆX 2 − y 2 ), 

convergent vers y 2 = X 2 et V 2 . Avec L X1 , L V1 , L θ calculés en fonction de trois 

valeurs propres stables (placement de pôles) les estimées ˆX 2 , ˆV 2 et ˆθ 

d 

dt ˆX 1 = ˆV 1 −L X1 ( ˆX d 

1 −y 1 ), 

dt ˆV 1 = u 1 +g grav ˆθ−L V1 ( ˆX 1 −y 1 ), 

convergent vers y 1 = X 1 , V 1 et θ. 

d 

dt ˆθ = u 5−L θ ( ˆX 1 −y 1 )

Correction de l’exercice (suite) 

Question 3 Tout repose sur la construction du repère et des erreurs de 

sorties invariantes. On utilise la méthode du repère mobile avec la 

normalisation γ(x) où ϕ a g(x) est formé par les trois composantes associées à 

X 1 , X 2 et θ: ϕ a g(x) = (0, 0, 0) donne alors 

g 1 = −X 1 cos θ − X 2 sin θ, g 2 = X 1 sin θ − X 2 cos θ, g 3 = −θ. 

L’erreur de sortie invariante ϱ γ(ˆx) (ŷ) − ϱ γ(ˆx) (y) donne R ˆθ 

(ŷ − y) soit les deux 

composantes suivantes 

E 1 = (ŷ 1 − y 1 ) cos ˆθ + (ŷ 2 − y 2 ) sin ˆθ, 

E 2 = −(ŷ 1 − y 1 ) sin ˆθ + (ŷ 2 − y 2 ) cos ˆθ. 

Le repère invariant donne 5 champs de vecteurs invariants dont les 

composantes sont les colonnes de l’inverse de la matrice jacobienne 

( 

Dϕγ(x) (x)) ) −1 formée par les dérivées partielles des composantes de ϕ g(x) 

par rapport aux composantes de x: 

⎛ 

cos ˆθ sin ˆθ ⎞ 

0 0 0 

−sin ˆθ cos ˆθ 0 0 0 

⎜ 0 0 cos ˆθ sin ˆθ 0 

⎝ 

0 0 −sin ˆθ cos ˆθ 

⎟ 

0 

⎠ 

0 0 0 0 1 

−1 

⎛ 

cos ˆθ −sin ˆθ ⎞ 

0 0 0 

sin ˆθ cos ˆθ 0 0 0 

= 

⎜ 0 0 cos ˆθ −sin ˆθ 0 

⎝ 

0 0 sin ˆθ cos ˆθ 

⎟ 

0 

⎠ 

0 0 0 0 1

Correction de l’exercice (suite et fin) 

Pour |θ| petit, E 1 ≈ ( ˆX 1 − y 1 ) et E 2 ≈ ( ˆX 2 − y 2 ). Ainsi un prolongement 

invariant de l’observateur linéaire 

d 

dt ˆX 2 = ˆV 2 − L X2 ( ˆX 2 − y 2 ), 

d 

dt ˆX 1 = ˆV 1 −L X1 ( ˆX 1 −y 1 ), 

est alors 

d 

dt ˆV 2 = a 2 − g grav − L V2 ( ˆX 2 − y 2 ), 

d 

dt ˆV 1 = a 1 +g grav ˆθ−LV1 ( ˆX 1 −y 1 ), 

d 

dt ˆX 1 = ˆV 1 − L X1 E 1 cos ˆθ + L X2 E 2 sin ˆθ 

d 

dt ˆX 2 = ˆV 2 − L X1 E 1 sin ˆθ − L X2 E 2 cos ˆθ 

d 

dt ˆV 1 = a 1 cos ˆθ − a 2 sin ˆθ − L V1 E 1 cos ˆθ + L V2 E 2 sin ˆθ 

d 

dt ˆV 2 = a 1 sin ˆθ + a 2 cos ˆθ − g grav − L V1 E 1 sin ˆθ − L V2 E 2 cos ˆθ 

d 

dt ˆθ = ω − L θ E 1 . 

On rappelle que u 1 = a 1 , u 2 = a 2 , u 3 = 0, u 4 = −g grav, u 5 = ω et 

d 

dt ˆθ = ω−L θ ( ˆX 1 −y 1 ) 

E 1 = ( ˆX 1 − y 1 ) cos ˆθ + ( ˆX 2 − y 2 ) sin ˆθ, 

E 2 = −( ˆX 1 − y 1 ) sin ˆθ + ( ˆX 2 − y 2 ) cos ˆθ.

Les principales hypothèses 

M s 

Engin: position C(t) ∈ R 3 et orientation 

q(t) ∈ H (définie par un quaternion unitaire 

(voir plus loin)). 

q t 

C t 

y t 

2 

Image: dans le repère engin S 2 ∋ η ↦→ 

y(t, η) ∈ [0, 1]: y(t, η) corresponds au flux 

de photons reçu de la direction η et émis 

par M(s) ∈ S. La scène est modélisée 

par une surface S ⊂ R 3 entourant l’engin 

et difféomorphe à la sphère unité S 2 ∋ s 

(t, η, s) sont reliés par qηq ∗ −−−−−→ 

C(t)M(s) 

= 

‖ −−−−−→ . Pour chaque t, on suppose 

C(t)M(s)‖ 

que cette relation définit un difféomorphisme 

S 2 ∋ η ↦→ s = ϕ(t, η) ∈ S 2 (les hypothèses du théorème des fonctions 

implicites sont supposées être remplies).

Quaternions et matrices de rotations 

On part des trois matrices de Pauli (ı = √ −1) 

( ) ( ) 

1 0 

0 1 

I d = , σ 

0 1 1 = , σ 

1 0 2 = 

( 0 −ı 

ı 0 

) 

, σ 3 = 

( ) 1 0 

0 −1 

Elles vérifient σ 2 k = I d , σ k σ j = −σ j σ k pour k ≠ j, et σ 1 σ 2 = ıσ 3 , σ 2 σ 3 = ıσ 1 , 

σ 3 σ 1 = ıσ 2 . Toute matrice unitaire complexe U ∈ SU(2) (UU † = I d , 

det U = 1) s’écrit U = q 0 I d − q 1 ıσ 1 − q 2 ıσ 2 − q 3 ıσ 3 avec (q 0 , q 1 , q 2 , q 3 ) ∈ R 4 

tels que q 2 0 + q 2 1 + q 2 2 + q 2 3 = 1. On pose 

1 = I d , e 1 = −ıσ 1 , e 2 = −ıσ 2 , e 3 = −ıσ 3 

et on identifie le groupe SU(2) avec celui des quaternions unitaires q ∈ H 1 , 

q = q 0 + q 1 e 1 + q 2 e 2 + q 3 e 3 . Il s’agit des q ∈ H tels que qq ∗ = 1 où 

q ∗ = q 0 − q 1 e 1 − q 2 e 2 − q 3 e 3 est le conjugué de q. On a, pour k = 1, 2, 3, 

j ≠ k et φ ∈ R: e 2 k = −1, e k e j = −e j e k , e φe k 

= cos φ + e k sin φ, e 1 e 2 = e 3 , 

e 2 e 3 = e 1 et e 3 e 1 = e 2 . 

Tout vecteur p ∈ R 3 est identifié à p = p 1 e 1 + p 2 e 2 + p 3 e 3 ∈ H. A tout q ∈ H 1 , 

on associe une matrice de rotation R ∈ SO(3) via: Rp = q ∗ pq, pour tout 

p ∈ R 3 . Réciproquement, à toute rotation R ∈ SO(3) sont associés deux 

quaternions q et −q de longueur 1. On identifie, au signe près (spin), H 1 et 

SO(3). Le produit vectoriel de deux vecteurs ω, v ∈ R 3 correspond au 

commutateur ω ∧ v = (ωv − vω)/2 à un facteur 1/2 près.

Equations différentielles ordinaires de l’engin 

Avec 

◮ q(t) ∈ H 1 , l’orientation de l’engin est représentée par le 

quaternion unitaire q dépendant du temps t. 

◮ R 3 ∋ v = q ∗ dC 

dt 

q, le vecteur vitesse dans le repère engin 

(multiplication au sens des quaternions); 

◮ ω ∈ R 3 , le vecteur vitesse instantanée de rotation dans le repère 

engin donnée par les gyroscopes. 

◮ a(t) ∈ R 3 , le vecteur accélération spécifique dans le repère 

engin donnée par les accéléromètres; 

◮ A grav ∈ R 3 , le vecteur gravité dans le repère fixe; 

on a (4+3 équations différentielles scalaires): 

d 

dt q = 1 2 qω, 

d 

dt v = v ∧ ω + q∗ A grav q + a 

où les signaux d’entrées sont les vecteurs a et ω issus des capteurs 

inertiels embarqués sur l’engin (ici A grav est un vecteur fixe).

Fusion avec pré-traitement d’image 

On suppose qu’un traitement approprié d’image permet de suivre la 

position y k (t) ∈ S 2 d’un point M k qui est fixe dans l’environnement: 

−−−−→ C(t)M k 

‖ −−−−→ 

y k = q ∗ q. Avec Γ 1 

k = 

C(t)M k ‖ ‖ −−−−→ on a d C(t)M k ‖ dt y k = y k ∧ (ω + Γ k y k ∧ v) 

et d dt Γ k = Γ 2 k y k · v. 

On suppose que l’on suit m points M 1 , . . . , M m via un traitement 

approprié d’image. On est face à l’estimation de la vitesse v et 

l’orientation q ∈ H 1 à partir des mesures y 1 , . . . , y m dans S 2 : 

d 

dt v = v ∧ ω + q∗ A grav q + a 

d 

dt q = 1 2 qω, 

d 

dt y k = y k ∧ (ω + Γ k y k ∧ v) , 

d 

dt Γ k = Γ 2 k y k · v, 

k = 1, . . . , m 

L’état est x = (q, v, y 1 , Γ 1 , . . . , y m , Γ m ), la sortie y = (y 1 , . . . , y m ) et 

l’entrée u = (ω, a). Ce système est invariant par rapport à G = H 1 où, 

pour g ∈ H 1 , on pose: 

⎛ ⎞ ⎛ ⎞ 

q qg ( ) ( ) 

ϕ g 

⎜ v 

⎟ 

⎝y k 

⎠ = ⎜ g ∗ vg 

⎟ ω g 

⎝g ∗ y k g⎠ , ψ g = 

∗ ωg ( ) ( 

a g ∗ , ϱ 

ag g yk = g ∗ y k g ) 

Γ k Γ k

Un peu de géométrie projective avec le point à l’infini 

Soient quatre points distinctes M i , M j , M k et 

M l tels que M −−→ 

i M j et −−−→ M k M l sont colinéaires et 

définissent un vecteur connu et constant W 

dans le repère fixe. Comme q ∗ Wq est orthogonal 

à la fois à y i ∧y j et à y k ∧y l , q ∗ Wq est nécessairement 

co-linéaire à w = (y i ∧ y j ) ∧ (y k ∧ y l ) 

soit q ∗ Wq ∧ w = 0. 

Supposons que l’on ait r quadruples (M i , M j , M k , M l ) avec M −−→ 

i M j ‖ −−−→ M k M l . 

Alors on dispose de r vecteurs unitaires W ν dans le repère fixe tels que 

q ∗ W νq ∧ w ν = 0 où les w ν sont des produits vectoriels de certains y k . Se 

repose alors l’estimation de la vitesse v et de l’orientation q ∈ H 1 à partir des 

mesures y 1 , . . . , y m complétées par q ∗ W νq ∧ w ν = 0 pour ν = 1, . . . , r: 

d 

dt v = v ∧ ω + q∗ A gravq + a 

d 

dt q = 1 2 qω, 

d 

dt y k = y k ∧ (ω + Γ k y k ∧ v) , 

d 

dt Γ k = Γ 2 k y k · v, 

k = 1, . . . , n 

A la place de q ∗ W νq ∧ w ν = 0, on peut aussi prendre, si on connaît les 

vecteurs fixes M −−→ 

i M j les m(m − 1) relations scalaires: q ∗ M −−→ 

i M j q · (y i ∧ y j ) = 0, 

i, j ∈ {1, . . . , m}, i ≠ j (équation implicite de sortie).

Hypothèses photométriques sur la formation de l’image 5 

Un modèle physique multi-spectrale (modèle de Kubelka-Munk de 

surface mate et lambertienne) 

où 

f (λ, s) = i(s)R ∞ (λ, s), λ ∈ [λ min , λ max ], M(s) ∈ S 

◮ f (λ, s): flux de photons de longueur d’onde λ émis par M(s) 

dans une direction quelconque (isotropie à l’émission). 

◮ i(s): flux de photons de longueur d’onde λ reçus par M(s) 

(spectre d’illumination blanc). 

◮ R ∞ (λ, s): réflectivité de la surface S autour de M(s). 

Le flux de photons reçus en C, de longueur d’onde λ et émis par M(s) 

est alors proportionnel à f (λ, s). Pour une image avec niveau de gris: 

y(t, η) = I(s) avec s = ϕ(t, η), I(s) ∝ 

∫ λmax 

λ min 

f (λ, s) dλ. 

5 J.M. Geusebroek, R. van den Boomgaard, A.W.M. Smeulders, H. Geerts: 

Color Invariance. IEEE Transactions on Pattern Analysis and Machine 

Intelligence, vol. 23, no. 12, december 2001

Modèle géométrique de l’image 

On suppose que la caméra embarquée sur l’engin donne accès à une image 

sphérique sur un angle solide de 4π. Ainsi, les pixels sont repérés par un 

vecteur unitaire η dans le repère engin et la valeur du pixel η à l’instant t est 

donnée par y(t, η) = I(s) où s est défini par qηq ∗ = 

−−−−−→ C(t)M(s) 

‖ −−−−−→ , q étant le 

C(t)M(s)‖ 

quaternion donnant l’orientation de l’engin. 

On suppose que tout est régulier. On élimine les fonctions inconnues M(s) et 

−−−−−→ C(t)M(s) 

‖ −−−−−→ C(t)M(s)‖ 

I(s) des équations qηq ∗ = et y(t, η) = I(s) en dérivant par rapport 

à t à s bloqué. On commence par ∂y 

∂t 

∣ = 0. Comme ∂ ∣ 

∂t 

s s 

= ∂ ∣ 

∂t η 

+ ∂ 

∣ 

∂η 

∂η 

∣ 

∂t 

t 

il nous faut calculer ∂η ∣ 

∂t s 

en dérivant par rapport à s l’équation 

qηq ∗ ∂η 

= . On trouve ∣ 

∂t s 

= η ∧ (ω + Γη ∧ v) où Γ = 

−−−−−→ C(t)M(s) 

‖ −−−−−→ C(t)M(s)‖ 

Comme, pour tout vecteur tangent ξ à la sphère en η, ∂y 

∂η 

1 

‖ −−−−−→ . 

C(t)M(s)‖ 

ξ = ∇y · ξ où ∇y 

est le gradient de S 2 ∋ η ↦→ y(t, η), défini comme un vecteur tangent à la 

sphère en η, on a 

∂y 

On dérive Γ = 

quelques calculs: 

1 

‖ −−−−−→ C(t)M(s)‖ 

∂Γ 

∂t 

= −∇y · (η ∧ (ω + Γη ∧ v)) 

∂t 

par rapport à t à s bloqué et on obtient après 

= −∇Γ · (η ∧ (ω + Γη ∧ v)) + Γ 2 v.η 

∣ 

s

Le modèle mixte ODE/PDE 

Avec les équations différentielles de l’engin et les équations aux dérivées 

partielles de l’image on a le modèle suivant: 

d 

dt q = 1 2 qω, d 


∂Γ 

= −∇Γ · (η ∧ (ω + Γη ∧ v)) + Γ 2 v.η 

∂t 

∂y 

= −∇y · (η ∧ (ω + Γη ∧ v)) 

∂t 

où les entrées sont ω, a ∈ R 3 , les états sont (q, v, Γ η, y η) (dimension infinie) 

et les sorties sont les y η, η ∈ S 2 (Γ η(t) = Γ(t, η) et y η(t) = y(t, η)). 6 

L’invariance par rapport à G = H 1 est associée à un changement sur l’origine 

des angles dans le repère engin: 

⎛ ⎞ ⎛ ⎞ 

q qg 

ϕ g 

⎜ v 

⎟ 

⎝Γ η 

⎠ = ⎜g ∗ vg 

⎟ 

⎝Γ g ∗ ηg⎠ , 

y η y g ∗ ηg 

( ) ω ψg = 

a 

( ) g ∗ ωg ( ) ( ) 

g ∗ , ϱ 

ag g yη = yg ∗ ηg 

6 On aurait aussi pu obtenir directement ce modèle "Eulerien" à partir du 

modèle "Lagrangien" précédent d dt y k = y k ∧ (ω + Γ k y k ∧ v) et 

d 

dt Γ k = Γ 2 k y k · v.

Environnement lointain 

Comme Γ = 1/‖ −→ CM‖, on peut considérer 

◮ Γ = 0 (surface S infiniment lointaine): 

d 

dt q = 1 2 qω, d 


∂y 

= −∇y · (η ∧ ω) 

∂t 

et alors ni q ni v ne sont observables; seuls les biais statiques sur le 

gyroscope le sont avec une image ayant suffisamment de contraste ( ∂y 

∂η 

non nul). 

◮ Γ petit d’ordre 1 et on néglige les termes d’ordre 2 en Γ: 

d 

dt q = 1 2 qω, d 


∂Γ 

∂y 

= −∇Γ · (η ∧ ω) , = −∇y · (η ∧ (ω + Γη ∧ v)) 

∂t 

∂t 

et alors on devrait pouvoir estimer v et seulement une partie de q car 

les rotations d’axe A grav ne sont pas observables: si t ↦→ (q, v, Γ, y) est 

solution alors pour tout g ∈ H 1 tel que gA grav = A gravg, t ↦→ (gq, v, Γ, y) 

est aussi solution avec les mêmes sorties y et les mêmes entrées (a, ω) 

(non-observabilité valable aussi sur le modèle complet précédent).

Estimation des biais statiques du gyroscope en environnement lointain 

On part de ∂y = −∇y · (η ∧ (ω + p)) où p ∈ R 3 est un biais statique. Alors 

∂t 

l’observateur asymptotique 

∂ŷ 

= −∇ŷ · (η ∧ (ω + ˆp)) − k y(ŷ − y) 

∂t 

∫ 

d 

dt ˆp = kp (ŷ − y)(∇ŷ ∧ η) dσ 

S 2 

est convergent pour tout gain k y, k p > 0. La convergence repose sur la 

fonction de Lyapounov suivante: 

V = 1 ∫ 

(ŷ − y) 2 dσ + 1 ‖ˆp − p‖ 2 

2 S 2 2k c 

pour laquelle on montre que d V = dt 

∫S −ky (ŷ − y) 2 dσ ≤ 0 à cause de 

2 

l’identité 

∫ 

∫ 

(ŷ(t, η) − y(t, η)) 2 dσ η = (ŷ(t, q ∗ ηq) − y(t, q ∗ ηq)) 2 dσ η 

S 2 S 2 

puisque η ↦→ q ∗ ηq est une isométrie sur la sphère unité S 2 .

Distorsion et image localisée sur une calotte sphérique 

La prise en compte de distorsions systématiques liées à l’optique de la 

caméra consistent alors à multiplier y par une fonction positive de η, φ(η). 

Cette fonction est à support sur une portion de la sphère. On considère donc 

des images Σ ∋ η ↦→ y(t, η) sur une calotte sphérique Σ ⊂ S 2 (Σ fermée). 

Pour éviter les discontinuités sur ∂Σ, φ est une fonction régulière à support 

compact dans l’intérieur ◦ Σ et proche de 1 sur une grande partie de Σ. Alors 

Y (t, η) = φ(η)y(t, η) s’annule doucement sur ∂Σ et vérifie 

∂Y 

∂t 

= − (∇Y − y∇φ) · (η ∧ (ω + Γη ∧ v)) 

où y∇φ est un vecteur tangent en η à S 2 dont les dépendances en t et η sont 

connues et qui s’annule doucement sur ∂Σ. 

On peut par exemple reprendre l’estimation des biais gyroscopiques en 

environnement lointain Γ = 0 avec l’image Y où les effets de bord sont gérés 

correctement via φ. De ∂Y = − (∇Y − y∇φ) · (η ∧ ω) on obtient 

∂t 

l’observateur 

∂Ŷ 

) 

= − 

(∇Ŷ ∂t 

− y∇φ · (η ∧ (ω + ˆp)) − k y(Ŷ − Y ), 

∫ 

d 

dt ˆp = kp (Ŷ − Y )(∇Ŷ − y∇φ) ∧ η) dσ 

S 2 

où les valeurs de y(t, η) et φ(η) sont utilisées directement.

Passage en coordonnées cartésiennes (z 1 , z 2 ) 

On suppose typiquement que l’axe optique 

de la caméra est selon z 3 . Tout repose 

sur une simple correspondance entre 

vecteurs unitaires η = (z 1 , z 2 , z 3 ) T sur 

une calotte sphérique Σ autour du pôle nord 

(0, 0, 1) T et les points de coordonnées cartésiennes 

(z 1 , z 2 , 1) du plan tangent en (0, 0, 1) T . 

L’image y(t, ·) est une fonction de (z 1 , z 2 ) (les 

pixels ne sont plus "numérotés" selon η mais 

(z 1 , z 2 )). 

∇y, vecteur tangent à la sphère en η (∇y · η ≡ 0), et dσ η l’élément d’aire en 

η sont alors données par 

⎛ 

⎜ 

∇y = ⎝ 

− 

( 

z 1 

∂y 

∂z 1 

(1 − z1 2 ) ∂y 

∂y 

− z 

∂z 1 z 2 1 

∂z 2 

∂y 

−z 1 z 2 + (1 − z 2 ∂z 1 

2 ) ∂y 

∂z 2 

∂y 

+ z 2 

∂z 2 

) √ 

1 − (z1 ) 2 − (z 2 ) 2 ⎞ 

⎟ 

dz 1 dz 2 

⎠ , dσ η = 

1 − (z 1 ) 2 − (z 2 ) . 2 

Pour obtenir ces expressions, on a ∂y dz 

∂z 1 + ∂y dz 

1 ∂z 2 ≡ ∇y · (dz 1 w 1 + dz 2 w 2 ) 

2 

pour toutes variations dz 1 , dz 2 où w 1 = ∂η = (1, 0, −z 

∂z 1 /z 3 ) T et 

1 

w 2 = ∂η = (0, 1, −z 

∂z 2 /z 3 ) T sont deux vecteur tangents en 

2 

η = (z 1 , z 2 , z 3 ) T ∈ S 2 , où ∇y est une combinaison linéaire de w 1 et w 2 , où 

dσ η est l’aire du petit parallélogramme formé par dz 1 w 1 et dz 2 w 2 .

Le modèle mixte ODE/PDE en cartésien (z 1 , z 2 ) 

Les équations générales 

d 

dt q = 1 2 qω, d 


∂Γ 

= −(∇Γ ∧ η) · (ω + Γη ∧ v) + Γ 2 ∂y 

v.η, = −(∇y ∧ η) · (ω + Γη ∧ v) 

∂t 

∂t 

font apparaître en fait ∇y ∧ η dont les composantes sont simplement 

( 

) T 

∂y 

∂y ∂y ∂y 

z 3 , − z 

∂z 3 , z 

2 ∂z 2 − z 

1 ∂z 1 1 ∂z avec z3 = √ 1 − (z 1 ) 2 − (z 2 ) 2 (idem pour 

2 

∇Γ ∧ η). Ainsi on a 

∂y 

( 

) 

= − z 2 ω 3 − z 3 ω 2 + Γ((z1 2 ∂y 

− 1)v 1 + z 1 z 2 v 2 + z 1 z 3 v 3 ) 

∂t 

∂z 1 

( 

) 

− z 3 ω 1 − z 1 ω 3 + Γ(z 1 z 2 v 1 + (z2 2 ∂y 

− 1)v 2 + z 2 z 3 v 3 ) 

∂z 2 

∂Γ 

∂t 

( 

) 

= − z 2 ω 3 − z 3 ω 2 + Γ((z1 2 ∂Γ 

− 1)v 1 + z 1 z 2 v 2 + z 1 z 3 v 3 ) 

∂z 1 

( 

) 

− z 3 ω 1 − z 1 ω 3 + Γ(z 1 z 2 v 1 + (z2 2 ∂Γ 

− 1)v 2 + z 2 z 3 v 3 ) 

∂z 2 

+ Γ 2 (z 1 v 1 + z 2 v 2 + z 3 v 3 ) 

Ici y(t, z 1 , z 2 ) est le flux de photons captés dans la direction 

η = (z 1 , z 2 , z 3 ) T ∈ S 2 .

Estimation des biais des gyroscopes 

Les biais gyroscopiques en environnement lointain: Γ = 0 avec l’image 

Y = φy localisée sur Σ où les effets de bord sont tronqués via φ. De 

∂Y 

∂t 

= − (z 2 ω 3 − z 3 ω 2 ) 

( ∂Y 

− y ∂φ ) 

− (z 3 ω 1 − z 1 ω 3 ) 

∂z 1 ∂z 1 

on obtient l’observateur estimant les biais p: 

∂Ŷ 

∂t 

= −k y(Ŷ − Y ) − (z 2(ˆω 3 + ˆp 3 ) − z 3 (ˆω 2 + ˆp 2 )) 

− (z 3 (ˆω 1 + ˆp 1 ) − z 1 (ˆω 3 + ˆp 3 )) 

d 

dt ˆp 1 = k p 

∫ ∫Σ 

d 

dt ˆp 2 = −k p 

∫ ∫Σ 

( 

) 

(Ŷ − Y ) ∂Ŷ 

− y ∂φ 

∂z 2 ∂z 2 

( 

) 

(Ŷ − Y ) ∂Ŷ 

− y ∂φ 

∂z 1 ∂z 1 

( 

) 

∂Ŷ 

− y ∂φ 

∂z 2 ∂z 2 

( ∂Y 

− y ∂φ ) 

∂z 2 ∂z 2 

( 

) 

∂Ŷ 

− y ∂φ 

∂z 1 ∂z 1 

dz 1 dz 2 

√ 

1 − (z1 ) 2 − (z 2 ) 2 

dz 1 dz 2 

√ 

1 − (z1 ) 2 − (z 2 ) 2 

∫ ( 

) 

d 

dt ˆp 3 = k p (Ŷ ∫Σ 

− Y ) ∂Ŷ ∂Ŷ ∂φ ∂φ 

z 2 − z 1 − yz 2 + yz 1 

∂z 1 ∂z 2 ∂z 1 ∂z 2 

où les valeurs de y et φ sont utilisées directement. 

dz 1 dz 2 

1 − (z 1 ) 2 − (z 2 ) 2 .

Le modèle approché ODE/PDE 

Si suppose la calotte sphérique Σ petite (i.e., l’angle solide couvert par 

l’image est assez petit), alors, à l’ordre 1 en (z 1 , z 2 ) on obtient le modèle 

suivant: 

d 

dt q = 1 2 qω, 

∂Γ 

∂t 

∂y 

∂t 

d 


= (ω 2 − z 2 ω 3 + Γ(v 1 − z 1 v 3 )) ∂Γ 

∂z 1 

+ (z 1 ω 3 − ω 1 + Γ(v 2 − z 2 v 3 )) ∂Γ 

∂z 2 

+ Γ 2 (z 1 v 1 + z 2 v 2 + v 3 ) 

= (ω 2 − z 2 ω 3 + Γ(v 1 − z 1 v 3 )) ∂y 

∂z 1 

+ (z 1 ω 3 − ω 1 + Γ(v 2 − z 2 v 3 )) ∂y 

∂z 2 

Il serait intéressant d’étudier sur ce modèle simplifié l’estimation en temps 

réel de la vitesse v ∈ R 3 et de l’orientation q ∈ H 1 à partir des images 

Σ ∋ (z 1 , z 2 ) ↦→ y(t, z 1 , z 2 ) jouant ici le rôle de sortie. 

Pour une caméra dont l’axe optique est selon η = (0, 0, 1) T et pour laquelle Σ 

est une image rectangulaire (z 1 , z 2 ) ∈ [−r 1 , r 1 ] × [−r 2 , r 2 ]: y(t, z 1 , z 2 ) 

correspond au flux de photons captés dans la direction 

( 

z 1 , z 2 , √ 1 − (z 1 ) 2 − (z 2 ) 2 ) T 

∈ S 2 avec pour garder un angle solide petit: 

0 < r 1 , r 2 ≪ √ π.

Références utiles 

◮ EDO, systèmes plans, et régulateurs (très pédagogique et pourtant d’un 

excellent niveau) A. Andronov, S. Khaikin and A. Vitt: Theory of Oscillators. 

Dover (English Translation), 1987. 

◮ la BD des systèmes dynamiques en 4 volumes (que des portraits de phases et 

des dessins): R.H. Abraham and C.D. Shaw. Dynamics – The Geometry of 

Behavior : I-IV. Aerial Press, Santa Cruz, California, 1981. 

◮ Systèmes dynamiques (très bonne introduction aux EDO) V. Arnold: Equations 

différentielles ordinaires. Mir Moscou, 1974. 

◮ Bifurcation et théorie des perturbations et KAM (très avancé) V. Arnold: 

Chapitres Supplémentaires de la Théorie des Equations Différentielles 

Ordinaires. Mir Moscou, 1980. 

◮ Idem ci-dessus : J. Guckenheimer and P. Holmes: Nonlinear Oscillations, 

Dynamical Systems and Bifurcations of Vector Fields. Springer, New York, 1983. 

◮ Contrôle non linéaire, Lyapounov et Robotique: J. Slotine et J. Li: Applied 

Nonlinear Control. Prentice Hall, Englewood Cliffs, 1991. 

R. Sepulchre, M. Janković, P. Kokotović: Constructive nonlinear control, Springer 

Verlag, 1997. 

◮ Contrôle non linéaire (une partie importante sur les EDO, la stabilité et les 

systèmes lents/rapides): H. Khalil: Nonlinear Systems. MacMillan, 1992.

Références utiles (suite et fin) 

◮ Equations de Lagrange L. Landau, E. Lifchitz: Physique théorique: Mécanique, 

tome I. Mir-Moscou, 1964. 

◮ em Systèmes linéaires et formes de Brunovsky F. Bonnans et P. Rouchon: 

Commande et optimisation de systèmes dynamiques. 2005. 

◮ Systèmes différentiellements plats (dimension finie et infinie): Ph. Martin et P. 

Rouchon: Systèmes plats, planification et suivi de trajectoires, Notes, Journées 

X-UPS, 1999 . Cours téléchargeable à l’adresse: 

http://math.polytechnique.fr/xups/vol99.html 

◮ Symétries et groupes de Lie. P.J. Olver: Classical Invariant Theory. Cambridge 

University Press, 1999. Du même auteur: Equivalence, Invariants and 

Symmetry. Cambridge University Press. 1995. 

◮ Sur les observateurs invariants : Silvère Bonnabel: observateurs asymptotiques 

invariants : théorie et exemples. PhD thesis, Mines-ParisTech, September 2007. 

http://www.silvere-bonnabel.com/pdf/These_Silvere.pdf. Et 

aussi l’article de base: S. Bonnabel, Ph. Martin, P. Rouchon: Invariant 

asymptotic observers. IEEE Trans. Automatic Control, vol.53, pp:2514-2526, 

2008. 

◮ Sur la contraction : W. Lohmiler, J.J.E. Slotine: On Metric Analysis and 

Observers for Nonlinear Systems. Automatica, vol.34, no.6, pp:683–696, 1998.

MASTER MVA Dynamique et contrÃ´le des systÃ¨mes non-linÃ©aires

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?