DÃ©veloppement d'un logiciel d'optimisation de mouvements de robots

Développement d’un logiciel d’optimisation de mouvements de robots -Validation expérimentale avec un mouvement de coup de pied du HRP-2Sylvain MiossecJRL AISTTsukuba, Japansylvain.miossec@aist.go.jpKazuhito YokoiJRL AISTTsukuba, Japankazuhito.yokoi@aist.go.jpAbderrahmane KheddarJRL CNRSTsukuba, Japankheddar@ieee.orgAbstract— Cet article présente un logiciel conçu pourl’optimisation de mouvements de robots. Il permet pourl’instant de générer des mouvements de structures arborescentescomplètement actionnées. Les mouvements générés satisfontune contrainte de stabilité tout en minimisant l’énergieconsommée. L’optimisation de mouvement est résolue avecle logiciel d’optimisation IPOPT. Pour obtenir une meilleureconvergence, le gradient est calculé de manière exacte. Nousavons de plus considéré les frottements articulaires, qui sontsouvent omis dans la littérature alors qu’ils ont un effetprépondérant. L’efficacité du logiciel est démontrée à traversl’exemple d’un mouvement de coup de pied pour le robot HRP-2 en considérant ses 30 degrés de liberté. Le mouvement obtenua été appliqué avec succès sur le robot réel. Nous montrons ainsique l’optimisation de mouvement est un outil puissant pourgénérer de nombreux types de mouvements, et pour prendreen compte les limitations non linéaires du système.Index Terms— mouvent optimal, humanoïde, frottement articulaire.I. INTRODUCTIONIl existe deux grandes familles de méthodes pour résoudrel’optimisation de mouvements : (i) les méthodes indirectesqui consistent a appliquer le principe du maximum dePontryagin, puis a résoudre un BVP (Boundary Value Problem)(ii) les méthodes directes qui consistent a résoudrepar optimisation paramétrique le problème discrétisé. Lesméthodes indirectes sont plus précises et plus rapides, maisleur domaine de convergence est plus faible et il faut dérivermathématiquement les équations du BVP. Les méthodesdirectes s’avèrent beaucoup plus faciles d’utilisation en pratique.Les méthodes directes peuvent être classées en (i) laméthode de collocation, (ii) la méthode de multiple-shootinget (iii) la méthode basée sur le modèle dynamique inverse.[1] et [2] ont montré que pour des robots complètementactionnés, la méthode basée sur le modèle dynamique inverseest plus efficace.De nombreux travaux de génération de mouvements optimauxont été menés, soit pour des avatars virtuels, voir parexemple [3] et [4], soit pour des robots, voir par exemple[5], [6], [7]. Cependant aucun de ces travaux ne tient compteCette recherche a été menée à l’AIST/CNRS Joint Japanese-French RoboticsLaboratory (JRL) localisé à l’Intelligent Systems Research Institute,AIST Central 2, 1-1-1 Umezono, Tsukuba 305-8568, Japan, et a été supportépar une bourse de la Japan Society for the Promotion of Science (JSPS)des frottements articulaires. Récemment [8] a montre que larégularisation des frottement permet d’en tenir compte enutilisant les méthodes habituelles. Cependant il faut que ladiscrétisation du problème soit suffisante.Dans cet article nous avons utilise la méthode degénération de mouvements basée sur la dynamique inverse,et nous avons tenu compte des frottements articulairesavec une régularisation. Seuls les robots arborescentscomplètement actionnes sont considérés. Nous avons calculéles composantes non nulles du gradient du modèledynamique en tenant compte des dépendances dans laméthode récursive de Newton-Euler. La Section II présente leproblème d’optimisation de mouvement sous forme générale.La section III présente le logiciel, les contraintes considérées,la méthode de calcul du gradient. La section IV présentel’application du logiciel au cas du coup de pied du HRP-2. La section V présente les résultats expérimentaux. Enfinnous donnons des perspectives et concluons en section VI.II. PRÉSENTATION DU PROBLÈMELe probleme presente ici est le resultat de la discretisationdu probleme d’optimisation de mouvement non simplifie, quiest un probleme d’optimisation d’un critere dans un espacede fonctions, avec des contraintes semi-infinies (qui ont lieusur toute la duree du mouvement).A. les contraintesL’ensemble des contraintes sur le robot ou le mouvementpeuvent se mettre sous la forme suivantec t (q(t k ), ˙q(t k ), ¨q(t k ),u(t k )) ≤ 0 (1){cmeq (q(t k )) = 0(2)c mineq (q(t k )) ≤ 0c mt (q(t d )) = 0 (3)(1) correspond aux contraintes de limite du robotdiscrétisées aux instants t k , (2) correspond aux contraintessur le mouvement désiré discrétisées aux instants t k et (3)correspond aux contraintes sur le mouvements ayant lieuseulement a des instant discret t d .B. La parametrisation du mouvementParmi l’ensemble des mouvements possibles, nous considéronsceux définissant les variables articulaires q(t) par

des fonctions paramétréesq(t) = q(p,t) (4)Ces fonctions paramétrées peuvent être des polynômes, desB-splines, ou tout autre base de fonctions. L’ensemble desmouvements dans lequel des mouvements sont recherchésest donc défini par les paramètres p.C. Problème obtenuLe problème a résoudre est alors le problèmed’optimisation paramétrique suivantmin C(q(p,t), ˙q(p,t),u(t),t f )p,t f ,t dsubject to (1), (2), (3)La commande u(t) est calculée avec le modèle dynamiqueinverse a partir de q(p,t).III. PRÉSENTATION DU LOGICIELLe logiciel développé contient une étape de définition descaractéristiques du mouvements désiré, et inclus les calculsdes variables articulaires comme des B-splines, les calculsde dynamique, les calculs des contraintes et du critère duproblème. Les gradients sont également calcules. Le logicielinclus une interface avec le programme d’optimisationIPOPT (voir [9] pour plus de détails).Les systèmes considérés sont les chaînes cinématiquesouvertes complètement actionnées composées d’articulationsrotoïdes. Seul les systèmes avec un contact avecl’environnement sont considérés. Ce contact peut êtreunilatéral ou bilatéral.A. La base de fonctionLes fonctions parametrees considerees sont les B-splinesn pj(5)∑q j (p,t) = B i (t)c ij (6)i=1ou n pj est le nombre de bases de fonction, c ij est lecoefficient de l’articulation j et de la fonction de base B i (t).Les paramètres du mouvement sont alors p = {c ij | i ∈[1,N],j ∈ [1,n pj ]}. Il y a N × n pj paramètres. N estle nombre d’articulations. Un avantage des B-splines surles polynômes est qu’elles entraînent moins de calcul degradient.Pour un mouvement point-à-point (qui a des vitesses etaccélérations initiales et finales nulles), nous calculons les3 coefficients initiaux et finaux des B-splines à partir desconfigurations initiales q init et finales q final . Il y a donc N ×(n pj − 4) paramètres donnés par p = {q init ,q final ,c ij | i ∈[1,N],j ∈ [4,n pj − 3]}.B. Calcul des dynamiques1) Modèle dynamique considéré: Nous considérons lemodèle Lagrangien classique;u m = A(q)¨q + H(q, ˙q) (7)u m ∈ R n est le vecteur de couples articulaire, q ∈ R n , ˙q ∈R n , ¨q ∈ R n sont les positions, vitesses et accélérations articulaires,A(q) ∈ R n×n est la matrice d’inertie, et H(q, ˙q) ∈R n est le vecteur des effets de Coriolis, centrifuges et degravité.Nous utilisons l’algorithme de Newton-Euler qui permetde calculer u m ainsi que la force f et le moment m résultantentre le sol et la base du robot.Les frottements sont considérés dans le modèle suivant quidonne le couple u j nécessaire pour vaincre les frottements.u j = u m,j + 2u d,jπarctan( q˙jc r ) + u v,j q˙j (8)u d est le couple de frottement statique, c r est le coefficient derégularisation, u v est le coefficient de frottement visqueux.L’approximation est meilleure lorsque c r est grand.2) Gradient du modèle dynamique: Pour améliorerl’efficacité du processus d’optimisation, nous calculons lesgradients du critère et des contraintes. La part principale estle le calcul du gradient des couples ∂u k∂pavec le modèledynamique. Ce calcul est présenté dans [3], [10], [11].L’apport a ici été de ne pas calculer les composantes nullesdes gradients lors des récursions de Newton-Euler. On sereportera à [12] pour plus de détail.C. Les contraintesDe nombreuses contraintes existent sur le système. Onpeut en distinguer deux types : (i) les limitations physiquesdu système et (ii) les contraintes sur le mouvement quiservent à définir le mouvement désiré.Les contraintes physiques que nous avons considérées sontles suivantes :• les butées articulaires• les vitesses articulaires limites• les limites des actionneurs sous forme d’une inégalitélinéaire sur u et ˙q• les contraintes de non glissement, non décollement etnon basculement du contact avec le solLes contraintes sur le mouvement qui peuvent être utiliséessont les suivantes :• des contraintes égalité de position de corps du robot àdes instants donnés• des contraintes inégalité de position de corps du robottout au long du mouvement• des contriantes égalité de l’orientation de corps à desinstants donnés• des articulations figées durant tout le mouvementD. Le critère considéréPour l’instant nous avons seulement implémenté un critèreénergétique. Mais d’autres critères seraient très simple àimplémenter (comme le temps minimum de mouvement).Le critère énergétique considéré tiens compte des pertespar frottement et dans les résistances des moteurs. Il rendcompte du fait que l’énergie restituée par les moteurs peut

être stockée pour être réutilisée. Ce critère est donné parC( ˙q,u,t f ) =∫ tft 0N∑j=12R j u jKem,j2 + u j ˙q j dt (9)où R j est la résistance moteur et K em,j la constante électromotricepour le moteur de l’articulation j.IV. ÉTUDE DE CASNous avons appliqué le logiciel présenté précédemmentpour la génération d’un mouvement de coup de pied durobot HRP-2. Les paramètres dynamiques du modèle utiliséviennent du modèle CAO du robot, mais nous avons identifiéles paramètres du modèle de frottement articulaire.In section IV-A we present how the desired motion isdefined, and in section IV-B we present the optimal motionobtained and some characteristics of the process of motiongeneration.A. Définition du mouvement désiréDans la perspective d’un coup de pied réel, nous aurionsdéfini le mouvement par une vitesse du pied donnée à uneposition donnée. Pour démontrer l’efficacité de notre logiciel,nous nous sommes pour l’instant contenté d’un mouvementdéfini par une position initiale et une position finale du pied.Pour éviter l’auto-collision, nous avons réglé à la main descontraintes inégalité sur la position des corps en collisions.Pour une implémentation réelle, nous avons également ajoutéune contrainte sur la flexion de la jambe de support. Eneffet le robot possède des flexibilités dans les pieds dont ladéformation est compensée par un stabilisateur. Or à l’heureactuelle, le stabilisateur ne permet pas d’avoir la jambede support tendue. Nous avons considéré ce coup de piedcomme un mouvement point-à-point avec les configurationsinitiales et finales libres. C’est-à-dire que ces configurationssont optimisées en même temps que le mouvement.B. Résultats de l’optimisationNous avons choisi arbitrairement 9 coefficients de B-splines par articulation, ce qui nous donne un total den p = 151 paramètres d’optimisation. Nous avons considéré61 points de discrétisation pour le calcul du critère et 13points de discrétisation pour la vérification des contraintes.Le mouvement de coup de pied obtenu est présenté fig. 1.Le tableau I présente les temps de calculs et les critèresobtenus pour les deux situations avec et sans la contrainte deflexion de la jambe de support. Nous obtenons relativementrapidement un mouvement optimisé. Nous pouvons constaterque le mouvement genou plié consomme environ 2 foisplus d’énergie que le mouvement jambe tendue. Pour uneimplémentation énergétiquement rentable le robot devraitdonc pouvoir avoir les jambes tendues. Nous voyons quela plupart du temps de calcul est dû à l’évaluation du critèreet des contraintes et de leurs gradients. Ces calculs sontfortement parallélisables et pourraient grandement bénéficierdes nouvelles architectures de calcul parallèles.TABLE IRÉSULTATS D’OPTIMISATION DE MOUVEMENT, AVEC ET SANS LACONTRAINTE DE JAMBE FLÉCHIE.?ouvement avec jambe fléchie sans jambe fléchieNombre288 358d’itérationsTemps total 1min 13s 1min 28sTemps IPOPT 12,4s 14,1sTemps critère et 60,6s 73,9scontraintesCritère optimisé 661,7 kJ 375.5 kJV. RÉSULTATS EXPÉRIMENTAUXSeul le mouvement avec le genou plié a pu êtreimplémenté de manière stable sur le robot. La fig. 1 présentele mouvement expérimenté de manière stable sur le robot.Nous avons pour l’instant seulement implémentéexpérimentalement les mouvements optimaux que nousavions générés sans les frottements articulaires identifiés.Pour ce mouvement optimisé sans les frottements articulairesidentifiés, l’énergie théorique dépensée avec lesfrottements articulaires identifiés est de C th = 4893kJ.Cet écart avec la valeur du critère optimisé montre bienl’importance de prendre en compte les frottements articulaires.Cet écart important s’explique aussi en partie par lefait que le mouvement optimisé sans les frottements articulairesest plus rapide, et que l’effet des frottements fluidesest donc important. L’énergie dépensée calculée à partirdes estimations de courant lors de l’expérimentation est deC exp = 9356kJ. La différence avec C th est essentiellementdue à la modification du mouvement par le stabilisateurpour compenser la déformation de la flexibilité du pied. Lafig. 2 qui présente les positions et vitesses du mouvementde référence, des consignes (modifiées par le stabilisateur)et mesurées, permet de juger de l’effet du stabilisateur et dela qualité de la commande proportionnelle dérivée pour lesuivi de mouvement.angle [deg]vitesse [rad/s]Fig. 2.3020100mouvement optimalconsignemesure−100 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.910−1−2−3−40 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9temps [s]Position et vitesse de l’articulation en lacet de la hanche droitePour juger de l’effet de la flexibilité sur la stabilité dumouvement, nous présentons fig. 3 les ZMP théorique et

Fig. 1.Coup de pied optimisé et validation expérimentale.mesuré. Nous voyons clairement que la trajectoire du ZMPobtenue est très différente du fait de la flexibilité, mais ellereste dans le pied, grâce au stabilisateur.0.080.060.040.020−0.02−0.04foot edgesexperimental ZMPtheoretic ZMP−0.06−0.1 −0.05 0 0.05 0.1 0.15Fig. 3.ZMP théorique et expérimental.VI. CONCLUSIONDans cet article, nous avons présenté un logiciel pourl’optimisation de mouvements pour des robots sans chaînesfermées. Nous avons démontré l’efficacité de la méthode surl’exemple d’un mouvement de coup de pied du robot HRP-2. Ce mouvement a été implémenté sur le robot réel avecsuccès. Nous avons montré l’importance de considérer lesfrottements articulaires. Nous avons également pu constaterl’effet de la flexibilité, compensée par le stabilisateur, surle mouvement du robot réel. Nous allons à l’avenir tenircompte de cette flexibilité pour obtenir un mouvement réelplus proche de ce qui est obtenu en optimisation.REFERENCES[1] O. V. Stryk, “Optimal control of multibody systems in minimalcoordinates,” in Proceedings of the Annual GAMM Conference, 1997.[2] M. C. Steinbach, “Optimal motion design using inverse dynamics,”Tech. Rep., 1997.[3] J. Lo, G. Huang, and D. Metaxas, “Human motion planning basedon recursive dynamics and optimal control techniques,” MultiboldySystem Dynamics, vol. 8, pp. 433–458, 2002.[4] A. Safonova, J. Hodgins, and N. Pollard, “Synthesizing physicallyrealistic human motion in low-dimensional, behavior-specific spaces,”ACM Transactions on Graphics, vol. 23, no. 3, pp. 514–521, August2004.[5] M. Hardt, K. Kreutz-Delgado, and J. W. Helton, “Optimal bipedwalking with a complete dynamical model,” in Proceedings of the38th IEEE Conference on Decision and Control, 1999.[6] C. Chevallereau and Y. Aoustin, “Optimal reference trajectories forwalking and running of a biped robot,” Robotica, vol. 19, pp. 557–569, 2001.[7] J. Denk and G. Schmidt, “Synthesis of a walking primitive database fora humanoid robot using optimal control techniques,” in Proceedingsof IEEE-RAS International Conference on Humanoid Robots, 2001,pp. 319–326.[8] D. E. Stewart and M. Anitescu, “Optimal control of systems withdiscontinuous differential equations,” submitted, 2006.[9] A. Wachter and L. T. Biegler, “On the implementation of a primaldualinterior point filter line search algorithm for large-scale nonlinearprogramming,” Mathematical Programming, vol. 106, no. 1, pp. 25–57, 2006.[10] G. Sohl, “Optimal dynamic motion planning for underactuated robots,”Ph.D. dissertation, University of California, 2000.[11] S.-H. Lee, J. Kim, F. Park, M. Kim, and J. Bobrow, “Newton-typealgorithms for dynamics-based robot movement optimization,” IEEETransactions on Robotics, vol. 21, no. 4, August 2005.[12] S. Miossec, K. Yokoi, and A. Kheddar, “Development of a softwarefor motion optimization of robots - application to the kick motionof the hrp-2 robot,” in Proceedings of the 2006 IEEE InternationalConference on Robotics and Biomimetics, Kunming, 2006.

DÃ©veloppement d'un logiciel d'optimisation de mouvements de robots

Create successful ePaper yourself

Delete template?

Save as template?