TH`ESE - Enseeiht

N o Ordre : 1303 

THÈSE 

présentée en vue de l’obtention 

du titre de 

DOCTEUR DE L’INSTITUT NATIONAL POLYTECHNIQUE DE TOULOUSE 

Spécialité : INFORMATIQUE 

par 

GUIVARCH Ronan 

LABORATOIRE D’INFORMATIQUE ET DE MATHÉMATIQUES 

APPLIQUÉES (ENSEEIHT–IRIT) 

Résolution parallèle de problèmes aux limites couplés par des 

méthodes de sous-domaines synchrones et asynchrones. 

Soutenue le 17 Juin 1997 devant le jury composé de 

Président du Jury : M. J.C. MIELLOU 

JURY : M. M. GARBEY Rapporteur 

M. J.C. MIELLOU Rapporteur 

M. H.C. BOISSON Examinateur 

M. J. NOAILLES Examinateur 

M. A. RIGAL Examinateur 

M. Ph. ROUZAUD Examinateur 

M. P. SPITÉRI Examinateur

O Breizh, ma bro ! Me gar ma bro ; 

Tra ma vo’r mor Vel mur’n he zro, 

Ra vezo digabestr, Ma bro ! 

Ô, Bretagne mon pays ! Je t’aime ; 

Tant que la mer t’encerclera telle une muraille, 

Mon pays, tu resteras libre. 

À mes parents, à Marie et Alain

Cette étude a été entreprise au Laboratoire d’Informatique et de Mathématiques Appliquées de L’ École 

Nationale Supérieure d’ Électrotechnique, d’Électronique, d’Informatique et d’Hydraulique de Toulouse, sous la 

direction de Pierre Spitéri ; je tiens à le remercier pour son soutien et son aide qui m’ont permis de mener à 

bien ces travaux. Je tiens à lui assurer ma profonde gratitude pour m’avoir initié à la recherche. 

Je tiens également à assurer de ma reconnaisance : 

Monsieur J.C. Miellou, Professeur à l’Université de Franche-Comté, qui a accepté d’être rapporteur de 

cette thèse, et qui par ses remarques pertinentes, son soutien constant et ses encouragements m’a permis 

de faire avancer mes travaux, 

Monsieur M. Garbey, Professeur à l’Université Claude Bernard de Lyon 1, Directeur du Centre pour 

le Développement du Calcul Scientifique Parallèle de l’Université de Lyon 1, qui me fait l’honneur d’être 

rapporteur de ce travail, et qui par ses conseils avisés m’a aidé à améliorer la présentation de ce manuscrit, 

Monsieur H.C. Boisson, Directeur de Recherche à l’Institut de Mécanique des Fluides de Toulouse avec 

qui nous avons eu l’occasion de collaborer sur des thèmes scientifiques complémentaires. Je remercie aussi 

J.P. Bombaud qui a mis à ma disposition les moyens de visualisation de l’I.M.F.T., 

Monsieur A. Rigal, Professeur à l’Université Paul Sabatier de Toulouse, pour l’intérêt porté à mes travaux 

et pour son aimable participation au jury d’examen, 

Monsieur Ph. Rouzaud, Directeur du C.N.U.S.C., qui a accepté d’être membre de mon jury ainsi que 

pour les facilités qu’il m’a accordées pour l’utilisation du multiprocesseur SP2 du C.N.U.S.C. Je profite de 

l’occasion pour adresser mes remerciements à Madame M. Batlle, Messieurs G. Urbach, J.L. Ambrosino 

et G. Gil pour l’aide technique qu’ils m’ont apportée et qui a contribué au bon déroulement de ce travail. 

Je remercie Ph. Fallandry pour le soin apporté à la phase de visualisation des résultats du problème 

d’électrophorèse, 

Monsieur J. Noailles, Professeur à l’Institut National Polytechnique de Toulouse pour l’attention bienveillante 

et constante qu’il a toujours manifestée vis-à-vis de mon travail. 

J’adresse également mes remerciements à Didier El Baz, chargé de recherche C.N.R.S. au L.A.A.S. de Toulouse 

pour les conversations constructives et fructueuses que nous avons pu mener durant ce travail de thèse. 

Je remercie aussi L. Giraud du C.E.R.F.A.C.S. ainsi que toutes les personnes du deuxième étage du laboratoire 

d’informatique : P. Amestoy, Ph. Berger, M. Daydé, J. Decamps et D. Ruiz pour les discussions intéressantes 

que nous avons eues ensemble et pour la bonne ambiance qui règne à cet étage. 

Je tiens aussi à remercier J.B. Caillau pour l’aide apportée au niveau de l’utilisation de Matlab, M. Coulon 

pour son travail préliminaire sur le solveur 3D de Navier et Stokes, M. Charpentier, X. Crégut et M. Pantel 

pour leur aide en L ATEX ainsi que les nombreux thésards et permanents du L.I.M.A. 

Je remercie l’ensemble du personnel enseignant et administratif de la filière et du département informatique 

de l’E.N.S.E.E.I.H.T pour la sympathie qu’ils m’ont témoignée durant la réalisation de ce travail, en particulier 

Monsieur J.L. Basille qui a accepté de me parrainer durant mon monitorat et Monsieur G. Padiou pour avoir 

facilité mes conditions de travail au sein du L.I.M.A. 

Je remercie aussi le personnel du Service Édition de l’E.N.S.E.E.I.H.T pour le soin qu’il a apporté à la 

réalisation du tirage de ce document.

Mots Clés : 

Résumé : 

- Calcul Scientifique Haute Performance - Méthodes de sous-domaines 

- Parallélisme - Méthode Alternée de Schwarz 

- Algorithmes Asynchrones 

- 

- Problème de Navier-Stokes 

Équations aux Dérivées Partielles 

Nous nous intéressons à la résolution de problèmes aux limites linéaires ou non-linéaires de grandes tailles 

résolus à l’aide d’algorithmes parallèles sur machines multiprocesseurs à mémoire distribuée. 

Dans les algorithmes que nous considérons, les processeurs communiquent de manière asynchrone ou synchrone 

les résultats de leurs calculs. Dans le présent travail nous avons mixé les aspects communication synchrone et 

asynchrone avec les méthodes de sous-domaines. On considère plus particulièrement le couplage entre la méthode 

alternée de Schwarz et les algorithmes synchrones et asynchrones. Indépendemment de la résolution d’équations 

aux dérivées partielles classiques intervenant en physique mathématique, nous nous sommes intéressés à l’implantation 

de ces algorithmes sur machines multiprocesseurs à mémoire distribuée au moyen des outils parallèles 

que fournissent P.V.M. ( Parallel Virtual Machine ) et M.P.I. ( Message Passing Interface ). 

Dans un premier temps nous rappelons la formulation classique des algorithmes synchrones et asynchrones 

ainsi que les conditions d’étude de la convergence de ces méthodes ; nous présentons l’adaptation de ces résultats 

au cas des méthodes de sous-domaines avec recouvrement et nous appliquons ces critères à des problèmes aux 

limites classiques. 

Ensuite nous exposons les algorithmes parallèles asynchrones avec communication flexible ; nous présentons 

le lien avec les méthodes de sous-domaines ainsi que les critères de convergence pour l’étude de problèmes aux 

limites non linéaires, en particulier dans le cas de maillages éléments finis non structurés. 

Dans un troisième temps nous exposons l’implantation de ces méthodes sur le multiprocesseurs I.B.M.-SP2 

du C.N.U.S.C. ( Centre National Universitaire Sud de Calcul de Montpellier ) à l’aide de P.V.M. et M.P.I. Nous 

proposons des schémas d’implantation des algorithmes asynchrones et synchrones classiques et des algorithmes 

asynchrones avec communication flexible en utilisant les routines de communications de P.V.M. et de M.P.I. 

Nous présentons par la suite l’analyse ainsi que les tests numériques pour la résolution de deux types de 

problèmes aux limites : un problème de convection-diffusion, soit linéaire, soit perturbé par une application 

diagonale non décroissante, ce qui dans ce dernier cas conduit à un problème non linéaire. Le second problème 

traité est le problème de Navier-Stokes 2D. L’utilisation de la formulation fonction courant-tourbillon conduit 

à la résolution d’une équation de convection-diffusion couplée à une équation de Poisson. 

Finalement nous montrons que les résultats étudiés précédemment s’appliquent à la résolution d’un problème 

d’électrophorèse 3D où interviennent les équations de Navier-Stokes couplées à une équation de transport et à 

une équation de potentiel.

Parallel solution of linked boundary value problems with synchronous 

and asynchronous subdomains methods. 

Keywords : 

- High Performance Scientific Computation - Decomposition Methods 

- Parallelism - Alternating Schwarz Method 

- Asynchronous Algorithms - Navier-Stokes Problem 

- Partial Differential Equations 

We study the solution of large linear and non linear boundary value problems solved with parallel algorithms 

on distributed memory multiprocessors. 

In the present work we are interested by asynchronous Schwarz alternating method for the solution of boundary 

value problems. In this kind of method, the components of the iteration vector are updated in parallel by the 

different processors without any order nor synchronization. Independently of the solution of boundary value 

problems, we study the implementation of these algorithms on distributed memory multiprocessors with P.V.M. 

( Parallel Virtual Machine ) and M.P.I. ( Message Passing Interface ). 

In a first chapter of our work, we recall the classical formulation of synchronous and asynchronous algorithms 

and the convergence conditions of these methods ; we present the adaptation of these results to subdomains 

methods with overlapping and we apply these criteria to some classical boundary value problems. 

We expose in a second chapter the parallel algorithms with flexible communication and present the link with 

the subdomains methods and the convergence criteria for the study of non linear boundary value problems, in 

particular with a finite elements mesh. 

The third chapter concerns the implementation of these methods on the I.B.M.-SP2 of the C.N.U.S.C. at 

Montpellier with P.V.M. and M.P.I. We propose the implementation schemes of classical synchronous and 

asynchronous algorithms and asynchronous algorithms with flexible communication by using P.V.M. and M.P.I. 

communication routines. 

We present in chapter four and five the analysis and the numerical tests for the solution of two kinds of 

boundary value problems : the convection-diffusion problem, linear or perturbated by a monotone nondecreasing 

operator, which leads to a non linear problem. The second problem is the 2D Navier-Stokes problem with the 

classical vorticity-stream function formulation which leads to the solution of a convection-diffusion equation 

linked to a regular Poisson equation. 

Finally we show that the results studied above can be applied to the solution of a 3D electrophoresis problem 

where take occurs the Navier-Stokes problem linked with a mass transport equation and a potential equation.

Introduction générale. 

L’étude de phénomènes intervenant dans des domaines comme la physique, la chimie, la mécanique, la 

météorologie, la recherche pétrolière ou l’économie conduit à l’élaboration de modèles mathématiques de plus en 

plus sophistiqués. Le développement de tels modèles, toujours plus complexes et prenant en compte le maximum 

de phénomènes physiques, est facilité par les possibilités actuelles de calcul. Ces progrès dans la modélisation 

sont liés également à l’émergence de l’utilisation des simulations numériques dans l’industrie. 

La résolution numérique de tels modèles, où interviennent des équations aux dérivées partielles couplées, 

conduit à la résolution de systèmes algébriques de très grandes tailles surtout si on se place dans des domaines 

tridimensionnels. Par exemple l’étude complète du comportement d’un avion conduit à la résolution des 

équations de Navier-Stokes simplifiées ; si le nombre de paramètres physiques, vitesses, déformations, pression 

... est de 20 et que l’on considère une discrétisation par un maillage de 10 7 points, nous obtenons un système 

de 2 × 10 8 équations non linéaires à 2 × 10 8 inconnues [6] ; la difficulté numérique rencontrée dans ce contexte 

est de plus aggravée par le fait que le problème considéré est un problème d’évolution, ce qui compte tenu du 

surcroît de la non-linéarité augmente considérablement le calcul : dans notre exemple cela conduirait à un total 

de 10 13 opérations arithmétiques. 

Jusqu’à ces dernières années les ordinateurs utilisés avait un comportement séquentiel conforme à l’architecture 

de Von Neumann. Actuellement des travaux sont encore réalisés sur ce type de machine pour diminuer leur 

cycle de base ainsi que pour augmenter leurs capacités de stockage. Cependant les temps de restitution des 

programmes informatiques traitant les problèmes de type industriels précédemment évoqués demeurent toujours 

trop important. Parmi les solutions envisageables pour diminuer ce temps de calcul, le parallélisme est une voie 

actuellement très étudiée. 

Pour la résolution numérique parallèle des équations aux dérivées partielles sur machines multiprocesseurs, les 

méthodes de sous-domaines sont bien adaptées. Parmi les méthodes de sous-domaines on considère généralement, 

soit des méthodes de sous-domaines sans recouvrement comme la méthode du complément de Schur, soit des 

méthodes de sous-domaines avec recouvrement comme la méthode alternée de Schwarz. Si on se réfère aux 

travaux de J. Zou et K.H. Hoffman [7], il apparaît que cette dernière méthode semble être très performante 

pour résoudre l’équation de Poisson classique. 

Les machines multiprocesseurs nécessitent dans leur utilisation traditionnelle des synchronisations entre les 

processeurs ainsi que la gestion de sections critiques ; ce qui complique considérablement la tâche du programmeur 

et entraîne des pertes de temps au niveau du calcul. Inversement, dès les années 1970, on a assisté à 

l’analyse du comportement théorique d’itérations asynchrones. Les travaux menés dans ce domaine sont nombreux 

et on peut citer le travail initial de D. Chazan et W. Miranker [3] pour la résolution de problèmes linéaires. 

0.1

Ces travaux on été étendus dans le cas de systèmes non-linéaires par F. Robert et all [17], [18], dans une situation 

où les processeurs communiquent entre eux de manière synchrone. Dans ces deux études, l’analyse de la convergence 

a été effectuée par des techniques de contraction en norme vectorielle. Dans un même temps J.C. Miellou 

a étudié des algorithmes chaotiques à retards ; l’analyse de ces méthodes est effectuée soit par des techniques 

de contraction en norme vectorielle [8], [10], soit par des techniques d’ordre partiel [9] ; dans ces travaux l’asynchronisme 

est modélisé par des retards bornés. Ces derniers travaux on été étendus par G.M. Baudet [1] dans le 

cadre des algorithmes asynchrones parallèles où les retards considérés peuvent être infinis, la convergence étant 

étudiée par des techniques de contraction. Citons également les travaux de D.P. Bertsekas et J. Tsitsiklis [2] où 

les itérés successifs appartiennent à des espaces emboîtés ce qui assure la convergence, ce dernier travail ayant 

été repris par M. Boulbrachêne, P. Cortey-Dumont et J.C. Miellou [14] en prenant en compte la propagation 

d’erreur d’arrondi. Dans un contexte différent M.N. El Tarazi a également établi un résultat de convergence des 

algorithmes asynchrones par des techniques de contraction selon une norme scalaire appropriée [4]. Les travaux 

de J.C. Miellou et P. Spitéri [12] et ceux de L. Giraud et P. Spitéri [5] fournissent des critères simples assurant 

la convergence en norme vectorielle des itérations asynchrones. En effet, si on considère un problème découpé 

par blocs de la forme : 

Au + φ(u) = b 

où A est une matrice et φ un opérateur diagonal croissant, à condition que le couplage entre les sous-systèmes 

soit raisonnable, on obtiendra la convergence en norme vectorielle si une des conditions suivantes est vérifiée : 

soit les blocs diagonaux sont définis positifs, soit ces mêmes blocs sont à diagonale dominante. 

Notons cependant que l’asynchronisme considéré au paragraphe précédent ne présente pas le maximum de 

flexibilité dans la mesure où les échanges inter-processeurs ont lieu lorsqu’un processeur a terminé une itération 

sur le bloc dont il a la charge. Dans un travail récent J.C. Miellou, D. El Baz et P. Spitéri [15] ont considéré 

des processus parallèles asynchrones où les communications sont plus flexibles ; ce type d’algorithme est bien 

formulé par l’introduction de relaxations approchées où un processeur peut utiliser des valeurs d’itérations 

partielles correspondant aux itérations en cours des autres processeurs. Ces méthodes sont envisageables lorsque 

l’opérateur à inverser est une M-fonction au sens de Rheinboldt [16] ; les techniques d’analyse de ces algorithmes 

utilisent le principe de maximum discret ce qui conduit à des itérés ordonnés de manière monotone croissante ou 

décroissante en fonction des propriétés de la valeur d’approximation initiale de la solution. Dans ce contexte le 

travail de J.C. Miellou [9] avec analyse en ordre partiel précédemment évoqué rentre dans ce cadre plus général. 

Pour la résolution d’équations aux dérivées partielles, on peut mixer les aspects communication synchrone 

et asynchrone avec les méthodes de sous-domaines. C’est dans ce cadre d’étude que se situe le présent travail 

où on considère plus particulièrement, compte tenu de l’article de J. Zou et K.H. Hoffman [7], le couplage 

entre la méthode alternée de Schwarz et les algorithmes synchrones et asynchrones. Indépendemment de 

la résolution d’équations aux dérivées partielles classiques intervenant en physique mathématique, nous nous 

sommes intéressés à l’implantation de ces algorithmes sur machines multiprocesseurs à mémoire distribuée au 

moyen des outils parallèles que fournissent P.V.M. ( Parallel Virtual Machine ) et M.P.I. ( Message Passing 

Interface ). 

Le présent mémoire se subdivise en 5 chapitres. Au chapitre 1, on rappelle la formulation classique des 

algorithmes synchrones et asynchrones ainsi que les conditions d’étude de la convergence de ces méthodes ; 

nous présentons l’adaptation de ces résultats au cas des méthodes de sous-domaines avec recouvrement et nous 

appliquons ces critères à des problèmes aux limites classiques. 

0.2

Le chapitre 2 expose les algorithmes parallèles asynchrones avec communication flexible et présente le lien avec 

les méthodes de sous-domaines. Ce chapitre se termine par l’application des critères de convergence pour l’étude 

de problèmes aux limites non linéaires, en particulier dans le cas de maillages éléments finis non structurés. 

Le chapitre 3 concerne l’implantation de ces méthodes sur le multiprocesseur I.B.M.-SP2 du C.N.U.S.C. 

( Centre National Universitaire Sud de Calcul de Montpellier ) à l’aide de P.V.M. et M.P.I. Nous proposons des 

schémas d’implantation des algorithmes considérés aux chapitres 1 et 2 en utilisant les routines de communication 

de P.V.M. et de M.P.I. 

Dans les deux chapitres suivants nous présentons l’analyse ainsi que les tests numériques pour la résolution de 

deux types de problèmes aux limites. Au chapitre 4, on étudie le cas du problème de convection-diffusion, soit 

linéaire, soit perturbé par une application diagonale non décroissante, ce qui dans ce dernier cas conduit à un 

problème non linéaire ; dans ces deux situations, le cadre formel envisagé aux chapitres 1 et 2 est applicable. De 

plus dans ce chapitre nous présentons le parti que l’on peut tirer de situations où le coefficient de diffusion est 

petit et où on utilise des discrétisations décentrées des termes de convection, ce qui conduit à des algorithmes 

performants à condition d’adopter un balayage convenable des points de discrétisation en accord avec la structure 

quasi-triangulaire de la matrice ; ce point est compatible sans restriction avec le cadre formel présenté aux 

chapitres 1 et 2. Le second problème traité au chapitre 5 est le problème de Navier-Stokes 2D. L’utilisation de la 

formulation fonction courant-tourbillon conduit à la résolution d’une équation de convection-diffusion couplée à 

une équation de Poisson. Dans ce contexte on traite l’équation de convection-diffusion par les méthodes étudiées 

au chapitre 4, l’équation de diffusion étant résolue de manière efficace par une variante de la méthode de Schwarz 

proposée par J.C. Miellou [11]. 

Le dernier chapitre concerne un problème d’électrophorèse en écoulement continu. Ce procédé utilisé pour 

analyser les mélanges de protéines biologiques conduit à la résolution de problèmes d’équations aux dérivées 

partielles couplées comportant l’équation de Navier-Stokes, régissant l’hydrodynamique, l’équation de transport 

de la concentration des espèces en présence et l’équation de potentiel généralisé du champ électrique. Dans ce 

chapitre nous vérifions que ces équations peuvent être discrétisées de manière à obtenir des systèmes rentrant 

dans le cadre de l’accrétivité et des M-fonctions présentées aux chapitres 1 et 2. Nous vérifions par une méthode 

séquentielle la faisabilité numérique des simulations et présentons divers résultats numériques. 

0.3

0.4

Rfrences. 

1. G.M. Baudet, Asynchronous iterative methods for multiprocessors, Journal of A.C.M., 25 (1978), pp. 226– 

244. 

2. D. P. Bertsekas and J. Tsitsiklis, Parallel and Distributed computation, Numerical Methods, Englewood 

cliffs : Prentice Hall, (1989) 

3. D. Chazan and W. Miranker, Chaotic relaxation, Linear Algebra Appl., 2 (1969), pp. 199–222. 

4. M.N. El Tarazi, Some convergence results for asynchronous algorithms, Numerisch Mathematik, 39 (1982), 

pp. 325–340. 

5. L. Giraud and P. Spitéri, Parallel resolution of non-linear boundary values problems, M.2 A.N., 25 (1991), 

pp. 579–606. 

6. A. Herscovici, Introduction aux grands ordinateurs scientifiques, Eyrolles (1986). 

7. K.H. Hoffman and J. Zou , Parallel efficiency of domain decomposition methods, Parallel Computing, 19 

(1993), pp. 1375–1391. 

8. J. C. Miellou, Itérations chaotiques à retards, C.R.A.S. Paris, 278 (1974), pp. 957–960. 

9. J. C. Miellou, Itérations chaotiques à retards, étude de la convergence dans le cas d’espaces partiellement 

ordonnés, C.R.A.S. Paris, 280 (1975), pp. 233–236. 

10. J. C. Miellou, Algorithmes de relaxation chaotiques à retard, RAIRO R1, (1975), pp. 55–82. 

11. J.C. Miellou , Variantes synchrones et asynchrones de la méthode alternée de Schwarz , Rapport de recherche 

E.R.A. de mathématiques n ◦ 070654, Université de Besançon, (1982). 

12. J. C. Miellou et P. Spitéri, Un critère de convergence pour des méthodes générales de point fixe, M.2 A.N., 

(1985), pp. 170–201. 

13. J. C. Miellou, Asynchronous iterations in order intervals, Parallel Algorithms, M. Cosnard et al. ed, Amsterdam 

: North-Holland, (1986), pp. 85–96. 

14. J. C. Miellou, Ph. Cortey-Dumont and M. Boulbrachêne, Perturbation of fixed-point iterative methods, 

Advances in Parallel computing 1, AI Press Inc., (1990), pp. 81–122. 

15. J.C. Miellou, D. El Baz and P. Spitéri, A new class of asynchronous iterative algorithms with order interval, 

IRIT/94-34-R report, LCS report 1994-16/LAAS 94324 report, (1994) à paraitre dans Mathematics of 

Computation. 

16. W. C. Rheinboldt, On M-functions and their application to nonlinear Gauss-Seidel iterations and to network 

flows, J. Math. Anal. and Appl., 32 (1970), pp. 274–307. 

17. F. Robert, M. Charnay et F. Musy, Itérations chaotiques série-parallèle pour des équations non-linéaires de 

point fixe, Aplikace Mathematik, 20 (1975), pp. 1–38. 

18. F. Robert, Convergence locale d’itération chaotique non-linéaire, C.R.A.S. série A, 284 (1977), pp. 679–682. 

19. P. Spitéri, Parallel asynchronous algorithms for solving boundary value problems , In Parallel algorithms, 

Eds M. Cosnard et al., North Holland, (1986) pp. 73–84. 

0.5

Chapitre 1 

Algorithmes parallèles asynchrones et 

synchrones classiques. 

Introduction. 

Dans ce chapitre nous nous intéressons à des algorithmes itératifs de relaxation synchrones et asynchrones 

pour résoudre de grands systèmes d’équations linéaires ou non-linéaires issus de discrétisation d’équations ou 

d’inéquations aux dérivées partielles. La modélisation de ces algorithmes asynchrones a été développée successivement 

par D. Chazan et Miranker [8] dans le cadre linéaire, J.C. Miellou [22], G. Baudet [2], D. Bertsekas [6] 

dans le cadre non-linéaire ; citons également les travaux de F. Robert ( [27],[28] ) dans le cas synchrone. La 

modélisation de ces algorithmes est effectuée en introduisant une stratégie de choix des composantes pour 

rendre compte du parallélisme ainsi qu’une notion de retards pour rendre compte de l’asynchronisme entre les 

processeurs. 

Dans le présent chapitre, la convergence des algorithmes est étudiée par des techniques de contraction ; la 

démarche générale peut se résumer comme suit : étant donné un système d’équations ou d’inéquations fonctionnelles 

non-linéaires, nous décomposons ce système en sous-systèmes. La convergence de ces algorithmes de 

relaxation est assurée soit par des propriétés de contraction en norme vectorielle ( voir [2], [22] ), soit par des 

propriétés de contraction pour une norme scalaire adaptée de l’application de point fixe associé au problème [12]. 

Ces propriétés de contraction sont obtenues dans le cas où les opérateurs régissant les sous-systèmes diagonaux 

possèdent des propriétés d’accrétivité forte et si les fonctions d’interactions entre les sous-problèmes vérifient 

des conditions de Lipschitz convenables. 

Dans le cas d’un problème discrétisé de la forme 

AX + φ(X) = b 

où A est une matrice et φ est un opérateur diagonal croissant, on obtient des critères d’application simples à 

vérifier si la matrice A a des coefficients diagonaux strictement positifs et est à diagonale dominante, ou encore 

si elle est définie positive ou si c’est une M-matrice ( [15], [30], [31] ). 

Ces méthodes sont applicables pour l’analyse de la convergence de la méthode alternée de Schwarz avec 

recouvrement. Il suffit de vérifier que si l’opérateur régissant le problème initial possède les propriétés précédentes 

1.1

alors l’opérateur obtenu en appliquant le procédé de Schwarz possède lui aussi des propriétés analogues. On 

retrouve ainsi dans ce cadre un résultat de D.J. Evans et W. Derer [13]. 

Dans le premier paragraphe de ce chapitre nous rappelons la modélisation des algorithmes de relaxation 

synchrones et asynchrones, puis dans le paragraphe suivant nous exposons la notion d’accrétivité qui permet 

d’analyser la convergence. Nous adaptons les critères de convergence précédents au cas de la méthode alternée 

de Schwarz et étudions quelques exemples. 

1.2

1 Rappel de la modélisation des algorithmes de relaxation synchrones et asynchrones – résultats 

de convergence. 

1.1 Définitions. Un résultat de convergence en norme vectorielle. 

Soit E un espace de Banach réflexif ( en pratique, dans les applications, E sera l’espace IR n . ) et β un entier 

naturel ; pour ℓ ∈ {1, . . . , β}, soit {Eℓ} une famille d’espaces de Banach réflexifs telle que : 

on note |.|ℓ la norme de Eℓ. 

E = 

β 

Eℓ; (1.1) 

ℓ=1 

Soit X un élément de E ; on considère la décomposition suivante de X compatible avec la décomposition de 

E : 

X = {x1, . . . , xℓ, . . . , xβ}, xℓ ∈ Eℓ, pour ℓ ∈ {1, . . . , β}. (1.2) 

Soit q la norme vectorielle canonique sur E définie comme suit : 

Soit F une application de D(F ) ⊂ E à valeurs dans D(F ), telle que : 

où ∅ dénote l’ensemble vide. 

q(X) = {|x1|1, . . . , |xℓ|ℓ, . . . , |xβ|β}. (1.3) 

D(F ) = ∅ (1.4) 

Compte tenu de la décomposition de E, on peut considérer la décomposition suivante pour F : 

et on considère le problème de point fixe : 

F (X) = {F1(X), . . . , Fℓ(X), . . . , Fβ(X)} (1.5) 

⎧ 

⎨ 

⎩ 

Déterminer X ∗ ∈ D(F ) tel que : 

X ∗ = F (X ∗ ) 

Remarque 1.1. La décomposition de E en espace produit fini d’espaces de Banach est nécessaire pour 

décrire le parallélisme, dans la mesure où l’utilisation de machines multiprocesseurs implique la décomposition 

des problèmes en sous-problèmes couplés. 

Afin de résoudre l’équation (1.6) par des algorithmes de relaxation parallèles synchrones ou asynchrones, nous 

rappelons les définitions et résultats suivants [22] : 

Dfinition 1.1. Une stratégie S est définie par une suite {s(p)} p∈IN telle que : 

(1.6) 

∀p ∈ IN, s(p) ⊂ {1, 2, . . . , β} et s(p) = ∅. (1.7) 

1.3

∀ℓ ∈ {1, . . . , β}, l’ensemble {p ∈ IN | ℓ ∈ s(p)} est infini. (1.8) 

Dfinition 1.2. une suite de retards R est définie par une suite {r(p)} p∈IN telle que : 

et ∀ℓ ∈ {1, . . . , β}, ∀p ∈ IN, l’application : 

est une fonction non décroissante de p qui vérifie : 

∀p ∈ IN r(p) = {r1(p), . . . , rℓ(p), . . . , rβ(p)} ∈ IN β , 

p −→ ρℓ(p) = p − rℓ(p) 

ρℓ(p) ≥ 0 et ρi(p) = p, ∀ i ∈ s(p) (1.9) 

lim 

p→∞ ρℓ(p) = +∞. (1.10) 

Compte tenu de définitions précédentes, les algorithmes parallèles de relaxation asynchrones peuvent 

être définis comme suit : 

où : 

Dfinition 1.3. Soit X 0 ∈ D(F ), on considère alors la suite {X p } d’éléments de E définie par induction : 

∀p ∈ IN, ∀ℓ ∈ {1, . . . , β}, x p+1 

ℓ 

= 

⎧ 

⎨ x 

⎩ 

p 

ℓ si ℓ ∈ s(p), 

Fℓ(W ) si ℓ ∈ s(p), 

W ∈ E et W = {. . . , x p−rk(p) 

k , . . .}. 

(1.11) 

Remarque 1.2. La notion de stratégie correspond aux numéros des composantes sur lesquelles on travaille 

et rend bien compte du parallélisme ; à l’itération p on traitera en parallèle les composantes dont les numéros 

appartiennent à s(p). Il convient toutefois de noter que l’hypothèse (1.8) signifie que l’on doit en théorie relaxer 

une infinité de fois chacune des composantes du bloc-vecteur. La notion de retards rend compte de l’asynchronisme 

avec lequel est traitée chacune des composantes du vecteur X ; lorsque les retards sont identiquement 

nuls, la formulation (1.11) correspond alors aux algorithmes de relaxation synchrones [27] ; si de plus pour tout 

p ∈ IN : 

- s(p) = {1, 2, . . . , β}, (1.11) modélise l’algorithme de Jacobi par blocs ; 

- s(p) = {p mod(β) + 1}, (1.11) modélise l’algorithme de Gauss-Seidel par blocs. 

On renvoie à [27] pour des choix de s(p) correspondant à la méthode des directions alternées et à la méthode 

de Southwell. 

On précise également que l’algorithme défini par (1.11) modélise une méthode de relaxation, où chaque 

composante xℓ est calculée à l’aide des valeurs d’interaction disponibles wk. 

1.4

On peut alors énoncer le résultat général de convergence suivant établi par J.C. Miellou [22] et G. Baudet 

[2] : 

Proposition 1.1. Sous les hypothèses (1.4) et : 

alors : 

⎧ 

⎪⎨ 

⎪⎩ 

F admet un point fixe X ∗ ∈ D(F ) (1.12) 

F est contractante en X ∗ pour la norme vectorielle q 

i.e. qu’il existe une matrice J de taille β × β, non négative, 

de rayon spectral ρ(J) < 1 telle que l’inégalité suivante soit vérifiée : 

q(F (X ∗ ) − F (W )) ≤ J q(X ∗ − W ), ∀W ∈ D(F ) 

- (1.11) définit X p quel que soit p et {X p } reste dans D(F) ; 

- {X p } converge fortement vers X ∗ point fixe de F . 

(1.13) 

Remarque 1.3. L’inégalité (1.13) correspond à une condition de Lipschitz vectorielle et la proposition 1.1 

est l’analogue vectoriel du théorème de point fixe adapté aux itérations parallèles asynchrones. 

Remarque 1.4. On envisage à présent l’introduction d’un paramètre de relaxation ω dans l’algorithme (1.11) ; 

on considère donc une application Fω, de domaine D(F ), définie par : 

Fω(X) = (1 − ω)X + ωF (X). 

On sait alors [22] que Fω admet X ∗ pour point fixe et que si de plus : 

ω ∈]0, 

alors Fω est contractante en norme vectorielle, la matrice de contraction étant : 

2 

[ (1.14) 

1 + ρ(J) 

Jω = |1 − ω|I + ωJ. (1.15) 

De plus, sous les hypothèses (1.4), (1.12) et (1.13), on a pour la suite {X p } l’estimation de la vitesse asymptotique 

de convergence ( [18], [22] ) : 

1.2 Un résultat de convergence en norme scalaire. 

lim 

p→∞ sup|Xp − X ∗ | 1 

p ≤ ρ(J). 

Soit ρ(J) le rayon spectral de la matrice J ; grâce au théorème de Perron-Frobenius on sait que : 

⎧ 

⎨ 

⎩ 

∀ν ∈ [ ρ(J), 1 [, il existe un vecteur Γ ν de IR β de composantes strictement positives tel que : 

J Γ ν ≤ ν Γ ν 

1.5 

(1.16)

Soit γ ν ℓ la ℓ ième -composante du vecteur Γ ν ; alors on peut définir la norme scalaire suivante sur E = 

( voir [22] ) : 

et on obtient alors le résultat suivant [22] : 

|xℓ|ℓ 

Xν,J = max 

ℓ∈{1,...,β} γν ℓ 

β 

ℓ=1 

Eℓ 

(1.17) 

Proposition 1.2. Soit F une application de D(F ) ⊂ E à valeurs dans D(F ), et vérifiant une propriété 

de contraction en norme vectorielle du type (1.13). Soit J une matrice de taille β × β non négative de rayon 

spectral ρ(J) strictement inférieur à 1, alors pour tout X ∗ , W ∈ D(F ), on a : 

F (X ∗ ) − F (W )ν,J ≤ ν X ∗ − W ν,J. (1.18) 

Remarque 1.5. Autrement dit si F est contractante pour la norme vectorielle q alors il existe une norme 

scalaire définie par (1.17) pour laquelle l’application F est contractante. 

On peut alors énoncer un résultat de convergence établi par M.N. El Tarazi [12] : 

Proposition 1.3. Sous les hypothèses (1.4), (1.12) et (1.18), la suite {X p } définie par (1.11) converge 

fortement vers X ∗ point fixe de F . 

2 Analyse de la convergence. 

2.1 Rappel de la notion d’accrétivité 

Pour analyser la convergence des algorithmes asynchrones et synchrones et donner ainsi des conditions suffisantes 

de convergence liées aux propriétés des opérateurs à inverser, nous rappelons la notion d’opérateur 

accrétif. 

2.1.1 Définitions. 

E étant un espace de Banach, soit E ∗ son dual topologique ; on note respectivement |.| et |.| ∗ les normes 

définies sur E et E ∗ et 〈 , 〉 la forme bilinéaire qui met en dualité E et E ∗ . 

Dfinition 1.4. On appelle opérateur de dualité G associé à E l’opérateur de E vers E ∗ défini par : 

∀X ∈ E, G(X) = {g ∈ E ∗ | |g| ∗ = |X|, 〈X, g〉 = |X| 2 }. 

Remarque 1.6. On montre que l’opérateur de dualité est le sous-différentiel de la demi norme au carré. 

Soit Λ un opérateur de D(Λ) à valeurs dans E. 

Dfinition 1.5. Λ est un opérateur fortement accrétif si : 

∀ (X, X ′ ) ∈ D(Λ) 2 , ∃ g ∈ G(X − X ′ ) et ∃ c ∈ IR + tels que : 

〈Λ(X) − Λ(X ′ ), g〉 ≥ c |X − X ′ | 2 . 

1.6

Remarque 1.7. Si c est nul l’opérateur Λ est un opérateur accrétif ; si de plus l’inégalité est stricte, l’opérateur 

Λ est strictement accrétif. 

Remarque 1.8. Cette notion d’accrétivité généralise au cas des espaces de Banach la notion d’opérateur 

monotone dans les espaces de Hilbert. En effet dans le cas où E est un espace de Hilbert, E étant identifié à 

son dual, alors on vérifie aisément que : 

g = X − X ′ si X = X ′ 

et les notions d’accrétivité et de monotonie coïncident [4]. 

2.1.2 Cas de IR n : caractérisation des matrices fortement accrétives. 

Soit m ∈ IN ; dans ce paragraphe on considère que E = IR m et on note A une matrice carrée de taille m × m 

de coefficients ( aℓk ) (ℓ,k)∈({1,...,m}) 2. 

La notion de matrices fortement accrétives joue un rôle important dans l’analyse de la convergence des algorithmes 

parallèles asynchrones et synchrones pour la résolution d’équations aux dérivées partielles discrétisées. 

Nous pouvons caractériser ces matrices dans IR m muni des normes classiques : 

Proposition 1.4. 

- Une condition nécessaire et suffisante pour que la matrice A soit fortement accrétive dans IR m muni de 

la norme euclidienne |.|2, est que A soit une matrice fortement définie positive, i.e. qu’il existe un réel 

positif n tel que : 

〈AX, X〉 ≥ n |X| 2 2, ∀ X ∈ IR m , (X = 0). 


la norme ℓ1, est qu’il existe un réel positif n tel que pour tout ℓ ∈ {1, . . . , m} : 

aℓℓ ≥ n, 

m 

aℓℓ − 

k = 1 

k = ℓ 

|akℓ| ≥ n (diagonale strictement dominante par colonne). 


la norme du max ℓ∞, est qu’il existe un réel positif n tel que pour tout ℓ ∈ {1, . . . , m} : 

aℓℓ ≥ n, 

m 

aℓℓ − 

k = 1 

k = ℓ 

|aℓk| ≥ n (diagonale strictement dominante par ligne). 

Dmonstration. Pour les démonstrations de ces résultats de caractérisation des matrices fortement accrétives 

nous renvoyons à [15] et [30]. 

Remarque 1.9. La caractérisation des matrices accrétives se déduit de la remarque 1.7 ; on montre [30] les 

résultats suivants : 

1.7

- Une condition nécessaire et suffisante pour que la matrice A soit accrétive dans IR m muni de la norme 

euclidienne est que A soit une matrice semi-définie positive. 

- Une condition nécessaire et suffisante pour que la matrice A soit accrétive dans IR m muni de la norme ℓ1, 

est que : 

* les coefficients diagonaux de la matrice A soient non négatifs ; 

* la matrice A soit à dominance diagonale en colonne, i.e. : 

aℓℓ ≥ 

m 

k = 1 

k = ℓ 

|akℓ|, ∀ ℓ ∈ {1, . . . , m} 

- Une condition nécessaire et suffisante pour que la matrice A soit accrétive dans IR m muni de la norme ℓ∞ 

est que : 

* les coefficients diagonaux de la matrice A soient non négatifs ; 

* la matrice A soit à dominance diagonale en ligne, i.e. : 

aℓℓ ≥ 

m 

k = 1 

k = ℓ 

|aℓk|, ∀ ℓ ∈ {1, . . . , m} 

Remarque 1.10. A étant une matrice définie positive on peut vérifier par un raisonnement de compacité 

très simple qu’il existe un nombre c, strictement positif, tel que 

< AX, X >≥ c|X| 2 2, ∀X 

où c correspond à la valeur minimale de J(Y ) =< AY, Y > avec |Y |2 = 1. 

2.1.3 Perturbation d’un opérateur accrétif par un opérateur diagonal. 

Dans de nombreuses applications, en particulier la résolution de problèmes aux limites non-linéaires, on 

considère la perturbation d’un opérateur accrétif par un opérateur diagonal croissant. On a alors les résultats 

suivants : 

Proposition 1.5. Soient Λ un opérateur accrétif de E, I l’identité de E et θ un réel positif 

alors l’opérateur Λ + θI est fortement accrétif. 

Dmonstration. En effet ∀ X ∈ E, ∃g ∈ G(X), 

〈ΛX + θX, g〉 = 〈ΛX, g〉 + θ〈X, g〉 ≥ θ|X| 2 donc : 〈ΛX + θX, g〉 ≥ θ|X| 2 

Dfinition 1.6. Soit Λ un opérateur de E. On dit que Λ est m-accrétif si : 

- Λ est accrétif, 

- ∀ θ ∈ IR + , ℑm(θΛ + I) = E. 

1.8

Remarque 1.11. Cette notion d’opérateur m-accrétif correspond à celle d’opérateur accrétif maximal, c’est 

à dire que si on prolonge l’opérateur on perd la notion d’accrétivité. Pour de plus amples détails sur ces notions 

et ces résultats, nous renvoyons à [4]. 

Proposition 1.6. Soit Λ un opérateur accrétif et Λ d un opérateur m-accrétif éventuellement multivoque, 

alors Λ + Λ d est m-accrétif. 

2.2 Caractérisation d’une classe d’opérateurs assurant la convergence des algorithmes asynchrones : les opérateurs 

H-accrétifs 

où 

On considère le problème suivant : 

Λ(X) + Λ d (X) ∋ 0 , X ∈ E (1.19) 

Λ : D(Λ) ⊂ E −→ E 

est une application univoque, et Λ d est une application diagonale éventuellement multivoque. 

Pour analyser la convergence des algorithmes de relaxation asynchrones et synchrones, on se place de nouveau 

dans le cadre de la décomposition de E présentée au paragraphe 1.1. 

Pour tout ℓ ∈ {1, . . . , β}, soit Dℓ ⊂ Eℓ. On pose alors : 

D(Λ) = 

et on décompose alors l’application Λ(X) de manière compatible avec la décomposition de E de la manière 

suivante : 

Λ(X) = {Λ1(X), . . . , Λℓ(X), . . . , Λβ(X)}. 

Pour tout W ∈ D(Λ), pour tout k, ℓ ∈ {1, 2, . . . , β}, soit Λ W ℓk l’application de Dk dans Eℓ définie par : 

β 

ℓ=1 

xk ∈ Dk −→ Λ W ℓk (xk) = Λℓ(w1, . . . , wk−1, xk, wk+1, . . . , wβ). 

Remarque 1.12. Si on s’intéresse à une décomposition par blocs de l’opérateur Λ, si k = ℓ l’application 

Λ W ℓℓ (xℓ) représente l’analogue du ℓ-ième bloc diagonal de l’opérateur Λ(X) et lorsque k = ℓ, l’application 

Λ W ℓk (xk) fait référence à l’interaction entre le ℓ-ième et le k-ième bloc. 

Pour tout ℓ ∈ {1, 2, . . . , β}, soit E ∗ ℓ , muni de la norme |.|∗ ℓ , le dual de Eℓ. Par application du théorème de 

Hahn-Banach on peut considérer la multi-application Gℓ définie comme suit : 

telle que 

où 〈 , 〉ℓ désigne le produit de dualité entre Eℓ et E ∗ ℓ . 

Dℓ 

∀ xℓ ∈ Eℓ −→ Gℓ(xℓ) ⊂ E ∗ ℓ 

∃ gℓ ∈ Gℓ(xℓ) , 〈xℓ, gℓ〉ℓ = | xℓ | 2 ℓ et | xℓ |ℓ = | gℓ | ∗ ℓ 

1.9

On considère l’hypothèse suivante : 

⎧ 

Il existe une Z-matrice N de coefficients nℓk, 

⎪⎨ 

⎪⎩ 

(nℓℓ > 0 et nℓk ≤ 0 si k = ℓ) de taille β × β, telle que : 

∀ ℓ ∈ {1, 2, . . . , β}, ∀ X, X ′ ∈ D(Λ), 

∃ gℓ ∈ Gℓ(xℓ − x ′ ℓ ) vérifiant : 

〈Λℓ(X) − Λℓ(X ′ ), gℓ〉ℓ ≥ 

β 

nℓk|xℓ − x ′ ℓ|ℓ.|xk − x ′ k|k 

Dfinition 1.7. L’hypothèse (1.20) étant vérifiée, on dira que la matrice N correspondante est : 

i une minorante Z-accrétive de Λ ; 

ii une minorante M-accrétive de Λ si la Z-matrice N est une M-matrice ; 

k=1 

. 

(1.20) 

Proposition 1.7. Moyennant des hypothèses de régularité du domaine de définition et de l’opérateur considéré, 

hypothèses toujours vérifiées dans les applications qui nous intéressent, la condition (1.20) est équivalente à l’ensemble 

des conditions : 

⎧ 

⎨ ∀ ℓ ∈ {1, 2, . . . , β}, ∀ W ∈ D(Λ), ∀ (xℓ, x 

⎩ 

′ ℓ) ∈ (Dℓ) 2 , ∃ gℓ ∈ Gℓ(xℓ − x ′ ℓ) tel que : 

〈ΛW ℓℓ (xℓ) − ΛW ℓℓ (x′ ℓ), gℓ〉ℓ ≥ nℓℓ|xℓ − x ′ ℓ| 2 (1.21) 

ℓ 

⎧ 

⎨ 

⎩ 

∀ W ∈ D(Λ), ∀ (ℓ, k) ∈ ({1, 2, . . . , β}) 2 , tels que k = ℓ, ∀ (xℓ, x ′ ℓ) ∈ (Dℓ) 2 

|Λ W ℓk (xk) − Λ W ℓk (x′ k)|ℓ ≤ −nℓk|xk − x ′ k|k 

(1.22) 

Remarque 1.13. Les conditions (1.21) et (1.22) traduisent respectivement une condition d’accrétivité forte 

pour le ℓ ième sous-problème diagonal et une condition de Lipschitz pour les termes de couplage entre les blocs ℓ 

et k. Les hypothèses de régularité mentionnées, du domaine de définition et de l’opérateur, sont respectivement 

des hypothèses de quasi-densité au sens de Kato [17] et d’hémi-continuité ( voir [24] et [30] ). 

Dfinition 1.8. La condition (1.20) étant vérifiée, si N est une minorante M-accrétive de l’opérateur Λ, on 

dira que Λ est H-accrétif. 

On précise ici les propriétés de l’opérateur Λ d dans le cas où Λ d est multivoque et se décompose de manière 

compatible avec la décomposition de E sous la forme : 

Λ d (X) = {Λ d 1(x1), . . . , Λ d ℓ (xℓ), . . . , Λ d β(xβ)} ⊂ E 

où Λ d ℓ est également une multi-application de D(Λd ℓ ) ⊂ Eℓ dans Eℓ, vérifiant l’hypothèse de m-accrétivité 

suivante : ⎧ ⎨ 

⎩ 

∀ (xℓ, x ′ ℓ) ∈ (D(Λ d ℓ ))2 , ∀ ηℓ ∈ Λ d ℓ (xℓ), ∀ η ′ ℓ ∈ Λ d ℓ (x′ ℓ) 

∃ gℓ ∈ Gℓ(xℓ − x ′ ℓ) tel que 〈ηℓ − η ′ ℓ, gℓ〉ℓ ≥ 0. 

2.3 Un résultat de contraction en norme vectorielle pour une décomposition en blocs du problème. 

On considère à présent le problème (1.19) où : 

(1.23) 

Λ est un opérateur H-accrétif. (1.24) 

1.10

Λ d est une multi-application diagonale m-accrétive. (1.25) 

On désire utiliser des méthodes parallèles de relaxation asynchrones pour résoudre le problème (1.19). 

Pour cela on considère une décomposition du problème (1.19) en β sous-problèmes ; on conserve les hypothèses 

précédentes et on les complète par les suivantes : 

∀ ℓ ∈ {1, 2, . . . , β}, Λℓ est défini sur Dℓ = 

⎧ 

⎪⎨ 

⎪⎩ 

ℓ−1 

k=1 

Ek × Dℓ × 

β 

k=ℓ+1 

L’application Iℓ étant l’identité dans Eℓ, on suppose que, 

∀ W ∈ E, ∀ ℓ ∈ {1, 2, . . . , β}, l’application : 

xℓ −→ Λ d ℓ (xℓ) + Λ W ℓℓ (xℓ) − nℓℓIℓ 

est m-accrétive. 

Soit W ∈ E, on considère alors les problèmes : 

⎧ 

⎨ 

⎩ 

∀ ℓ ∈ {1, 2, . . . , β}, Déterminer xℓ ∈ Eℓ tel que : 

0 ∈ Λ d ℓ (xℓ) + Λ W ℓℓ (xℓ). 

Grâce aux hypothèses (1.26), (1.27), les problèmes (1.28) ont tous une solution que l’on pose : 

X = {x1, x2, . . . , xβ} 

et on peut associer au problème (1.28) l’application de point fixe : 

de telle sorte que : 

xℓ = Fℓ(W ) 

X = {. . . , xℓ, . . .} = {. . . , Fℓ(W ), . . .} = F (W ) 

Soit D la matrice diagonale β × β de coefficients dℓ = nℓℓ. 

Ek 

(1.26) 

(1.27) 

(1.28) 

Soit L ( respectivement U ) la matrice strictement triangulaire inférieure ( respectivement triangulaire 

supérieure ) de coefficients : 

 

 

 

 

Lℓk = 

−nℓk si k < ℓ 

0 si k ≥ ℓ 

respectivement Uℓk = 

−nℓk si k > ℓ 

0 si k ≤ ℓ 

et J = D −1 (L + U). 

Proposition 1.8. Les hypothèses (1.26) et (1.27) étant vérifiées, F est bien définie sur E, de manière 

univoque, admet pour unique point fixe X ∗ , solution du problème (1.19) et de plus : 

avec : ρ(J) < 1. 

∀ W ∈ E, q(F (X ∗ ) − F (W )) ≤ J q(X ∗ − W ) (1.29) 

1.11

Dmonstration. voir [24] et [30] 

Corollaire 1.9. On considère les algorithmes de relaxation asynchrones appliqués à l’approximation du 

point fixe X∗ β 

de l’application F définie sur l’espace produit E = à valeurs dans ce même espace. 

Sous les hypothèses de la proposition 1.8, il y a convergence vers X ∗ des itérés obtenus par ces méthodes, à 

partir d’un élément quelconque X 0 ∈ E. 

2.4 Convergence des algorithmes asynchrones associés à la décomposition en sous-domaines du problème. 

On désire résoudre le problème (1.19) par les mêmes algorithmes parallèles asynchrones envisagés précédemment, 

mais pour un découpage du problème en grands blocs ou, de manière équivalente, en sous-domaines, les grands 

blocs étant constitués de blocs adjacents de la décomposition envisagée au paragraphe 2.3. 

Pour cela, on considère les hypothèses suivantes : 

⎧ 

Soit α un entier naturel tel que α ≤ β, soit {βi} pour i ∈ {1, . . . , α} 

⎪⎨ 

une famille d’entiers tels que : 

α 

βi = β 

⎪⎩ 

i=1 

et ∀ i ∈ {1, . . . , α}, βi = 0 

⎧ 

i−1 

⎪⎨ 

Soit pour tout i ∈ {1, . . . , α}, αi = βj, avec la convention : 

⎪⎩ 

On a l’égalité suivante : 

α1 = 0 et Ei = 

αi+1 

ℓ=αi+1 

Eℓ. 

E = 

α 

Ei 

i=1 

j=1 

k=1 

(1.30) 

(1.31) 

et pour tout W ∈ E, on effectue la décomposition suivante, compatible avec la nouvelle décomposition de E en 

produit fini d’espaces de Banach : 

W = { ˜w1, . . . , ˜wi, . . . , ˜wα} 

et soit ˜q(W ) la norme vectorielle canonique définie sur E : 

˜q(W ) = {| ˜w1|1, . . . , | ˜wi|i, . . . , | ˜wα|α} 

où pour i ∈ {1, . . . , α}, | . |i est la norme définie sur Ei. 

Λ étant l’application de D(Λ) ⊂ E à valeurs dans E, pour tout W ∈ D(Λ), on note : 

Λ(W ) = { Λ1(W ), . . . , Λi(W ), . . . , α 

Λα(W )} ∈ Ei 

et Λ W ij 

l’application définie par : 

˜xj ∈ D( Λ W ij ) = 

αi+1 

ℓ=αi+1 

1.12 

i=1 

Dℓ −→ Λ W ij (˜xj) ∈ Ei

où : 

où 

Λ W ij (˜xj) = Λi( ˜w1, . . . , ˜wj−1, ˜xj, ˜wj+1, . . . , ˜wα). 

De même pour Λ d (X), on envisage une nouvelle décomposition Λ d i 

˜wi ∈ 

αi+1 

ℓ=αi+1 

définie comme suit : 

D(Λ d ℓ ) −→ Λ d i ( ˜wi) (1.32) 

Λ d i ( ˜wi) = {Λ d αi+1(wαi+1), . . . , Λ d ℓ (wℓ), . . . , Λ d αi+1 (wαi+1)} 

Pour tout W ∈ E, on considère les problèmes : 

⎧ 

⎨ ∀ i ∈ {1, . . . , α}, déterminer ˜xi ∈ Ei tel que : 

⎩ 

Λ d i (˜xi) + Λ W ii (˜xi) ∋ 0. 

Si les problèmes (1.33) ont tous une solution, alors on pose : 

On considère également l’hypothèse (1.24). 

X = {. . . , ˜xi, . . .} = {. . . , Fi(W ), . . .} = F (W ) 

(1.33) 

On partitionne la minorante M-accrétive N de l’opérateur Λ en blocs {Nij} tels que pour tout i, j ∈ {1, . . . , α}, 

Nij ait pour coefficient nℓk pour k ∈ {αj + 1, . . . , αj + 1} et ℓ ∈ {αi + 1, . . . , αi+1}. 

Soit D la matrice diagonale par blocs, de blocs diagonaux Nii : 

Soit L et U les matrices strictement triangulaire inférieure et supérieure par blocs, définie par 

 

 

Lij = 

−Nij si i > j 

0 si i ≤ j 

Uij = 

−Nij si i < j 

0 si i ≥ j 

et on pose : 

J = D −1 ( L + U). 

La matrice D − ( L + U) étant un partitionnement régulier de la matrice N on sait que ρ( J) < 1 ( voir [25] ) 

et que de plus J étant non négative, J est bien une matrice de contraction pour la norme vectorielle q d’où le 

résultat : 

Proposition 1.10. Les conditions (1.26), (1.27) et (1.33) étant vérifiées, F est bien définie sur E de manière 

univoque, admet pour point fixe X ∗ solution du problème (1.19), et de plus, pour tout W ∈ E : 

avec : 

˜q (F (W ) − F (X ∗ )) ≤ J ˜q (W − X ∗ ) 

ρ( J) < 1. 

Corollaire 1.11. On considère les algorithmes de relaxation asynchrones appliqués à l’approximation du 

point fixe X∗ α 

de l’application F définie de l’espace produit E = Ei à valeurs dans ce même espace. Sous les 

1.13 

i=1

hypothèses de la proposition (1.10), il y a convergence vers X ∗ des itérés obtenues par ces méthodes, à partir 

d’un élément quelconque X 0 ∈ E. 

Remarque 1.14. Les résultats précédents signifient que si les algorithmes parallèles synchrones et asynchrones 

convergent pour une décomposition donnée alors ils convergent aussi pour toute décomposition plus grossière du 

problème. Pratiquement, si on peut vérifier qu’il y a convergence pour la décomposition par point du problème, 

alors il y a convergence pour toute décomposition en blocs. 

2.5 Critères d’application des algorithmes asynchrones et synchrones classiques dans le cas discret. 

Proposition 1.12. Soit A une H-matrice alors A est un opérateur H-accrétif. 

Dmonstration. A de coefficients ( aℓk ) (ℓ,k)∈({1,...,m}) 2 est une H-matrice et sa matrice de comparaison est 

une M-matrice. Cette matrice de comparaison a selon sa définition ( voir [1] ) pour termes diagonaux les |aℓℓ| et 

pour termes hors diagonaux les −|aℓk|. Hors la minorante N de A pour la décomposition par points du problème 

est exactement la matrice de comparaison de A. 

N est donc une M-matrice et A est donc un opérateur H-accrétif ( voir définition 1.8 ) 

Remarque 1.15. Si A est une M-matrice, elle est sa propre matrice de comparaison et donc sa propre 

minorante pour la décomposition par points du problème. A est dans ce cas un opérateur H-accrétif. 

Tout problème dont l’opérateur discrétisé est une H-matrice rentre dans le cadre de la H-accrétivité. Les 

algorithmes asynchrones et synchrones classiques appliqués à la résolution de ce problème convergent. 

Soit Λ un opérateur de IR m de la forme : 

Λ(X) = AX + φ(X). 

avec A matrice H-accrétif et φ opérateur diagonal croissant. 

Proposition 1.13. L’opérateur Λ ainsi défini est un opérateur H-accrétif et la convergence des algorithmes 

asynchrones et synchrones classiques est assurée. 

Remarque 1.16. Dans la suite pour rentrer dans le cadre de la H-accrétivité, nous montrerons que les 

problèmes que nous considérons sont gouvernés par un opérateur Λ qui s’écrit sous cette forme en montrant que 

la matrice de discrétisation est soit une H-matrice soit une M-matrice. 

3 Application à la méthode alternée de Schwarz. 

3.1 Rappels sur la méthode alternée de Schwarz. 

La méthode alternée de Schwarz est une méthode de décomposition de domaine avec recouvrement qui est 

bien adaptée au parallélisme [16]. 

Pour présenter cette méthode, on considère un domaine Ω ⊂ IR 2 découpé en N sous-domaines (Ωi) i∈{1,...,N} 

1.14

avec recouvrement et on définit les notations suivantes : 

Ω = N i=1 Ωi, 

 

Ωi+1 = ∅, 

Ωi 

γ1 

i = ∂Ωi Ωi−1, i ∈ {2, . . . , N}, 

γ2 

i = ∂Ωi Ωi+1, i ∈ {1, . . . , N − 1}, 

 

Γi = ∂Ωi ∂Ω 

où ∂Ω est la frontière du domaine Ω, ∂Ωi est la frontière de Ωi, γ 1 i ( resp. γ2 i 

droite ) du sous-domaine Ωi, Γi est la restriction de ∂Ω à Ωi. 

✟ 

✟ 

✟✟✟✟✟✟✟✟✟✟✟✟ 

✟ 

✟ 

✟ 

✟✟✟✟✟✟✟✟✟✟✟✟ 

✟✟✟✟✟✟✟✟✟✟✟✟ 

✟ ✟ ✟✟✟✟✟✟✟✟ 

✟ ✟✟ 

✟ ✟✟✟✟✟✟✟✟✟✟✟ 

✟ ✟✟✟✟✟ 

Ω1 Ω2 Ω3 

γ 1 2 γ 2 1 γ 1 3 γ 2 2 

Figure 1.1 : Exemple de décomposition du domaine Ω par trois sous-domaines. 

) est la frontière gauche ( resp. 

Considérons une équation aux dérivées partielles linéaire ou non-linéaire définie sur Ω, avec des conditions 

aux limites de type Dirichlet ; nous avons le problème suivant : 

⎧ 

⎪⎨ 

⎪⎩ 

Déterminer u tel que : 

Λ(u) = f dans Ω 

u /∂Ω = g 

(1.34) 

où Λ est un opérateur linéaire ou non-linéaire ; u,f et g sont des fonctions appartenant aux espaces fonctionnels 

convenablement choisis pour que le problème (1.34) ait une solution. 

La méthode alternée de Schwarz consiste à associer au problème (1.34) le système d’équations aux dérivées 

partielles pour i ∈ {1, . . . , N} : 

1.15

⎧ 

⎪⎨ 

⎪⎩ 

Λ(ui) = fi dans Ωi 

ui /Γi = gi 

ui /γ 1 i 

ui /γ 2 i 

= ui−1 /γ 1 i 

= ui+1 /γ 2 i 

pour 2 ≤ i ≤ N 

pour 1 ≤ i ≤ N − 1 

(1.35) 

La solution de ce système peut donc être obtenue de façon itérative de la manière suivante : soit u0 i donnés 

est calculé par la résolution du système : 

pour i ∈ {1, . . . , N} alors pour chaque q ≥ 0, u q 

i 

⎧ 

⎪⎨ 

⎪⎩ 

Λ(u q 

i ) = fi dans Ωi 

u q 

i = gi 

/Γi 

u q 

i /γ1 i 

u q 

i /γ2 i 

= u q 

i−1 /γ 1 i 

= u q−1 

i+1 /γ 2 i 


pour 1 ≤ i ≤ N − 1 

3.2 Méthode alternée de Schwarz et algorithmes parallèles asynchrones et synchrones. 

(1.36) 

Pour étudier la convergence de la méthode alternée de Schwarz parallélisée avec des algorithmes asynchrones 

appliquée à la résolution du problème considéré, on examine les propriétés des opérateurs intervenant dans le 

système augmenté associé au procédé de Schwarz ; pour un tel système on considère la décomposition la plus 

fine, c’est à dire la décomposition par points. Ainsi dans le cas linéaire si la matrice de discrétisation du problème 

est une M-matrice, nous nous retrouvons dans le cadre du paragraphe 2.3. 

Dans un premier temps nous vérifions que l’application de la méthode alternée de Schwarz à un problème 

linéaire constitué à l’aide d’une M-matrice conduit à un système augmenté linéaire constitué également à l’aide 

d’une M-matrice [13]. 

Proposition 1.14. Soit une A une H-matrice et A la matrice déduite de A par procédé de Schwarz. A est 

une H-matrice. 

Dmonstration. Nous considérons une discrétisation du domaine Ω en n lignes et m colonnes. 

La matrice de discrétisation A obtenue par le schéma classique de discrétisation à cinq points et par exemple 

un balayage des points colonne par colonne est une matrice diagonale par blocs, chaque bloc étant de type 

n × n : 

⎛ 

⎜ 

A = ⎜ 

⎝ 

A1 B1 0 . . . . . . . . . . . . . . . 0 

C2 

. 

A2 

. .. 

B2 

. .. 

0 

. .. 

. . . 

. .. 

. . . 

. .. 

. . . 

. .. 

. . . 

. .. 

0 

. 

0 . . . Cj−1 Aj−1 Bj−1 0 . . . . . . 0 

0 . . . 0 Cj Aj Bj 0 . . . 0 

0 

. 

. . . 

. .. 

. . . 

. .. 

0 

. .. 

Cj+1 

. .. 

Aj+1 

. .. 

Bj+1 

. .. 

. . . 

. .. 

0 

. 

0 . . . . . . . . . . . . 0 Cm−1 Am−1 Bm−1 

0 . . . . . . . . . . . . . . . 0 Cm Am 

1.16 

⎞ 

⎟ 

⎠

La matrice A peut s’écrire sous la forme 

⎛ 

A1 

⎜ 0 

⎜ . 

⎜ 

A = ⎜ 0 

⎜ . 

⎜ 

⎝ 0 

0 

A2 

 

. .. 

. . . 

. .. 

. . . 

. . . 

0 

. .. 

0 

. .. 

. . . 

. . . 

. . . 

. .. 

Ai 

 

. .. 

. . . 

. . . 

. . . 

. .. 

0 

. .. 

0 

. . . 

. . . 

. .. 

. . . 

. .. 

AN−1 

 

0 

0 

. 

0 

. 

0 

⎞ 

⎟ 

⎠ 

0 . . . . . . . . . . . . 0 AN 

 

avec Ai matrice de discrétisation du problème 1.35 sur Ωi. Supposons que Ωi soit constitué des colonnes m1 à 

m2 de Ω ( c’est à dire que les colonnes m1 − 1 et m2 + 1 sont les frontières de Ωi). Alors pour i ∈ {2, . . . , N − 1} 

Ai s’écrit de la manière suivante : 

⎛ 

I 

⎜ Cm1 ⎜ 

. 

⎜ 0 

Ai 

⎜ 

= ⎜ 0 

⎜ 0 

⎜ . 

⎜ 

⎝ 0 

0 

Am1 

. .. 

. . . 

. . . 

. . . 

. .. 

. . . 

0 

Bm1 

. .. 

Cj−1 

0 

. . . 

. .. 

. . . 

. . . 

0 

. .. 

Aj−1 

Cj 

0 

. .. 

. . . 

. . . 

. . . 

. .. 

Bj−1 

Aj 

Cj+1 

. .. 

. . . 

. . . 

. . . 

. .. 

0 

Bj 

Aj+1 

. .. 

0 

. . . 

. . . 

. .. 

. . . 

0 

Bj+1 

. .. 

Cm2 

. . . 

. . . 

. .. 

. . . 

. . . 

. . . 

. .. 

Am2 

0 

0 

. 

0 

0 

0 

. 

Bm2 

⎞ 

⎟ 

⎠ 

0 . . . . . . . . . . . . . . . 0 0 I 

Dans le cas de la matrice A1 ( respectivement AN ) la présence du premier bloc I ( respectivement dernier bloc 

I ) dépend des conditions aux limites considérées. 

L’obtention de la matrice A à partir de la matrice A peut s’effectuer selon la suite d’étapes suivantes : 

i. dans un premier temps on duplique les lignes correspondant aux points du domaine de recouvrement 

(éléments frontières inclus) ; la matrice A (1) ainsi obtenue a pour matrice de comparaison une matrice 

M(A (1) ) qui est toujours une M-matrice ; A (1) est une H-matrice. 

ii. dans un second temps on met à zéro les éléments hors diagonaux des lignes correspondant aux points 

situés sur les frontières de recouvrement. La matrice résultante A (2) est toujours une H-matrice. En effet 

sa matrice de comparaison est obtenue à partir de M(A (1) ) en mettant à zéro les mêmes éléments hors 

diagonaux et reste une M-matrice en appliquant le théorème (3.12) de [32] ( page 85 ). 

iii. enfin on normalise ces mêmes lignes ce qui revient à mettre les éléments diagonaux à l’unité. 

Donc A est bien une H-matrice. 

Remarque 1.17. La démonstration est similaire lorsque l’on utilise une numérotation différente des colonnes. 

Proposition 1.15. Soit A une H-matrice et φ opérateur diagonal croissant ; on considère la résolution du 

problème : 

Λ(u) = 0 

1.17

avec Λ(u) = Au + φ(u) − b, b ∈ IR η . 

Soit A, φ, b et u les prolongements de A, φ, b et u par le procédé de Schwarz alors l’opérateur 

est un opérateur H-accrétif. 

Λ(u) = Au + φ(u) − b 

Dmonstration. Dans ce système la matrice A est une H-matrice et φ reste un opérateur diagonal croissant 

et nous pouvons appliquer les résultats de la proposition 1.10 et du corollaire 1.11. 

3.3 Exemples de problèmes d’utilisation de la méthode alternée de Schwarz et des algorithmes parallèles asynchrones 

et synchrones. 

Les exemples d’application sont nombreux. Nous en présentons quelques uns en commençant par le problème 

classique de Poisson : 

Exemple 1.1. Nous voulons résoudre le problème de Poisson avec conditions aux limites de Dirichlet homogènes 

que nous écrivons sous la forme : 

⎧ 

⎪⎨ 

⎪⎩ 


−∆u = f dans Ω 

u /∂Ω = 0 

On discrétise le domaine Ω par un maillage comportant n lignes horizontales et m colonnes verticales. 

(1.37) 

Nous considérons tout d’abord une numérotation lexicographique des points du maillage et un balayage des 

points colonne par colonne. La matrice de discrétisation A de taille (m.n × m.n) obtenue après discrétisation 

classique par le schéma à cinq points a la forme suivante : 

⎛ 

A 

⎜ −I 

⎜ . 

⎜ 

. 

⎜ 0 

⎜ 

A = ⎜ 0 

⎜ 0 

⎜ . 

⎜ 

⎝ 0 

−I 

A 

. .. 

. . . 

. . . 

. . . 

. .. 

. . . 

0 

−I 

. .. 

−I 

0 

. . . 

. .. 

. . . 

. . . 

0 

. .. 

A 

−I 

0 

. .. 

. . . 

. . . 

. . . 

. .. 

−I 

A 

−I 

. .. 

. . . 

. . . 

. . . 

. .. 

0 

−I 

A 

. .. 

0 

. . . 

. . . 

. .. 

. . . 

0 

−I 

. .. 

−I 

. . . 

. . . 

. .. 

. . . 

. . . 

. . . 

. .. 

A 

0 

0 

. 

0 

0 

0 

. 

−I 

⎞ 

⎟ 

⎠ 

0 . . . . . . . . . . . . . . . 0 −I A 

1.18

où A est une sous-matrice bloc tri-diagonale de taille n × n. 

⎛ 

4 

⎜ −1 

⎜ 

. 

⎜ 0 

⎜ 

A = ⎜ 0 

⎜ 0 

⎜ . 

⎜ 

⎝ 0 

−1 

4 

. .. 

. . . 

. . . 

. . . 

. .. 

. . . 

0 

−1 

. .. 

−1 

0 

. . . 

. .. 

. . . 

. . . 

0 

. .. 

4 

−1 

0 

. .. 

. . . 

. . . 

. . . 

. .. 

−1 

4 

−1 

. .. 

. . . 

. . . 

. . . 

. .. 

0 

−1 

4 

. .. 

0 

. . . 

. . . 

. .. 

. . . 

0 

−1 

. .. 

−1 

. . . 

. . . 

. .. 

. . . 

. . . 

. . . 

. .. 

4 

⎞ 

0 

⎟ 

0 ⎟ 

. ⎟ 

0 ⎟ 

0 ⎟ 

0 ⎟ 

. ⎟ 

−1 ⎠ 

0 . . . . . . . . . . . . . . . 0 −1 4 

Classiquement la matrice A est une M-matrice. 

Nous allons maintenant montrer qu’en utilisant la méthode alternée de Schwarz, nous sommes dans le cadre 

théorique présenté dans ce chapitre. En effet la décomposition du problème (1.37) par la méthode alternée de 

Schwarz aboutit à la résolution de N problèmes de la forme : 

⎧ 

⎪⎨ 

⎪⎩ 

Déterminer ui tel que : 

−∆ui = fi dans Ωi 

ui /Γi = 0 

ui /γ 1 i 

ui /γ 2 i 

= ui−1 /γ 1 i 

= ui+1 /γ 2 i 


pour 1 ≤ i ≤ N − 1 

On suppose que chaque domaine Ωi comporte mi lignes verticales et n lignes horizontales. 

(1.38) 

On considère maintenant la matrice de discrétisation A obtenue à partir de A par le procédé de Schwarz 

N 

N 

alterné. Cette matrice a une taille ( mi.n × mi.n) et a la forme suivante : 

i=1 

i=1 

⎛ 

A1 

⎜ 0 

⎜ . 

⎜ 

A = ⎜ 0 

⎜ . 

⎜ 

⎝ 0 

0 

A2 

. .. 

. . . 

. .. 

. . . 

. . . 

0 

. .. 

0 

. .. 

. . . 

. . . 

. . . 

. .. 

Ai 

. .. 

. . . 

. . . 

. . . 

. .. 

0 

. .. 

0 

. . . 

. . . 

. .. 

. . . 

. .. 

AN−1 

0 

0 

. 

0 

. 

0 

⎞ 

⎟ 

⎠ 

0 . . . . . . . . . . . . 0 AN 

1.19

avec pour i ∈ {2, . . . , N − 1} Ai matrice de discrétisation du problème i du système (1.38). 

⎛ 

I 

⎜ −I 

⎜ 

. 

⎜ 0 

⎜ 

Ai = ⎜ 0 

⎜ 0 

⎜ . 

⎜ 

⎝ 0 

0 

A 

. .. 

. . . 

. . . 

. . . 

. .. 

. . . 

. . . 

−I 

. .. 

−I 

0 

. . . 

. .. 

. . . 

. . . 

0 

. .. 

A 

−I 

0 

. .. 

. . . 

. . . 

. . . 

. .. 

−I 

A 

−I 

. .. 

. . . 

. . . 

. . . 

. .. 

0 

−I 

A 

. .. 

0 

. . . 

. . . 

. .. 

. . . 

0 

−I 

. .. 

−I 

. . . 

. . . 

. .. 

. . . 

. . . 

. . . 

. .. 

A 

0 

0 

. 

0 

0 

0 

. 

−I 

⎞ 

⎟ 

⎠ 

0 . . . . . . . . . . . . . . . . . . 0 I 

Cette matrice est de taille ( mi.n × mi.n). La matrice A1 ( respectivement AN ) ne présente pas de bloc I pour 

la première colonne du maillage du sous-domaine Ω1 ( respectivement pour la dernière colonne du maillage du 

sous-domaine ΩN ) en raison des conditions de Dirichlet homogènes considérées ici. 

Compte tenu du résultat de la proposition 1.14, la matrice A est une M-matrice et par conséquent la matrice 

de Jacobi associée J est une matrice de contraction. La méthode alternée de Schwarz asynchrone appliquée à 

la résolution du problème (1.37) converge. 

Remarque 1.18. Nous obtenons les mêmes résultats si nous considérons une numérotation rouge-noir des 

colonnes du maillage. 

Exemple 1.2. soit le problème suivant sur le domaine Ω, carré ]0, 1[×]0, 1[ : 

⎧ 


⎪⎨ 

⎪⎩ 

−∆u + a ∂u ∂u 

∂x + b ∂y = f dans Ω 

u |Γ = 0 

(1.39) 

On discrétise le Laplacien par une méthode classique de différences finies à cinq points et les dérivées premières 

par une méthode de différences finies centrées ; on obtient une matrice de discrétisation A qui est une matrice 

par blocs dont chaque bloc diagonal est tri-diagonal. Si on désigne par h le pas de discrétisation alors la matrice 

A est une M-matrice si (a, b) ∈ [− 2 

h 

, 2 

h 

] × [− 2 

h 

2 , h ], ce qui correspond au cas où la matrice est à diagonale 

dominante et à termes hors diagonaux négatifs ou nuls. Nous pouvons donc appliquer les résultats théoriques 

précédents d’où la convergence de la méthode alternée de Schwarz avec parallélisée de façon asynchrone. 

Exemple 1.3. Un problème de diffusion fortement non-linéaire. 

On considère le problème suivant : ⎧⎪ ⎨ 

⎪⎩ 

Déterminer u solution de 

−∆u + e au = f dans Ω 

u = 0 sur Γ 

(1.40) 

avec a ∈ IR + et f ∈ L 2 (Ω). En discrétisant le Laplacien par un schéma classique à cinq points et en prenant une 

numérotation lexicographique des points du maillage ou une numérotation rouge-noir par blocs, nous obtenons 

une matrice de discrétisation A qui est une M-matrice ( voir exemple 1.1 ). Comme a est un réel positif, 

l’opérateur Λ d (X) = diag(e axi ) est un opérateur diagonal croissant donc accrétif. Les résultats du paragraphe 

(2.1.3) sont applicables ainsi que ceux sur l’utilisation de la méthode alternée de Schwarz asynchrone. 

1.20

Exemple 1.4. Soit le problème : 

avec θ > 0. 

⎧ 

⎪⎨ 

⎪⎩ 


−∆u + θu = f sur ]0, 1[×]0, 1[ 

u = 0 sur Γ 

(1.41) 

On considère la résolution de ce problème en utilisant la méthode des éléments finis : le domaine Ω est découpé 

par des triangles rectangles isocèles de coté h. 

W 

P 

N 

O 

S 

h 

Figure 1.2 : Exemple de Triangulation de Ω. 

On obtient alors un schéma de discrétisation pour tout point O à l’intérieur de Ω : 

avec α = −1 + θh2 

12 

αX(N) + αX(E) + γX(P ) + βU(O) + γX(Q) + αX(W ) + αX(S) = h 2 f(O). 

θh2 

θh2 

, γ = 12 , β = 4 + 2 . 

La matrice de discrétisation est une H-matrice ; en effet sa matrice de comparaison est une matrice irréductible 

à diagonale dominante donc une M-matrice. Nous sommes dans le cadre de la H-accrétivité ; les algorithmes 

parallèles asynchrones et synchrones classiques s’appliquent à ce problème discrétisé par la méthode des éléments 

finis. 

Notons que contrairement aux autres exemples la matrice de discrétisation de ce problème n’est pas une 

M-matrice car il existe des termes hors diagonaux qui sont positifs ( γ > 0 ). 

1.21 

Q 

E

1.22

Rfrences du chapitre 1. 

1. O. Axelsson, Iterative solution methods, Cambridge University Press (1996). 


244. 

3. P. Benilan, Équations d’évolution dans un espace de Banach quelconque et applications, Thèse de Doctorat 

ès Sciences, Orsay (1972). 

4. P. Benilan, Semi-groupes non-linéaires, Cours DEA, institut de Mathématiques de l’Université de Besançon 

(1975). 

5. S. Benjelloun, P. Spitéri and G. Authié, Parallel algorithms for solving the obstacle problem, Computational 

Mechanics Publ., Springer-Verlag, 2 (1989), pp. 275–281. 

6. D.P. Bertsekas and J. Tsitsiklis, Parallel and Distributed computation, Numerical Methods, Englewood cliffs : 

Prentice Hall, (1989). 

7. M. Charnay, Itérations chaotiques sur un produit d’espaces métriques, Thèse de 3 e cycle, Lyon (1975). 


9. P. Comte, Itérations chaotiques à retards. Étude de la convergence dans le cas d’un espace produit d’espaces 

vectoriellement normés, C.R.A.S. série A, 281 (1975), pp. 863–866. 

10. P. Comte, J.C. Miellou et P. Spitéri, La notion H-accrétivité, Applications, C.R.A.S. série A, 283 (1976), 

pp. 655–658. 

11. J.D.P. Donnelly, Periodic chaotic relaxation, Linear Algebra Appl., 4 (1971), pp. 117–128. 


pp. 325–340. 

13. D.J. Evans and W. Deren, An asynchronous parallel algorithm for solving a class of nonlinear simultaneous 

equation, Parallel Computing, 17 (1991), pp. 165–180. 

14. D. Feingold and R.S. Varga, Block diagonally dominant matrices and generalization of the Gershgorin circle 

theorem, PAC. J. of Math., 12 (1962), pp. 1241–1250. 

15. L. Giraud et P. Spitéri, Résolution parallèle de problèmes aux limites non-linéaires, M.2 A.N., 25 (1991), 

pp. 73-100. 

16. K.H. Hoffman and J. Zou, Parallel efficiency of domain decomposition methods, Parallel Computing, 19 

(1993), pp. 1375–1391. 

17. I. Kato, Demi-continuity, hemi-continuity and monotonicity, Bull. Amer. Math. Soc., 70 (1964), pp. 548–550. 

18. N.X. Luong, Sur la méthode de sur-relaxation dans le cas des problèmes avec contrainte et un résultat de 

convergence asymptotique, RAIRO, n o R–2, (1973), pp. 107–113. 

19. J.C. Miellou, Opérateurs para-monotones, Thèse de Doctorat ès Sciences, Grenoble (1970). 

20. J.C. Miellou, Méthode de Jacobi, Gauss-Seidel, sur-(sous-) relaxation par blocs appliquée à une classe de 

problèmes non-linéaires, C.R.A.S. série A, 273 (1971), pp. 1257–1260. 

21. J.C. Miellou, Sur une variante de la méthode de relaxation appliquée à des problèmes comportant un opérateur 

somme d’un opérateur différentiable et d’un opérateur monotone maximal diagonal, C.R.A.S. série A, 275 

(1972), pp. 1107–1110. 

22. J.C. Miellou, Algorithmes de relaxation chaotiques à retard, RAIRO R1, (1975), pp. 55–82. 

23. J.C. Miellou, A mixte relaxation algorithm applied to quasi variatonal inequations, Colloque IFIP optimisation, 

Nice, Math. Lect. Notes, Springer Verlag (1975). 

1.23

24. J.C. Miellou and P. Spitéri, Un critère de convergence pour des méthodes générales de point fixe, M.2 A.N., 

(1985), pp. 170–201. 

25. J.M. Ortega and W.C. Rheinboldt, Iterative solution of nonlinear equations in several variables, New York : 

Academic Press, (1970). 

26. F. Robert, Étude et utilisation de normes vectorielles en analyse numérique linéaire, Thèse de Doctorat ès 

Sciences, Grenoble (1968). 

27. F. Robert, M. Charnay et F. Musy, Itérations chaotiques série-parallèle pour des équations non-linéaires de 

point fixe, Aplikace Mathematik, 20 (1975), pp. 1–38. 

28. F. Robert, Convergence locale d’itération chaotique non-linéaire, C.R.A.S. série A, 284 (1977), pp. 679–682. 

29. P. Spitéri, Simulation d’exécutions parallèles pour la résolution d’inéquations variationnelles stationnaires, 

Revue E.D.F., série C, n ◦ 1 (1983), pp. 149–159. 

30. P. Spitéri, Contribution à l’étude de grands systèmes non-linéaires, comportement d’algorithmes itératifs, 

stabilité de systèmes continus, Thèse de Doctorat ès Sciences, Besançon (1984). 

31. P. Spitéri, Parallel asynchronous algorithms for solving boundary value problems, In Parallel algorithms, Eds 

M. Cosnard et al., North Holland, (1986), pp. 73–84. 

32. R.S. Varga, Matrix iterative analysis, Prentice Hall (1962). 

1.24

Chapitre 2 

Algorithmes itératifs asynchrones avec 

communication flexible. 

Introduction. 

Les algorithmes itératifs asynchrones avec communication flexible étudiés dans ce chapitre s’appliquent aux 

mêmes types de problèmes que ceux évoqués dans le chapitre 1, c’est à dire des grands systèmes d’équations 

linéaires ou non-linéaires. Ces algorithmes modélisés par J.C. Miellou, D. El Baz et P. Spitéri ( [13], [16] ) se 

caractérisent par des retards différents, non plus globaux au niveau des blocs de composantes mais au niveau 

des composantes d’un même bloc. Cela se traduit par une prise en compte de relaxations incomplètes sur les 

composantes qui permet de considérer une flexibilité dans les communications entre les processeurs qui résolvent 

le problème. 

L’utilisation d’une classe particulière d’application, les Λ-sur-applications, permet de modéliser ces algorithmes. 

L’étude de la convergence repose, via le principe du maximum discret, sur des techniques d’ordre 

partiel et sur l’initialisation des algorithmes par une sur-solution. On montre que les algorithmes sont applicables 

aux problèmes dont l’opérateur s’écrit sous la forme Λ(X) = AX − f + φ(X), A étant une M-matrice et 

φ(X) un opérateur diagonal non décroissant. 

De plus les algorithmes itératifs asynchrones avec communication flexible sont applicables à la méthode 

alternée de Schwarz lorsque l’opérateur vérifie les hypothèses mentionnées précédemment. 

Signalons que de nombreux travaux d’analyse de la convergence d’algorithmes parallèles asynchrones ont 

été réalisés, via des techniques d’ordre partiel par J.C. Miellou [12], N.M. El Tarazi [5] et C. Jacquemart [9] ; 

toutefois ces travaux n’étaient pas relatifs à des algorithmes où les communications entre les processeurs avaient 

la flexibilité envisagée dans le présent chapitre. 

Le premier paragraphe de ce chapitre consiste en un rappel sur les notions de M-fonction et de coercivité pour 

l’ordre. Les notions de Λ-sur-applications et les algorithmes itératifs asynchrones avec communication flexible 

sont exposés dans le deuxième paragraphe. Enfin nous proposons l’application des critères théoriques précédents 

à l’étude d’équations aux dérivées partielles non linéaires et par ailleurs nous montrons que ces derniers critères 

sont encore vérifiés dans le cas de maillage éléments finis non structurés. 

2.1

1 Position du problème - rappels sur les notions de M-fonction et de coercivité pour l’ordre. 

Soit Λ une M-fonction surjective de IR n dans IR n ( voir [14] et [15] ) qui présente les propriétés de horsdiagonale 

décroissance et d’inverse monotonie. 

Remarque 2.1. Nous rappelons que 

- Λ est hors-diagonale décroissante si pour tout X ∈ IR dim(Λ) les fonctions : 

 

Λℓi : {t ∈ IR|X + tei ∈ IR dim(Λ) } −→ IR, 

Λℓi(t) = Λℓ(X + tei), ℓ = i, (ℓ, i) ∈ {1, 2, . . . , dim(Λ)} 2 

sont monotones décroissantes où ei ∈ IR dim(Λ) , i ∈ {1, 2, . . . , dim(Λ)} sont les vecteurs de la base canonique. 

- Λ est inverse monotone implique que si Λ(X) ≤ Λ(X ′ ), pour tout (X, X ′ ) ∈ IR dim(Λ) × IR dim(Λ) , alors 

X ≤ X ′ , où l’inégalité peut être comprise composante à composante. 

La surjectivité des M-fonctions peut être caractérisée grâce à la notion de coercivité pour l’ordre [15]. 

Dfinition 2.1. L’application Λ : IR dim(Λ) → IR dim(Λ) est coercive pour l’ordre si pour toute suite {Xp } p∈IN 

avec Xp ∈ IR dim(Λ) , pour tout p telle que Xp ≤ Xp+1 (resp. Xp ≥ Xp+1 ), lim 

p→∞ Xp = +∞ (resp. −∞) implique 

que lim 

p→∞ Λ(Xp ) = +∞ (resp. −∞) où la notation lim 

p→∞ Xp = +∞ (resp. −∞) signifie que lim 

p→∞ xp i 

−∞) pour au moins un indice i. 

= +∞ (resp. 

Le lien entre la propriété de surjectivité d’une M-fonction et la propriété de coercivité pour l’ordre s’énonce 

alors ainsi : 

Proposition 2.1. Soit Λ : IR dim(Λ) → IR dim(Λ) , une M-fonction continue. Alors Λ est surjective si et 

seulement si Λ est coercive pour l’ordre. 

Soit à résoudre le système d’équations suivant : 

Sous les hypothèses précédentes, ce problème (2.1) a une unique solution X ∗ . 

Si on pose IR n = E et que l’on décompose E de la manière suivante E = 

Λ(X) = 0. (2.1) 

β 

Eℓ, avec Eℓ = IR nℓ et 

ℓ=1 

β 

nℓ = n. 

Chaque sous-espace Eℓ est muni de l’ordre partiel naturel ( i.e. composante par composante ) associé au cône 

Kℓ = IR nℓ 

+ des vecteurs de composantes non négatives de IR nℓ . 

Pour chaque élément X ∈ E, on considère la décomposition suivante compatible avec la décomposition de E : 

ainsi que la décomposition par blocs de Λ : 

X = {x1, . . . , xℓ, . . . , xβ}, xℓ ∈ Eℓ, pour ℓ ∈ {1, . . . , β}, (2.2) 

Λ(X) = {Λ1(X), . . . , Λℓ(X), . . . , Λβ(X)} ∈ 

2.2 

ℓ=1 

β 

Eℓ. (2.3) 

ℓ=1

Pour tout ℓ ∈ {1, . . . , β} et W ∈ E, soit l’application suivante : 

xℓ −→ Λ W ℓ (xℓ) = Λℓ(w1, . . . , wℓ−1, xℓ, wℓ+1, . . . , wβ). (2.4) 

Comme Λ est une M-fonction continue, surjective, il découle du théorème 3.5 de [15] que pour tout ℓ ∈ 

{1, . . . , β}, et pour tout W ∈ E, l’application xℓ −→ Λ W ℓ (xℓ) est une M-fonction de Eℓ dans Eℓ. 

De plus, pour tout ℓ ∈ {1, . . . , β} et pour tout W ∈ E, le système 

possède une unique solution x ∗ ℓ . 

Λ W ℓ (xℓ) = 0, (2.5) 

Ainsi on peut définir une application de point fixe F : E → E, associée avec le problème (2.1) telle que 

F (W ) = X ∗ = {x ∗ 1, . . . , x ∗ ℓ , . . . , x ∗ β} (2.6) 

L’application F est définie de manière unique. Une importante propriété de l’application F est qu’elle est 

monotone croissante sur E ( voir [12] ) ( i.e. que pour tout X, Y ∈ E tels que X ≤ Y, F (X) ≤ F (Y ) ). 

2 Λ-sur-applications et nouvelles méthodes asynchrones. 

2.1 Itérations asynchrones avec communication flexible. 

Pour résoudre l’équation (2.1), on considère comme au chapitre 1 des méthodes itératives générales de point 

fixe. Les concepts suivants permettent de définir les algorithmes itératifs asynchrones avec communication 

flexible. 

Le premier concept est la notion de Λ-sur-solution qui permettra de choisir une valeur initiale du vecteur itéré 

pour l’algorithme. 

Dfinition 2.2. X ∈ IR n + est une Λ-sur-solution si Λ(X) ≥ 0. 

Un deuxième concept important est le concept de segments d’ordre défini comme suit : 

Dfinition 2.3. Soient (xℓ, yℓ) ∈ E 2 ℓ tels que xℓ ≤ yℓ, le segment d’ordre < xℓ, yℓ >ℓ est l’ensemble des zℓ ∈ Eℓ 

tels que xℓ ≤ zℓ ≤ yℓ. De même soient (X, Y ) ∈ E 2 tels que X ≤ Y alors < X, Y >= {Z ∈ E | X ≤ Z ≤ Y }. 

On introduit également la notion suivante pour la définition des algorithmes itératifs asynchrones avec communication 

flexible : 

Dfinition 2.4. Soit Λ une M-fonction. F Λ est une Λ-sur-application associée à F si pour tout ℓ ∈ {1, . . . , β} 

et X ∈ E tels que Λℓ(X) ≥ 0, il existe F Λ ℓ (X) ∈ Eℓ tel que F Λ ℓ (X) ≤ xℓ, Λ X ℓ (F Λ ℓ (X)) ≥ 0 et F Λ ℓ (X) = xℓ si 

Fℓ(X) = xℓ. 

Les notions de stratégie S = {s(p)} p∈IN , de retards R = {r(p)} p∈IN ainsi que les applications ρℓ définies 

au paragraphe 1.1 sont de nouveau nécessaires à la définition de ces algorithmes itératifs asynchrones avec 


2.3

Enfin l’application ρ : IN β → IN β de composantes ρℓ, ℓ ∈ {1, . . . , β} et les ensembles : K p 

ℓ = {k ∈ IN | s(k) = 

ℓ, 0 ≤ k ≤ p}, ℓ ∈ {1, . . . , β} et p ∈ IN complètent ces définitions et rappels. 

Remarque 2.2. L’ensemble K p 

ℓ 

du bloc-composant ℓ. {K p 

ℓ 

contient tous les numéros d’itérations inférieur à p qui concernent le calcul 

} est une suite dénombrable d’éléments finis de l’ensemble des parties de IN. 

À l’aide de tous ces rappels, les algorithmes itératifs asynchrones avec communication flexible s’énonce de la 

manière suivante ( voir [16] ) : 

où : 

et 

Dfinition 2.5. 

∀p ∈ IN, ∀ℓ ∈ {1, . . . , β}, x p+1 

ℓ 

= 

⎧ 

⎨ x 

⎩ 

p 

ℓ si ℓ ∈ s(p), 

F Λ ℓ ( Xp ) si ℓ ∈ s(p), 

(2.7) 

X 0 = X 0 est une Λ-sur-solution, (2.8) 

X p ∈< X p , min(X ρ(p) , X q ) > si p ≥ 1. (2.9) 

Xρ(p) est le vecteur de E de composantes x ρℓ(p) 

ℓ , ℓ ∈ {1, . . . , β} et q = Max p 

k∈K k. 

s(p) 

Remarque 2.3. En particulier si K p 

ℓ = ∅, alors X p ∈< X p , X ρ(p) >. 

Les algorithmes itératifs avec communication flexible définies récursivement par les équations (2.7) à (2.9) 

sont des méthodes itératives dans lesquelles les itérations sont effectuées en parallèle par au plus β processeurs 

sans ordre ni synchronisation. Ces algorithmes présentent plusieurs particularités. 

La première est de permettre une communication très flexible entre les processeurs. Lors d’une mise à jour d’un 

du vecteur d’itération est pris n’importe où dans le segment d’ordre < xpj 

, min(xρj(p) j 

bloc x p+1 

ℓ , le bloc ˜x p 

j 

où ˜x q 

j 

est la valeur utilisée lors de la précédente mise à jour de ce même bloc et xρj(p) 

j 

, ˜x q 

j ) >j, 

modélise le comportement 

non déterministe du schéma itératif. Ainsi les valeurs des composantes du vecteur d’itération qui interviennent 

dans une mise à jour, peuvent provenir de mise à jour en cours de réalisation. Autrement dit un processeur peut 

communiquer la valeur courante des composantes en cours de relaxation à tout moment et tous les processeurs 

utilisent pour leurs calculs les valeurs les plus récentes du vecteur d’itération. Contrairement aux algorithmes 

asynchrones classiques ( voir [2], [3], [4] et [11] ) exposés au chapitre 1, les retards ne se font plus au niveau des 

blocs de composantes mais au niveau des composantes d’un même bloc. 

La seconde particularité de ce type de méthode est l’utilisation des Λ-sur-applications F Λ , qui permettent de 

considérer des relaxations approchées de la solution. 

Remarque 2.4. La formulation classique des algorithmes asynchrones ( voir [2], [3], [4] et [11] ) est un cas 

particulier des algorithmes définis par 2.5 ; il suffit de séquentialiser le début des calculs des composantes x p 

ℓ 

pour ℓ ∈ s(p), puisque les mises à jour des composantes des différents blocs sont effectuées indépendemment. 

Les retards doivent être modifiés en conséquence. Pour de plus amples détails, nous renvoyons à [13]. 

2.4

On peut alors établir le résultat de convergence suivant ( voir [13] ) : 

Proposition 2.2. Soit Λ une M-fonction continue surjective, F l’application de point fixe associée à Λ 

définie par (2.5) et (2.6), F Λ la Λ-sur-application associée à F , X 0 ∈ E une Λ-sur-solution, S une stratégie et 

R une séquence de retards. Alors, l’algorithme itératif asynchrone {X p } décrit de (2.7) à (2.9) est bien défini 

et présente la propriété suivante : 

où ¯ X est une Λ-sur-solution du problème (2.1) et (2.10) signifie : 

X p ↓ ¯ X lorsque p → ∞, (2.10) 

¯X ≤ . . . ≤ X p+1 ≤ X p ≤ . . . ≤ X 0 et lim 

p→∞ Xp = ¯ X. 

Remarque 2.5. Les figures 2.1 et 2.2 illustrent le comportement des algorithmes asynchrones et montrent 

un exemple d’échange des informations entre les processeurs pour les algorithmes asynchrones classiques (2.1) 

et les algorithmes asynchrones avec communication flexible (2.2) ; pour ces derniers, on peut prendre comme 

données d’itération n’importe quelle valeur dans le segment d’ordre, représenté schématiquement ici par des 

traits verticaux. 

t+1 

u 

i 

q+1 

u 

j 

Bloc i 

Bloc j 

u 

i 

t 

q 

u 

j 

p+1 

u 

k 

Donnée prise en compte 

au début de l’itération + t1 

Bloc k 

p 

u 

k 

Donnée envoyée 

à la fin de l’itération p 

Figure 2.1 : Exemple de comportement d’un algorithme asynchrone classique. 

2.5

Itéré partiel 

t+1 

u 

i 

Suite décroissante monotone (Bloc j) 

q+1 

u 

j 


u 

i 

t 

Suite décroissante monotone (Bloc i) 

p+1 

u 

k 

q 

u 

j 

Ordre partiel 




p+1 

u 

k 

< 


p 

u 

k 

u 

k 

p 

p+1 

u 

k 

Valeurs courantes des composantes du k−ième bloc du vecteur d’itération 

correspondant aux mises à jour intermédiaires dans les segments d’ordre. 

p 

u 

k 

Suite décroissante monotone (Bloc k) 

Figure 2.2 : Exemple de comportement d’un algorithme asynchrone avec communication flexible. 

2.6

2.2 Une classe particulière de Λ-sur-applications. 

Afin d’obtenir un algorithme itératif asynchrone avec communication flexible qui permet de trouver la solution 

X ∗ du problème (2.1), il est nécessaire de considérer des Λ-sur-applications particulières ; ces applications définies 

par J.C. Miellou, D. El Baz et P. Spitéri [13] se caractérisent de la manière suivante : 

Dfinition 2.6. F Λ est une Λ-sur-application M-continue associée à F s’il existe une Λ-sur-application F Π 

associée à F telle que F Λ αF Π et 

X p ↓ X ∗ lorsque p → ∞, implique que F Π ℓ (X p ) ↓ F Π ℓ (X ∗ ) lorsque p → ∞, ∀ℓ ∈ {1, . . . , β}. (2.11) 

La relation d’ordre α entre les Λ-sur-applications qui intervient dans la définition des Λ-sur-applications 

M-continue est définie de la façon suivante : 

Dfinition 2.7. Deux Λ-sur-applications F Λ et F Π associées à F vérifient la relation F Λ αF Π si pour tout 

ℓ ∈ {1, . . . , β} et X ∈ E tels que Λℓ(X) ≥ 0 alors F Π ℓ (X) ∈< F Λ ℓ (X), xℓ >ℓ. 

Remarque 2.6. La relation (2.11) peut être interprétée comme une propriété de continuité pour l’ordre au 

point X ∗ de l’application F Π . 

A l’aide de cette notion de Λ-sur-applications M-continues associées à F , J.C. Miellou et all ont établi le 

résultat global de convergence pour les algorithmes itératifs asynchrones avec communication flexible ( voir 

[13] ) : 

Proposition 2.3. Sous les mêmes hypothèses que la proposition 2.2, soit F Λ une Λ-sur-application Mcontinue 

associée à F . Si la stratégie S vérifie : 

et que de plus : 

{p ∈ IN | ℓ ∈ s(p)} est infini, ∀ℓ ∈ {1, . . . , β}, (2.12) 

lim 

p→∞ ρℓ(p) = +∞, ∀ℓ ∈ {1, . . . , β}, (2.13) 

alors la suite {X p } définie par (2.7), (2.8), (2.9) vérifie X p ↓ X ∗ où X ∗ est l’unique solution du problème 

(2.1). 

2.3 Critères d’applications des algorithmes itératifs asynchrones avec communication flexible. 

L’obtention des Λ-sur-applications est un problème technique compliqué selon l’opérateur Λ considéré. 

J.C. Miellou et all ont montré que les algorithmes itératifs asynchrones avec communication flexible s’appliquent 

à un opérateur du type Λ(X) = AX −f +φ(X), A étant une M-matrice et φ(X) un opérateur diagonal 

non décroissant. On renvoie à [13] pour la détermination des Λ-sur-applications M-continues qui assurent la 

convergence des algorithmes. 

Remarque 2.7. Dans la cas linéaire, l’application F Λ associée au schéma de relaxation correspond exactement 

à l’application de point fixe F . 

2.7

2.4 Lien avec la méthode alternée de Schwarz. 

Dans le cadre des algorithmes parallèles asynchrones avec communication flexible, on peut également considérer 

la méthode alternée de Schwarz. On considère une M-fonction Λ obtenue par la somme d’une M-matrice A par 

un opérateur φ diagonal non décroissant. On étudie la résolution du système suivant d’équations non-linéaires : 

Λ(X) = 0, 

au moyen d’une méthode asynchrone de sous-domaines dérivée de la méthode alternée de Schwarz. Le procédé 

d’augmentation de la méthode alternée de Schwarz transforme la matrice A en une matrice A qui est elle aussi 

une M-matrice et l’application non-linéaire φ en une application diagonale croissante φ ( voir [8] et [16] ). Ainsi 

l’application non-linéaire résultante Λ est une M-fonction surjective ; le problème augmenté ainsi obtenu rentre 

dans le cadre de la théorie des algorithmes itératifs asynchrones avec communication flexible. 

3 Exemples d’applications des algorithmes itératifs asynchrones avec communication flexible. 

Signalons tout d’abord que la plupart des exemples d’application donnés au chapitre 1 rentrent dans le cadre 

théorique de ce chapitre. La résolution de ces problèmes peut être effectuée à l’aide des algorithmes itératifs 

asynchrones avec communication flexible. En fait les exemples présentés dans ces deux chapitres peuvent soit 

être résolus par les algorithmes parallèles asynchrones et synchrones du chapitre 1, soit par les algorithmes 

itératifs asynchrones avec communication flexible du présent chapitre. 

Exemple 2.1. Le problème du Laplacien : 

avec f ∈ L 2 (Ω). 

⎧ 

⎪⎨ 

⎪⎩ 

Déterminer u tel que 

−∆u = f dans Ω 

u = 0 sur Γ 

(2.14) 

La matrice de discrétisation A obtenue par un schéma classique de différences finies à cinq points et en prenant 

une numérotation lexicographique des points du maillage ou une numérotation rouge-noir par blocs, est une 

M-matrice ; les algorithmes itératifs asynchrones avec communication flexible couplés à la méthode alternée de 

Schwarz peuvent être utilisés pour résoudre le problème du Laplacien. 

Exemple 2.2. Le problème de diffusion non-linéaire suivant : 

⎧ 


⎪⎨ 

−∆u + Log(β + δu) = f dans Ω 

⎪⎩ 

u = 0 sur Γ 

où δ > 0, β est un coefficient convenablement choisi et f ∈ L 2 (Ω). 

L’opérateur discrétisé Λ associé a ce problème est de la forme : 

Λ(X) = AX + φ(X). 

2.8 

(2.15)

où A est la matrice de discrétisation du Laplacien qui classiquement est une M-matrice et où l’opérateur φ est 

un opérateur diagonal non décroissant. Ce problème non-linéaire rentre dans le cadre d’application précédent. 

Exemple 2.3. Le problème de l’obstacle : 

Soit K le cône convexe positif et f ∈ L 2 (Ω) ; soit Λ l’opérateur elliptique défini par : 

où ɛ, θ, γ, µ sont des constantes réelles et de plus µ est positive. 

Λu = −∆u − ɛ ∂2u ∂u ∂u 

+ θ + γ + µu (2.16) 

∂x∂y ∂x ∂y 

On considère l’inéquation variationnelle suivante : 

 

Déterminer u ∈ K tel que 

a(u, v − u) ≥< f, v − u >, ∀v ∈ K 

où a(., .) est la forme bilinéaire classique associée à l’opérateur Λ. 

Ce problème peut aussi être formulé comme suit : 

 

Déterminer u ∈ K tel que 

Λu − f + ∂ψK(u) ∋ 0 

où ∂ψK est le sous-différentiel de la fonction indicatrice ψK du convexe K. 

(2.17) 

(2.18) 

Pour des valeurs convenables des coefficients ɛ, θ, γ, µ, la discrétisation de l’opérateur Λ conduit à une matrice 

A qui est une M-matrice. De plus φ résultat de la discrétisation de l’opérateur ∂ψK est un opérateur diagonal 

non décroissant. Nous sommes bien dans le cadre théorique précédent. 

Exemple 2.4. Si nous considérons le problème suivant déjà évoqué dans l’exemple 1.4 du chapitre 1 : 

⎧ 

⎪⎨ 


−∆u + θu = f sur ]0, 1[×]0, 1[ 

(2.19) 

⎪⎩ 

u = 0 sur Γ 

avec θ > 0, l’utilisation des éléments finis pour la discrétisation conduit à une matrice qui n’est pas une Mmatrice. 

En effet il existe des termes hors diagonaux positifs ( γ = θh2 

12 > 0). 

Ce problème discrétisé par la méthode des éléments finis n’entre pas dans le cadre théorique des M-fonctions. 

Par contre si on considère une discrétisation par différences finies classique à cinq points du Laplacien, la 

matrice de discrétisation A obtenue est une M-matrice et ce problème rentre dans le cadre des M-fonctions ; 

les algorithmes asynchrones avec communication flexible convergent. 

Exemple 2.5. Pour montrer que des problèmes discrétisés par la méthode des éléments finis rentrent dans le 

cadre des M-fonctions, nous considérons le problème aux limites 2D suivant : 

⎧ 

⎪⎨ 

⎪⎩ 


− ∂ 

∂x 

∂u ∂ (p ∂x ) − ∂y 

u = γ sur Γ0, 

∂u 

∂n + σu = ξ sur Γ1, 

∂u (p ∂y ) + qu = g dans Ω, 

2.9 

(2.20)

sur le domaine polyédrique décrit par la figure 2.3 ( Γ = Γ0 Γ1 ). p, q, σ sont tels que p, q ∈ C( ¯ Ω), σ ∈ C(Γ1) 

et 

y 

0 < p0 ≤ p(x, y) ≤ p1 ∀x, y ∈ ¯ Ω, 

0 ≤ q(x, y) ≤ q1 ∀x, y ∈ ¯ Ω, 

0 < σ0 ≤ σ(x, y) ≤ σ1 ∀x, y ∈ Γ1. 

Γ 

1 

Ω 

Γ 

0 

Figure 2.3 : Domaine du problème (2.20). 

x 

(2.21) 

On considère une discrétisation du problème (2.20) par la méthode des éléments finis où Ω est décomposé en 

triangles. Soit K la matrice de rigidité globale et M le nombre total de points du maillage. Soit el un élément, 

T son nombre de nœuds et K (l) sa matrice de rigidité élémentaire. 


(1) Si q(x, y) = 0 ∀(x, y) ∈ el alors 

(a) K (l) est semi-définie positive ; 

(b) T 

s=1 k(l) 

rs = 0, r = 1, 2, . . . , T . 

(2) Si q(x, y) ≤ 0 ∀(x, y) ∈ el et s’il existe (x0, y0) ∈ el tel que q(x0, y0) > 0 alors 

(a) K (l) est définie positive ; 

De plus si les fonctions de bases sont linéaires par morceaux ou bilinéaires par morceaux alors 

(b) T 

s=1 k(l) 

rs > 0, r = 1, 2, . . . , T . 

Dmonstration. voir [1], théorème 5.1 page 200. 

En ce qui concerne les termes hors diagonaux de K (l) quand q(x, y) = 0 ∀(x, y) ∈ el, on montre [1] qu’ils 

sont non positifs dans les cas suivants : 

(1) Les fonctions de bases sont linéaires par morceaux et θ ≤ π/2, où θ est un angle de el. 

2.10

(2) Les fonctions de bases sont bilinéaires par morceaux et 

p1/2p0 ≤ β ≤ 2p0/p1, 

où β traduit classiquement la condition d’angle dans la méthode des éléments finis. 

Si l’inégalité est stricte alors tous les termes hors diagonaux de K (l) sont négatifs. 

Si q(x, y) ≥ 0 dans el alors les coefficients hors diagonaux de K (l) sont négatifs si el est suffisamment petit et 

si l’une des conditions suivantes est vraie : 

(1) Les fonctions de bases sont linéaires par morceaux et 

(2) Les fonctions de bases sont bilinéaires par morceaux et 

θ ≤ θ0 < π/2. (2.22) 

p1/2p0 < β0 ≤ β ≤ β1 < 2p0/p1. (2.23) 

Considérons maintenant K la matrice de rigidité globale obtenue en sommant les matrices de rigidité élémentaires 

K (l) ; la matrice K vérifie les propriétés suivantes : 


(1) Si q(x, y) = 0 ∀(x, y) ∈ ¯ Ω alors 

(a) K est semi-définie positive ; 

(b) M 

j=1 kij = 0, i = 1, 2, . . . , M. 

(2) Si q(x, y) ≤ 0 ∀(x, y) ∈ ¯ Ω et s’il existe (x0, y0) ∈ ¯ Ω tel que q(x0, y0) > 0 alors 

(a) K est définie positive ; 

De plus si les fonctions de bases sont linéaire par morceaux ou bilinéaires par morceaux alors 

(b) M 

j=1 kij ≥ 0, i = 1, 2, . . . , M, avec l’inégalité stricte pour certaines lignes. 

Dmonstration. voir [1], théorème 5.2 page 203. 

Les éléments diagonaux de la matrice K sont positifs et sous les conditions (2.22) ou (2.23), tous les termes 

hors diagonaux sont négatifs à condition que les éléments du maillage soient suffisamment petits. 

Avec ces conditions la matrice de rigidité du problème est une M-matrice et nous rentrons dans le cadre 

théorique des M-fonctions. Nous pouvons appliquer les algorithmes asynchrones avec communication flexible 

pour résoudre ce problème aux limites discrétisé par la méthode des éléments finis. 

2.11

2.12


1. O.Axelsson and V.A. Barker, Finite element solution of boundary value problems, theory and computation, 

Academic Press, Inc (1984). 


244. 

3. D.P. Bertsekas and J. Tsitsiklis, Parallel and Distributed computation, Numerical Methods, Englewood cliffs : 

Prentice Hall, (1989). 


5. M.N. El Tarazi, Contraction et ordre partiel pour l’étude d’algorithmes synchrones et asynchrones en analyse 

numérique, Thèse de doctorat d’ État, Université de Besançon (1981). 


pp. 325–340. 

7. N.M. El Tarazi, Algorithmes mixtes asynchrones. Etude de la convergence monotone, Num. Math., 44 (1984), 

pp. 363–369. 

8. D.J. Evans and W. Deren, An asynchronous parallel algorithm for solving a class of nonlinear simultaneous 

equations, Parallel Computing, 17 (1991), pp. 165–180. 

9. C. Jacquemard, Contribution à l’étude d’algorithmes de relaxation à convergence monotone, Thèse de 3 e 

cycle, Université de Besançon (1977). 

10. J.C. Miellou, Itérations chaotiques à retards, étude de la convergence dans le cas d’espaces partiellement 

ordonnés, C.R.A.S. Paris, 280 (1975) pp. 233–236. 


12. J.C. Miellou, Asynchronous iterations in order intervals, Parallel Algorithms, M. Cosnard et al. ed, Amsterdam 

: North-Holland, (1986), pp. 85–96. 


LCS report 1994-16, (1994) à paraitre dans Mathematics of Computation. 



15. W.C. Rheinboldt, On M-functions and their application to nonlinear Gauss-Seidel iterations and to network 

flows, J. Math. Anal. and Appl., 32 (1970), pp. 274–307. 

16. P. Spitéri, J.C. Miellou and D. El Baz, Asynchronous Schwarz alternating method for the solution of nonlinear 

partial differential equations, LAAS 95309, IRIT 95-17-R, LCS 1995-10 (1995). 

2.13

2.14

Chapitre 3 

Implémentation des algorithmes 

parallèles synchrones et asynchrones. 

Introduction. 

Dans ce chapitre, nous nous intéressons à l’implantation effective des méthodes de relaxation synchrones et 

asynchrones pour résoudre des grands systèmes algébriques issus de la discrétisation d’équations aux dérivées 

partielles en relation avec la méthode de Schwarz. Précisons qu’au cours de ce chapitre nous aborderons aussi 

bien l’implantation des algorithmes parallèles asynchrones exposés au chapitre 1 tels que définis par D. Chazan, 

W. Miranker [6], J.C. Miellou [18] et G. Baudet [1], que les algorithmes asynchrones avec communication flexibles 

présentées au chapitre 2 et introduits par J.C. Miellou, D. El Baz, et P. Spitéri ( [12], [19], [23] ). 

Pour situer notre contribution, notons que ce type d’algorithmes a été implanté par bon nombre de chercheurs 

sous forme, soit de simulations d’exécutions parallèles, soit d’exécutions sur des machines multi-processeurs. 

Ainsi dès 1967 J.L. Rosenfeld [21] s’est intéressé à la simulation d’exécutions parallèles à propos de simulation 

de réseaux électriques ; en 1980 J. Julliand, G.R. Perrin et P. Spitéri ( [15], [16], [17] ) ont défini des schémas 

d’exécutions parallèles sur une machine séquentielle ; dans ce travail ils ont simulé des algorithmes parallèles 

synchrones ou asynchrones en considérant des architectures de machine soit à mémoire commune et bus unique, 

soit à réseau de communication et bancs de mémoire commune, soit à mémoire distribuée. En 1978, G. Baudet [1] 

a évalué et comparé la performance d’algorithmes numériques synchrones et asynchrones par points sur le 

multiprocesseur CMMP du Carnegie Mellon Institute. 

De 1989 à 1991 L. Giraud [13], L. Giraud et P. Spitéri [14] ont considéré l’exécution de ce type d’algorithmes 

pour la résolution numérique d’équations aux dérivées partielles par des méthodes de sous-domaines sans recouvrement 

sur des réseaux de transputers ainsi que sur des machines à mémoire partagée ( I.B.M.-3090, Alliant 

FX-80 ) ; ils ont aussi implanté sur ce type de machine une variante de la méthode alternée de Schwarz [13]. 

D. El Baz a également considéré la résolution de problèmes d’optimisation d’écoulements sur une machine Tnode 

à mémoire distribuée [7]. Signalons aussi les travaux de J. Bernussou, F. Le Gall, and G. Authié [2] sur 

la résolution de problèmes de chaînes de Markov. D. El Baz a également effectué des essais sur une machine 

T-node pour la résolution de ce types de problèmes [8]. 

3.1

Les algorithmes parallèles asynchrones avec communication flexible ont également été implantés sur machine 

à mémoire partagée par J.M. Perraudin [20], H. Songoro [22] et P. Spitéri, J.C. Miellou et D. El Baz [23] pour 

la résolution numérique d’équations aux dérivées partielles linéaires et non-linéaires par la méthode alternée de 

Schwarz ; ce même type de méthodes a également été mis en œuvre par D. El Baz, P. Spitéri, J.C. Miellou et 

D. Gazen [9] pour la résolution de problèmes d’optimisation d’écoulements. 

D’autres expérimentations d’algorithmes parallèles synchrones et asynchrones ont été effectués par A. Uresin et 

M. Dubois pour l’implantation d’algorithmes en vue de la résolution de problèmes combinatoires et d’imaginerie 

[24], D. Bertsekas pour résoudre des problèmes de programmation linéaire et des problèmes d’écoulements [3], 

[4] ; signalons aussi pour ce dernier type de problèmes les travaux de S. Zenios qui a travaillé sur diverses 

machines et divers types d’architectures [25], [26] ( CM–2, Alliant, réseaux de stations ). 

Actuellement, on assiste à un engouement pour l’utilisation de machines à mémoire distribuée. Les outils 

P.V.M. ( Parallel Virtual Machine ) et M.P.I. ( Message Passing Interface ) sont de plus en plus utilisés pour 

mettre en place le parallélisme sur ce type de machines. Dans le présent travail, notre principale contribution 

a consisté à utiliser ces standards pour mettre en œuvre ces algorithmes. Si les méthodes synchrones ne posent 

pas de problèmes particuliers d’implantation, les méthodes asynchrones amènent quelques problèmes tout en 

évitant la gestion de sections critiques. Plus particulièrement pour les communications asynchrones, nous devons 

nous efforcer d’une part d’implanter des communications inter-processeurs efficaces compte tenu du coût des 

communications ( temps de latence de 35 µs sur l’I.B.M.-SP2 ) et d’autre part de programmer des tests d’arrêt 

efficaces. Pour résoudre ces problèmes, nous proposons dans la suite de ce chapitre plusieurs solutions pour 

finalement arriver à un compromis efficace entre toutes ces contraintes. 

Le présent chapitre commence par une brève présentation de l’I.B.M.-SP2, machine sur laquelle les algorithmes 

ont été développés, des outils de parallélisation P.V.M. et M.P.I. Nous présentons ensuite la mise en œuvre des 

algorithmes synchrones et leur implantation avec P.V.M. et M.P.I. La résolution des problèmes de communication 

et de terminaison des algorithmes asynchrones par diverses méthodes, ainsi que l’implantation de ces derniers 

via P.V.M. et M.P.I. terminent ce chapitre. 

3.2

1 Description du multiprocesseur I.B.M.-SP2. 

Le multiprocesseur utilisé pour développer et tester les algorithmes synchrones et asynchrones est l’I.B.M.- 

SP2 du C.N.U.S.C. ( Centre National Universitaire Sud de Calcul ) situé à Montpellier. Ce multiprocesseur 

dispose désormais de 79 Processeurs Power2 de type 390, d’une puissance théorique totale de 20 Gflops. Les 79 

processeurs se répartissent en trois catégories : 

– 64 processeurs parallèles batch pour l’exploitation d’applications parallèles PVMe, EUI et MPI ; 

– 4 processeurs batch pour du calcul série ; 

– 5 processeurs batch et interactifs pour : 

– des petits batch série ; 

– le développement et le test d’applications parallèles. 

Chaque processeur du SP2 est fonctionnellement une station à part entière : 

– Processeur Power2 ; 

– Puissance théorique de 234 Mflops par nœud ; 

– Mémoire RAM de 256 Mo ; 

– Disques avec système AIX local et logiciels applicatifs. 

Ces processeurs sont reliés entre eux par un réseau switch d’interconnexion HPS : 

– de type Omega à étages, 

– de bande passante 80 Mo/s, 

– de latence 35 µs, 

utilisé en TCP/IP ou User Space pour les échanges de messages des applications parallèles et pour toutes les 

requêtes de type NFS. 

Cette configuration est la dernière configuration ; le développement des algorithmes synchrones et asynchrones 

a commencé sur un SP2 qui comportait 32 processeurs Power2 disposant de 128 Mo de mémoire chacun avec 

un réseau moins performant. 

2 Description des outils de parallélisation P.V.M. et M.P.I. 

2.1 Présentation de l’environnement Parallel Virtual Machine ( P.V.M. ). 

P.V.M. est un logiciel système du domaine public disponible sur netlib et développé par l’Oak Ridge National 

Laboratory, l’Université du Tennessee, l’Université Carnegie Mellon, le Pittsburgh Supercomputing Center et 

l’Emory University d’Atlanta. Cet environnement de programmation permet d’utiliser un réseau d’ordinateurs 

UNIX hétérogènes ( aussi bien séries que parallèles ) comme une unique ressource de calcul. Cette ressource 

est appelée machine virtuelle. Les nœuds de la machine virtuelle peuvent être reliés par différents réseaux 

( Ethernet, FDDI, ... ) : 

Un processus démon, activé sur chaque nœud coordonne le travail distribué sur la machine virtuelle. Un 

fichier contenant la liste des ordinateurs disponibles permet d’activer automatiquement les démons UNIX et 

de construire ainsi la machine virtuelle. L’application parallèle est alors vue comme un ensemble de processus 

parallèles. Ces processus parallèles sont exécutés sur les processeurs de la machine virtuelle qui communiquent 

et se synchronisent en utilisant le modèle de message passing. Les processus peuvent être organisés en groupes 

( un processus peut appartenir à plusieurs groupes et les groupes peuvent changer n’importe quand en cours de 

calcul ). 

3.3

Station de 

Travail 

Station de 

Travail 

Station de 

Travail 

FDDI 

(100Mbits/sec) 

Station de 

Travail 

ETHERNET ( 10 Mbits/sec ) 

Mini 

Calculateur 

Figure 3.1 : Exemple de machine virtuelle. 

Station de 

Travail 

Super 

Calculateur 

Du point de vue de l’utilisateur, le paquetage P.V.M. est composé de deux parties : 

– un processus démon. 

Un démon, appelé pvmd3, réside sur chaque ordinateur de la machine virtuelle. Le démon peut être lancé de 

façon interactive ou automatique. Quand un utilisateur veut exécuter une application dans l’environnement 

P.V.M., il commence par lancer une procédure ( pvmd3 ) qui lance automatiquement un démon sur chaque 

nœud de la machine virtuelle ; cette liste de nœuds est contenu dans un fichier appelé host file. L’application 

peut alors être lancée de n’importe quel nœud. 

– un ensemble de procédures. 

La librairie PVM3 contient des procédures de communication et de synchronisation qui permettent à l’utilisateur 

d’implanter sur la machine virtuelle des programmes écrits en C ou en FORTRAN. En particulier, 

P.V.M. fournit des procédures pour créer et terminer des processus, pour communiquer entre les processus, 

pour synchroniser les processus, pour modifier la machine virtuelle et pour manipuler les groupes. 

2.2 Présentation de l’environnement Message Passing Interface ( M.P.I. ). 

La notion de message passing est une notion bien connue et utilisée largement sur les machines parallèles, 

spécialement les machines à mémoire distribuée. Depuis une dizaine d’années, des progrès ont été réalisés dans 

le développement du message passing et chaque constructeur a implémenté sa propre version. Le but de M.P.I. 

est de standardiser le message passing en définissant la syntaxe et la sémantique d’un ensemble de routines utile 

à de nombreux utilisateurs et efficacement implémentable sur une large variété d’ordinateurs. 

3.4

L’effort de standardisation de M.P.I. implique une quarantaine d’équipes de recherche en Europe et aux États- 

Unis, en particulier les principaux constructeurs d’ordinateurs, des chercheurs de laboratoires universitaires, 

gouvernementaux et industriels. 

Les principaux avantages d’établir un standard de message passing sont la portabilité et la facilité d’utilisation. 

Pour des environnements de communication avec mémoire distribuée dans lesquels les routines et/ou les concepts 

de plus haut niveau sont construits sur des instructions de message passing de plus bas niveau, les bénéfices 

de la standardisation sont particulièrement apparents. De plus, la définition d’un standard de message passing 

permet aux constructeurs, à partir d’un ensemble de routines de base bien défini, d’implémenter efficacement 

les procédures de message passing et même dans certains cas de fournir le support matériel adéquat. 

Actuellement la version 1.1 de M.P.I. est disponible depuis Juin 1995 et M.P.I. 2 est en préparation. 

3 Rôle général du Maître et des Esclaves. 

Pour mettre en œuvre les algorithmes parallèles synchrones et asynchrones, on a choisi de manière générale 

le modèle Maître-Esclaves. Chaque processeur a un rôle bien déterminé suivant qu’il est le Maître ou l’un des 

Esclaves. C’est ce rôle que nous allons décrire et préciser dans ce paragraphe. 

Les algorithmes développés sont des algorithmes de résolution par la méthode alternée de Schwarz. Chacun 

des processeurs se voit donc confier un ou plusieurs sous-domaines adjacents à résoudre. Dans le modèle choisi 

pour des raisons évidentes de moyens matériels utilisés, le processeur Maître reçoit lui aussi des sous-domaines 

à traiter, par exemple les premiers sous-domaines de la décomposition. 

Pour expliquer la mise en œuvre des algorithmes tant synchrones qu’asynchrones, nous définissons quelques 

termes et conventions. 

Nous appelons itération de Schwarz une résolution des sous-problèmes sur l’ensemble des sous-domaines. 

Une itération de Schwarz au niveau d’un processeur est une résolution des sous-problèmes sur les sous-domaines 

affectés à ce processeur. 

On note résolution de Schwarz une résolution d’un sous-problème. Classiquement une itération de Schwarz 

correspond à autant de résolutions de Schwarz qu’il y a de sous-domaines. 

Nous parlerons de processeurs voisins pour désigner les processeurs chargés de résoudre des sous-domaines 

adjacents. Ainsi chaque processeur a deux voisins, à l’exception du processeur chargé du premier sous-domaine 

Ω1 et du processeur chargé du dernier sous-domaine ΩN. 

Par convention nous nommerons indifféremment par Maître ou processeur Maître le processeur qui a le 

rôle de Maître ; de même pour l’Esclave ou processeur Esclave souvent employé au singulier pour parler de 

la classe des processeurs Esclaves. 

Mis à part la phase d’initialisation et de lancement des processeurs Esclaves ( voir initialisation pour P.V.M. 

et M.P.I. ainsi que les listings ), le travail spécifique du Maître est de gérer la terminaison de l’algorithme itératif. 

Nous verrons comment cette gestion est réalisée dans le cas synchrone et dans le cas asynchrone. 

Les processeurs doivent aussi se transmettre les valeurs de la solution sur les frontières de recouvrement. C’est 

surtout au niveau de la nature et de la fréquence de cet échange que se fera la différence entre les algorithmes 

synchrones et les algorithmes asynchrones. 

3.5

Les rôles respectifs du processeur Maître et d’un processeur Esclave peuvent se résumer dans les grandes 

lignes de la manière suivante : 

– Maître : 

– Lancer les autres processeurs ; 

– Effectuer les résolutions sur les sous-domaines qui lui sont affectés ; 

– Communiquer les valeurs de la solution sur les frontières de recouvrement ; 

– Gérer le contrôle de la convergence. 

– Esclave : 

– Effectuer les résolutions sur les sous-domaines qui lui sont affectés ; 

– Communiquer les valeurs de la solution sur les frontières de recouvrement et son test de convergence. 

4 Mise en œuvre des algorithmes synchrones 

L’implémentation des algorithmes synchrones s’est effectuée en suivant un procédé classique pour des algorithmes 

de résolution par décomposition de domaines. On passe par le Maître pour échanger les valeurs de 

la solution sur les frontières de recouvrement. C’est lui qui contrôle la convergence après chaque itération de 

Schwarz. 

4.1 Le Maître et l’Esclave synchrones. 

Au début de chaque itération de Schwarz, le Maître envoie aux Esclaves les valeurs de la solution sur les 

frontières de recouvrement. A la fin de l’itération, le Maître reçoit les indicateurs de convergence des Esclaves 

et la valeur de la solution sur les frontières de recouvrement. Il vérifie la convergence globale du problème : 

s’il n’y a pas convergence, une nouvelle itération de Schwarz est relancée sinon le Maître envoie un message de 

terminaison aux Esclaves. 

Par ailleurs le rôle du processeur Esclave peut se résumer ainsi : avant de commencer une nouvelle itération 

de Schwarz, l’Esclave est en attente des directives du Maître, et réceptionne soit les valeurs de la solution sur 

ses frontières de recouvrement, soit le message de terminaison. 

S’il reçoit les valeurs de la solution sur ses frontières de recouvrement, il effectue une résolution sur les sousdomaines 

qui lui sont affectés. A la fin de ces résolutions, il envoie au Maître le résultat de son test de convergence 

ainsi que les valeurs qu’il vient de calculer de la solution sur les frontières de recouvrement des sous-domaines 

voisins. Puis il se remet en attente. 

S’il reçoit le message de terminaison du Maître, il sort de la boucle d’itération de Schwarz. 

Le calcul se termine par un rapatriement vers le processeur Maître des solutions sur chaque sous-domaine 

pour obtenir la solution globale sur le domaine Ω. 

Nous pouvons présenter les algorithmes structurés du processeur Maître et d’un processeur Esclave sous la 

forme suivante : 

3.6

tant que non CONVERGENCE GLOBALE faire : 

◦ Envoi des valeurs de la solution sur les frontières de recouvrement aux Esclaves [ Envoi 1 ]. 

◦ CALCUL 

◦ Réception bloquante des tests de convergence des Esclaves 

et des valeurs de la solution sur les frontières de recouvrement. [ Réception 3 ] 

◦ Test de CONVERGENCE GLOBALE : 

fait 

• Envoi du message de CONVERGENCE GLOBALE aux processeurs Esclaves [ Envoi 2 ]. 

• Réception de la solution de chaque processeur Esclave [ Réception 4 ]. 

fin 

Algorithme 3.1 : Algorithme Parallèle Synchrone : le processeur Maître. 


◦ Réception bloquante des valeurs de la solution sur les frontières de recouvrement 

ou du message de CONVERGENCE GLOBALE. [ Réception 1 ou 2 ] 

◦ CALCUL 

◦ Envoi du test de convergence et des valeurs de la solution sur les frontières de recouvrement 

au processeur Maître [ Envoi 3 ]. 

fait 

• Envoi au processeur Maître de la solution de chaque sous-domaine 

traité par le processeur [ Envoi 4 ]. 

fin 

4.2 Algorithme synchrone et P.V.M. 

Algorithme 3.2 : Algorithme Parallèle Synchrone : le processeur Esclave. 

Les instructions de communication utilisées pour développer les algorithmes synchrones du Maître et de 

l’Esclave dans leur version P.V.M. sont les instructions classiques de communication bloquante. Un rappel des 

procédures P.V.M. utilisées est fait dans l’annexe A. 

Dans les algorithmes du paragraphe précédent apparaissent l’envoi et la réception de quatre messages contenant 

des données ou des informations : 

– Message 1 : Valeurs de la solution sur les frontières de recouvrement du Maître vers l’Esclave ( Données ). 

– Message 2 : Message d’arrêt du Maître vers l’Esclave ( Information ). 

– Message 3 : Test de convergence et valeurs de la solution sur les frontières de recouvrement de l’Esclave 

vers le Maître ( Données ). 

– Message 4 : Solution de chaque sous-domaine de l’Esclave vers le Maître ( Données ). 

Pour pouvoir décrire l’implantation de ces messages, il est nécessaire de définir certaines variables ainsi que 

leur type ; ces variables sont listées par ordre alphabétique et un rappel global des variables utilisées se trouve 

dans l’annexe C : 

– CD P et CF P : INTEGER ; tableaux de taille N P ; CD P( I P ) contient le numéro du premier sous- 

3.7

domaine confié au processeur I P et CF P( I P ) le numéro du dernier ; 

– DIFF : DOUBLE PRECISION ; tableau de taille NSDOM qui contient pour chaque sous-domaine la norme 

de la différence entre deux itérés de Schwarz ; 

– I P : INTEGER ; numéro du processeur courant ( variant de 1 à N P pour P.V.M. ; 1 étant par convention 

le numéro du Maître ) ; 

– INFO P : INTEGER ; variable qui contient des informations sur le déroulement d’une instruction P.V.M. ; 

– N P : INTEGER ; nombre de processeurs ; 

– NDCY : INTEGER ; nombre de points dans la direction de l’axe des ordonnées = nombre de points d’une 

frontière de recouvrement ; 

– NSD : INTEGER ; nombre maximal de points par sous-domaine ; 

– NSDOM : INTEGER ; nombre de sous-domaines ; 

– NUMMES P : INTEGER ; numéro du message ; 

– TIDS P : INTEGER ; tableau de taille N P qui contient les numéros d’identification TID des processeurs ; 

TIDS P( 1 ) est le numéro du Maître ; 

– VALFRONSD : DOUBLE PRECISION ; tableau qui contient les valeurs de la solution sur les frontières de 

recouvrement ; 

– WSOLSD : DOUBLE PRECISION ; tableau de taille NSDOM*NSD qui contient la solution sur chaque 

sous-domaine. 

L’envoi du premier message du Maître vers tous les Esclaves est implanté avec l’instruction PVMFMCAST. 

Cette instruction permet d’envoyer un même message à plusieurs processeurs. Le message a le numéro 1. 

L’instruction PVMFMCAST est précédée par l’initialisation et la construction du message ( instructions 

PVMFINITSEND et PVMFPACK ). 

NUMMES_P = 1 

CALL PVMFINITSEND(PVMRAW,INFO_P) 

CALL PVMFPACK(....) 

CALL PVMFMCAST(N_P-1,TIDS_P(2),NUMMES_P,INFO_P) 

L’instruction PVMFMCAST est de nouveau utilisée pour l’envoi du message d’arrêt du Maître. Le message 

a le numéro 2. 

NUMMES_P = 2 


CALL PVMFMCAST(N_P-1,TIDS_P(2),NUMMES_P,INFO_P) 

Au début de sa boucle d’itération, Le processeur Esclave attend soit le message 1 s’il n’y a pas convergence, soit 

le message d’arrêt 2. Nous utilisons l’instruction PVMFRECV suivie d’une instruction PVMFBUFINFO 

qui teste le numéro du message reçu. Si ce numéro est 2, l’Esclave sort de la boucle d’itération sinon le message 

contient les valeurs de la solution sur les frontières de recouvrement et on les récupère par l’instruction 

PVMFUNPACK. 

CALL PVMFRECV(-1,-1,BUFID_P) 

CALL PVMFBUFINFO(BUFID_P,BYTES_P,MSGTAG_P,TID_P1,INFO_P) 

3.8

IF(MSGTAG_P.EQ.2) GOTO ’fin de l’itération de Schwarz’ 

CALL PVMFUNPACK(...) 

L’envoi des tests de convergence et des valeurs de la solution sur les frontières de recouvrement de l’Esclave 

vers le Maître est implanté par l’instruction PVMFSEND. 

NUMMES_P = 3 


CALL PVMFPACK(...) 

CALL PVMFSEND(TIDS_P(1),NUMMES_P,INFO_P) 

De son côté le Maître reçoit ce message en faisant une boucle sur l’ensemble des processeurs Esclaves. 

NUMMES_P = 3 

DO J_P=2,N_P 

CALL PVMFRECV(TIDS_P(J_P),NUMMES_P,INFO_P) 


ENDDO 

L’envoi du message final qui contient les solutions sur les sous-domaines est effectué de la même façon. 

4.3 Algorithme synchrone et M.P.I. 

Les variables de parallélisation utilisées pour M.P.I. diffèrent quelque peu de celles de P.V.M. ; une des principales 

différences est qu’avec M.P.I. les numéros T P des processeurs varient de 0 à N P-1, 0 étant le numéro 

du Maître appelé aussi root. 

Pour aider à la compréhension des techniques mises en œuvre, l’annexe B contient les routines M.P.I. utilisées 

ainsi que leurs paramètres d’appel. 

Pour développer l’algorithme synchrone avec M.P.I., nous aurions pu garder le même type de démarche qu’avec 

P.V.M. et reprendre les instructions correspondantes d’envoi et de réception de message. Nous avons préféré 

changer un peu l’approche en raisonnant sur un modèle plus SPMD que Maître-Esclaves et en utilisant les 

instructions de communication collective de M.P.I. : 

– le code du Maître et de l’Esclave est le même pour les calculs et les communications ; 

– tous les processeurs effectuent le test d’arrêt ; 

– la différence entre le rôle du Maître et le rôle de l’Esclave se situe au niveau du traitement de la solution 

( archivage, affichage ) 

Cette démarche a été possible grâce à la routine MPI ALLGATHERV qui permet de faire une diffusion 

de données sur tous les processeurs ; ainsi l’envoi des tests de convergence des processeurs et des valeurs de la 

solution sur les frontières de recouvrement est remplacé par une diffusion ; tous les processeurs peuvent faire le 

test de convergence globale et le message d’arrêt du maître disparaît. 

Le seul inconvénient de cette routine est la création de nouveaux tableaux qui contiennent différentes tailles 

et différents pointeurs dans des tableaux de données. 

3.9

Exemple 3.1. Si nous voulons par exemple transmettre le tableau DIFF de taille NSDOM, il faut construire 

le tableau NSDOMPRO ( nombre de sous-domaines par processeurs : taille N P ) et le tableau POINTNSDOM 

( tableau de pointeurs : taille N P ) ; POINTNSDOM( T P ) est la place dans DIFF du début des données 

provenant du processeur T P. 

DIFF 

NSDOMPRO 

POINTNSDOM 

2 

0 

1 2 3 4 

2 

2 

Dans le cas de 8 sous-domaines répartis de façon régulière sur 4 processeurs, NSDOMPRO contient ( 2, 2, 

2, 2 ) et POINTNSDOM ( 0, 2, 4, 6 ). 

La diffusion des tests de convergence se fait de la manière suivante : 

2 

4 

CALL MPI_ALLGATHERV(DIFF(CD_P(T_P)),NSDOMPRO(T_P),MPI_DOUBLE_PRECISION,DIFF,NSDOMPRO, 

& POINTNSDOM,MPI_DOUBLE_PRECISION,MPI_COMM_WORLD,INFO_P) 

La construction de tels tableaux n’est pas compliquée à réaliser mais nécessite une attention particulière pour 

éviter d’avoir des décalages dans les données. 

L’envoi de la solution WSOLSD au processeur Maître est réalisé par l’instruction MPI GATHERV : 

CALL MPI_GATHERV(WSOLSD,LARGEURSD(T_P),MPI_DOUBLE_PRECISION,WSOLSD,LARGEURSD, 

& POINTLARGEUR,MPI_DOUBLE_PRECISION,0,MPI_COMM_WORLD,INFO_P) 

Les variables LARGEURSD et POINTLARGEUR jouent le même rôle que NSDOMPRO et POINTNSDOM 

de l’exemple précédent. 

4.4 Quelques enseignements liés à l’utilisation de P.V.M. et M.P.I. pour développer les algorithmes synchrones. 

L’implantation de des algorithmes synchrones utilise les instructions classiques de communication bloquante 

et se fait assez facilement ; il est cependant important de toujours bien vérifier le numéro des messages envoyés 

et le contenu de ces messages pour ne pas se retrouver dans des situations de blocages ou de données erronées ; 

il est préférable aussi de vérifier le type et la taille de ces données. On a quelquefois des surprises en envoyant 

des INTEGER et en recevant des DOUBLE PRECISION. 

Pour cela l’envoi et la réception de messages simples sont utiles ; chaque processeur affiche ce qu’il envoie et 

ce qu’il reçoit et on vérifie la concordance des données. 

Ces enseignements restent bien sûr vrais pour le développement des algorithmes asynchrones. 

3.10 

2 

6

5 Mise en œuvre des algorithmes asynchrones 

Les algorithmes asynchrones diffèrent des algorithmes synchrones par l’absence de synchronisation au cours du 

calcul et par le fait que, moyennant certaines variantes exposées aux chapitres 1 et 2, un processeur relance une 

itération en utilisant les valeurs les plus récentes de la solution sur les frontières de recouvrement ; ces valeurs 

ont été calculées soit par le processeur lui-même, soit par les autres processeurs. Dans l’implémentation de la 

méthode alternée de Schwarz avec communication asynchrone chaque processeur va donc itérer sur les sousdomaines 

qui lui sont affectés en utilisant les valeurs disponibles de la solution sur les frontières de recouvrement. 

Il ne se préoccupe pas de savoir si ces valeurs de la solution proviennent de calculs de processeurs en retard ou 

en avance sur lui. 

Ce sont les récupérations des valeurs disponibles de la solution sur les frontières de recouvrement qui constituent 

la première partie de ce paragraphe. La deuxième partie est consacrée à la gestion de l’arrêt des calculs 

lorsqu’il y a convergence. Cette gestion est toujours effectuée par le processeur Maître qui va recevoir 

régulièrement des informations des processeurs Esclaves relatives à leur état de convergence. L’utilisation de 

P.V.M. et M.P.I. pour développer ces algorithmes asynchrones termine ce paragraphe. 

5.1 Le Maître et l’Esclave asynchrones. 

Le développement des algorithmes asynchrones parallèles consiste principalement à utiliser des réceptions non 

bloquantes pour récupérer les différentes données. Ces données se composent naturellement des valeurs de la 

solution sur les frontières de recouvrement mais aussi des indicateurs de convergence des processeurs Esclaves. 

L’efficacité des algorithmes asynchrones va dépendre de la bonne utilisation de ces communications et en 

particulier de leur fréquence. Il faut les placer au bon endroit dans le calcul pour qu’elles ne soient pas trop 

pénalisantes en temps ; de plus dans ce type de méthode il est recommandé d’utiliser les données disponibles les 

plus récentes. 

Nous avons donc mis au point trois types d’algorithmes asynchrones qui utilisent les différentes boucles 

d’itération ou les différentes phases de calcul qui peuvent intervenir lors de la résolution : 

– la boucle d’itération de Schwarz ; 

– la boucle d’itération qui peut être présente dans l’algorithme de résolution sur un sous-domaine ( méthode 

de relaxation ... ) 

– le traitement d’un bloc de composants du vecteur solution lors de de l’utilisation de méthodes directes pour 

la résolution sur un sous-domaine. 

Les algorithmes asynchrones implémentés sont : 

– un algorithme Basse Fréquence de Communication ( B.F.C. ) : un envoi des valeurs de la solution sur les 

frontières de recouvrement est effectué avant chaque résolution sur un sous-domaine et une réception non 

bloquante après chaque résolution. 

– un algorithme Moyenne Fréquence de Communication ( M.F.C. ) : un envoi des valeurs de la solution sur les 

frontières de recouvrement est toujours effectué avant chaque résolution sur un sous-domaine mais plusieurs 

réceptions non bloquantes ont lieu à l’intérieur de la résolution sur un sous-domaine. 

– un algorithme Haute Fréquence de Communication ( H.F.C. ) : plusieurs envois et plusieurs réceptions 

non bloquantes des valeurs de la solution sur les frontières de recouvrement se situent à l’intérieur de la 

résolution sur un sous-domaine. 

3.11

Les algorithmes généraux du Maître et de l’Esclave sont les suivants : 


◦ CALCUL 

◦ Réception non bloquante des tests de convergence des Esclaves [ Réception 3 ]. 


fait 

• Envoi du message de CONVERGENCE GLOBALE aux processeurs Esclaves [ Envoi 2 ]. 

• Réception de la solution calculée par chaque processeur Esclave [ Réception 4 ]. 

fin 

Algorithme 3.3 : Algorithmes Parallèles Asynchrones : le processeur Maître. 


◦ réception non bloquante du message de CONVERGENCE GLOBALE [ Réception 2 ]. 

◦ CALCUL 

◦ Envoi du test de convergence au processeur Maître [ Envoi 3 ]. 

fait 

• Envoi au processeur Maître de la solution calculée sur chaque sous-domaine 

traité par le processeur [ Envoi 4 ]. 

fin 

Algorithme 3.4 : Algorithmes Parallèles Asynchrones : le processeur Esclave. 

Dans ces algorithmes n’apparaissent que les communications non bloquantes qui concernent le test d’arrêt 

( messages 2 et 3 ) et le message final 4 qui rapatrie les solutions des Esclaves vers le Maître. Les communications 

non bloquantes des valeurs de la solution sur les frontières de recouvrement sont faites lors de la routine 

CALCUL ; c’est cette routine qui est différente suivant que l’on utilise l’une ou l’autre des variantes asynchrones 

de l’algorithme. On expose ci-dessous la présentation de ces trois variantes de la routine CALCUL, développées 

dans le cadre de l’utilisation de la méthode de relaxation pour la résolution sur un sous-domaine. 

3.12

◦ pour chaque sous-domaine traité par le processeur faire 

• Réception non bloquante des valeurs de la solution 

sur les frontières de recouvrement [ Réception 1 ]. 

• (* Résolution *) 

tant que non CONVERGENCE faire 

- Relaxation. 

fait. 

• Envoi des valeurs de la solution sur les frontières de recouvrement [ Envoi 1 ]. 

fait 

Algorithme 3.5 : Algorithmes Parallèles Asynchrones : la routine CALCUL Basse Fréquence de Communication ( B.F.C. ). 




- Réception non bloquante des valeurs de la solution 


- Relaxation. 

fait. 

• Envoi des valeurs de la solution sur les frontières de recouvrement [ Envoi 1 ]. 

fait 

Algorithme 3.6 : Algorithmes Parallèles Asynchrones : la routine CALCUL Moyenne Fréquence de Communication 

( M.F.C. ). 




- Réception non bloquante des valeurs de la solution 


- Relaxation. 

- Envoi des valeurs de la solution sur les frontières de recouvrement [ Envoi 1 ]. 

fait. 

fait 

Algorithme 3.7 : Algorithmes Parallèles Asynchrones : la routine CALCUL Haute Fréquence de Communication 

( H.F.C. ). 

3.13

Il faut noter que les versions des algorithmes parallèles asynchrones B.F.C. et M.F.C. sont les implémentations 

des algorithmes asynchrones décrits dans le chapitre 1 tandis que la version H.F.C. est celle qui se rapproche le 

plus des algorithmes itératifs asynchrones avec communication flexible du chapitre 2. 

Ces versions de la routine CALCUL montrent les différentes possibilités de remise à jour des itérés partiels 

dans le cadre de l’utilisation de la méthode de relaxation. La présence dans cet exemple des deux boucles 

d’itération permet de faire varier de manière simple les fréquences de communication. 

Dans le cas d’utilisation d’une méthode directe, cette souplesse d’utilisation due à l’asynchronisme peut 

se retrouver par exemple lorsqu’un processeur effectue une demande de communication lors de la phase de 

remontée ; dans ce contexte asynchrone, il y aura alors communication pour partie des valeurs de la solution 

qui viennent juste d’être calculées dans cette phase de remontée et, pour les autres composantes, des valeurs 

calculées à l’itération précédente. 

Nous verrons dans les chapitres suivants les différentes performances de ces méthodes sur des problèmes de 

convection-diffusion ou sur le problème de la cavité entraînée nécessitant la résolution du problème de Navier- 

Stokes. 

Remarque 3.1. Pour les algorithmes asynchrones, la communication des valeurs de la solution sur les 

frontières de recouvrement se fait entre processeurs voisins directement, sans passer par le Maître. Ainsi l’envoi 

du message 1 d’un processeur qui a deux voisins est en fait constitué par deux envois séparés des valeurs de 

la solution sur les frontières de recouvrement qui intéressent ces processeurs ; les valeurs de la solution sur la 

frontière de gauche pour le voisin de gauche, les valeurs de la solution sur la frontière de droite pour le voisin 

de droite ; il en est de même pour une réception non bloquante du message 1. 

Remarque 3.2. On peut obtenir d’autres fréquences de communication qui se situent entre la moyenne 

fréquence et la haute fréquence en reprenant l’algorithme asynchrone HFC et en effectuant l’envoi du message 

1 tous les I relaxations où I est un paramètre variable fixé par l’utilisateur. Cela permet de réduire le nombre 

d’envois qui sont pénalisants en temps ( 35 µs de latence pour une communication ) et qui peuvent être source 

de débordement de buffer comme nous le verrons par la suite. 

5.2 Test d’arrêt et Terminaison. 

La gestion de la terminaison du calcul s’avère plus compliquée pour les algorithmes asynchrones que pour les 

méthodes synchrones. Il n’y a en effet plus de synchronisation après chaque itération comme dans les algorithmes 

synchrones, cette synchronisation pouvant être couplée avec le test d’arrêt. 

Pour remédier à cette difficulté, chaque processeur dispose d’une variable TEST que le processeur met à zéro 

si l’itération de Schwarz sur ses sous-domaines a convergé et qu’il met à un sinon. Un processeur Esclave fera 

parvenir cette valeur au processeur Maître après chacune de ses itérations de Schwarz. 

En mémorisant ces tests de convergence dans un tableau et en effectuant la somme des éléments de ce tableau, 

le Maître peut, en comparant cette somme à zéro, savoir si l’algorithme a convergé ; il peut alors prévenir les 

Esclaves en leur envoyant son message d’arrêt. 

Ce système de test d’arrêt, simple et facile à écrire comme nous le verrons par la suite, est satisfaisant pour 

la résolution de la plupart des problèmes qui sont traités par les algorithmes parallèles ( problèmes de grande 

taille où le volume de calcul par processeur est important ). 

3.14

L’utilisation des algorithmes asynchrones pour résoudre des problèmes de petite taille entraîne des difficultés 

liées au test de convergence. Nous pouvons par exemple rencontrer la situation critique d’un processeur P qui 

n’a pas reçu de valeurs de la solution des frontières de recouvrement depuis longtemps. Ses conditions aux limites 

n’évoluant pas, il converge et prévient le Maître par le message m. Pendant que le Maître termine ses résolutions 

et teste la convergence globale, le processeur P reçoit de nouvelles conditions aux limites qui changent son état 

de convergence. Si le Maître a conclu à une convergence globale grâce entre autre au message m, le message 

d’arrêt du Maître stoppe les processeurs Esclaves et donc le calcul se termine trop tôt. 

Au cours du développement des algorithmes asynchrones, cette situation critique où le calcul est arrêté trop 

rapidement est apparu seulement lors de la résolution de problèmes de petite taille ou lorsqu’un seul sousdomaine 

est confié à un processeur. Par contre, lorsque des problèmes de grande taille sont considérés ou 

lorsque la répartition des sous-domaines par processeur est supérieure à deux, le test d’arrêt proposé permet 

d’obtenir des solutions aussi bonnes que les solutions obtenues à l’aide d’algorithmes séquentiels ou synchrones. 

Cependant on peut être amener à résoudre des problèmes de petite taille, ne serait-ce que pour mettre au point 

les algorithmes. Pour remédier au problème de la terminaison trop rapide rencontré lors la situation critique, 

nous avons imaginé deux méthodes de ”récupération” qui servent lors du développement : 

– la première solution appelée test à retardement consiste à retarder la mise à zéro de la variable TEST 

en changeant le critère de convergence d’un processeur : un processeur a convergé lorsque l’itération de 

Schwarz a convergé successivement un nombre N de fois ; il suffit pour mettre en place cette solution de 

donner comme valeur initiale N à la variable TEST et de soustraire 1 à chaque convergence. 

– la deuxième solution consiste à demander aux esclaves une confirmation de leur convergence et de relancer 

les itérations en cas de non convergence. 

Remarque 3.3. On passe facilement du test à retardement au test simple en initialisant la variable TEST 

à 1. 

Remarque 3.4. La seconde solution est lourde à mettre en œuvre et demande un nombre de communications 

important entre le Maître et les Esclaves. Ces communications qui diminuent le caractère asynchrone de 

l’algorithme sont très pénalisantes en temps ; il faut dans la mesure du possible éviter d’appliquer cette solution. 

Un exemple d’implémentation de la terminaison avec le test à retardement est donné au paragraphe 5.5. 

5.3 Algorithmes asynchrones et P.V.M. 

De façon générale une réception non bloquante est implémentée à l’aide de l’instruction PVMFNRECV qui 

vérifie si un message est arrivé. Les trois réceptions non bloquantes sont : 

– Message 1 : Valeurs de la solution sur les frontières de recouvrement provenant d’un processeur voisin 

( Données ). 

– Message 2 : Message d’arrêt du Maître vers l’Esclave ( Événement ). 

– Message 3 : Test de convergence de l’Esclave vers le Maître ( Données ). 

Nous avons par conséquent deux types de messages : message de données ou message événementiel. Il est 

clair que pour le message de données, nous voulons avoir les valeurs les plus récentes des données ; ceci est 

important pour rester dans le cadre théorique de la contraction développé dans le chapitre 1 et de l’ordre partiel 

étudié dans le chapitre 2. Par contre c’est l’événement ”arrivée du message d’information” qui nous intéresse. 

Le traitement de ces deux réceptions non bloquantes est donc légèrement différent. 

3.15

Pour les messages de données, nous pouvons être dans le cas où plusieurs messages contenant les mêmes 

données ont été envoyés et sont en attente de réception. Les données se trouvent dans une file de buffer et les 

données intéressantes se trouvent à la fin de cette file. Il faut donc rajouter un traitement au PVMFNRECV 

pour obtenir les données les plus récentes en vidant cette file de buffers. 

Ainsi les messages qui contiennent les variables relatives à l’état de convergence des Esclaves ( variable TEST ) 

sont réceptionnés de la manière suivante : 

NUMMES_P = 3 

DO J_P=2,N_P 

10 CALL PVMFNRECV(TIDS_P(J_P),NUMMES_P,INFO_P) 

IF(INFO_P.GT.0) THEN 

CALL PVMFUNPACK(INTEGER4,TEST(J_P),1,1,INFO_P) 

GOTO 10 

ENDIF 

ENDDO 

Après l’exécution de ces instructions, les données les plus récentes des tests de convergence des processeurs 

se trouvent dans le tableau TEST. En utilisant la même technique, chaque processeur reçoit de manière non 

bloquante les valeurs les plus récentes de la solution sur les frontières de recouvrement de ses voisins. 

Cette technique n’est pas nécessaire pour le message 2 d’arrêt du Maître reçu par l’Esclave au moyen d’un 

PVMFNRECV simple et retourne au début de la boucle d’itération si ce message n’est pas arrivé. 

NUMMES_P = 2 

CALL PVMFNRECV(TIDS_P(1),NUMMES_P,INFO_P) 

IF(INFO_P.EQ.0) GOTO ’début de l’itération de Schwarz’ 

Les envois des messages s’effectuent avec la routine PVMFPSEND ; ainsi le processeur émetteur n’attend 

pas la confirmation du destinataire de l’arrivée du message pour continuer les calculs. 

Le message 4 de rapatriement de la solution est le seul message synchrone et est réalisé de la même manière 

que dans les algorithmes synchrones. 

3.16

Exemple 3.2. la routine CALCUL de l’algorithme asynchrone Moyenne Fréquence de Communication s’écrit 

sous la forme suivante : 

SUBROUTINE CALCUL(...) 

include ’fpvm3.h’ 

C Déclaration de variables 

..... 

10 CONTINUE 

C Réception non bloquante des valeurs de la solution sur les frontières 

C de recouvrement envoyées par le voisin de gauche I_P-1 

IF(CD_P(I_P).NE.1) THEN 

NUMMES_P=70+I_P-1 

20 CALL PVMFNRECV(TIDS_P(I_P-1),NUMMES_P,INFO_P) 



GOTO 20 

ENDIF 

ENDIF 

C Réception non bloquante des valeurs de la solution sur les frontières 

C de recouvrement envoyées par le voisin de droite I_P+1 

IF(CF_P(I_P).NE.NSDOM) THEN 

NUMMES_P=50+I_P+1 

30 CALL PVMFNRECV(TIDS_P(I_P+1),NUMMES_P,INFO_P) 



GOTO 30 

ENDIF 

ENDIF 

C Prise en compte des conditions limites sur chacun des sous-domaines 

C ( modification du second membre ) 

.... 

C Relaxation 

CALL RELAXATION(...) 

C Test d’arr^et - > DIFFRELAX 

IF(DIFFRELAX.GT.EPSIRELAX) GOTO 10 

C Envoi des valeurs de la solution sur les frontières de recouvrement 

C au voisin de gauche I_P-1 

IF(CD_P(I_P).NE.1) THEN 

3.17

NUMMES_P=50+I_P 

CALL PVMFPSEND(...) 

ENDIF 

C Envoi des valeurs de la solution sur les frontières de recouvrement 

C au voisin de droite IP+1 

IF(CF_P(I_P).NE.NSDOM) THEN 

NUMMES_P=70+I_P 

CALL PVMFPSEND(...) 

ENDIF 

RETURN 

END 

Dans cet exemple les messages envoyés d’un processeur vers son voisin de gauche ont un numéro qui est la 

somme de 50 et du numéro du processeur ; les messages envoyés d’un processeur vers son voisin de droite ont 

un numéro qui est la somme de 70 et du numéro du processeur. Ceci permet de gérer de façon plus ou moins 

dynamique les numéros des messages et de se retrouver dans les messages. 

5.4 Algorithmes asynchrones et M.P.I. 

L’utilisation de M.P.I. pour les algorithmes asynchrones s’avère délicate en ce qui concerne le choix des 

instructions de communication non bloquante. En effet M.P.I. propose différents modes de communication. 

Dans un premier temps, une adaptation des programmes P.V.M. a été réalisée en remplaçant les réceptions 

non bloquantes PVMFNRECV par des MPI IRECV. Cette solution s’est avérée inefficace car les messages 

étaient pris en compte longtemps après leur émission ; en particulier cet effet était pénalisant pour le message 

d’arrêt : les processeurs Esclaves effectuaient beaucoup trop de résolutions inutiles avant d’être arrêtés. 

Nous nous sommes orientés vers le mode de communication persistante ; ce mode était d’ailleurs mieux adapté 

à l’approche asynchrone, la communication persistante pouvant être assimilée à un port de communication ou 

”demi-canal”. Les communications persistantes se décomposent en deux parties : une phase d’initialisation et 

d’activation du ”canal” avant les résolutions et une phase de test et de relance au cours des calculs. 

Dans les programmes, l’envoi est mis en place par un MPI ISEND et la réception par une communication 

persistante. Les routines M.P.I. utilisées pour cette réception sont : 

– MPI RECV INIT et MPI START pour l’initialisation et l’activation. 

– MPI TEST et MPI START pour le test et la relance s’il y a eu réception. 

3.18

Si on considère, l’exemple des tests de convergence des Esclaves, ces derniers effectuent une émission de la 

manière suivante : 

NUMMES_P = 3 

DEST = 0 

CALL MPI_ISEND(TEST(T_P),1,MPI_INTEGER,DEST,NUMMES_P, 

& MPI_COMM_WORLD,REQ_P(J_P),INFO_P). 

Le Maître initialise la réception avec une boucle sur les processeurs Esclaves : 

DO J_P=1,N_P-1 

NUMMES_P = 3 

SOURCE = J_P 

CALL MPI_RECV_INIT(TEST(J_P),1,MPI_INTEGER,SOURCE,NUMMES_P, 

& MPI_COMM_WORLD,REQ_P(SOURCE),INFO_P) 

CALL MPI_START(REQ_P(J_P),INFO_P) 

ENDDO 

et il teste la réception et la relance en cas de test positif comme suit : 

DO J_P=1,N_P-1 

SOURCE = J_P 

CALL MPI_TEST(REQ_P(SOURCE),LOG_P,STATUS_REQ_P(1,SOURCE),INFO_P) 

IF(LOG_P) CALL MPI_START(REQ_P(SOURCE),INFO_P) 

ENDDO 

Dans cette séquence la variable REQ P contient le numéro de la requête ( voir annexes ). 

L’instruction de relance IF(LOG_P) CALL MPI_START(REQ_P(SOURCE),INFO_P) réactive la communication s’il 

y a eu réception. Elle est nécessaire pour le bon déroulement de l’algorithme ; son absence entraîne une unique 

réception des données et donc perturbe fortement le programme ( dans l’exemple des tests de convergence, le 

Maître ne recevra que les tests de la première itération ; il n’y aura jamais convergence ! ). 

Exemple 3.3. Dans l’algorithme asynchrone Moyenne Fréquence de Communication, les communications 

des valeurs de la solution sur les frontières de recouvrement sont réalisées comme suit : 

Pour la phase d’initialisation au début du programme : 

C Initialisation de la réception des valeurs de la solution des frontières 

C de recouvrement envoyées par le voisin de gauche T_P-1 

IF(CD_P(T_P).NE.1) THEN 

NUMMES_P = 10 

CALL MPI_RECV_INIT(VALFRONSD(1),2*NDCY, 

& MPI_DOUBLE_PRECISION,T_P-1,NUMMES_P, 

& MPI_COMM_WORLD,REQ_P(NUMMES_P+T_P-1),INFO_P) 

3.19

CALL MPI_START(REQ_P(NUMMES_P+T_P-1),INFO_P) 

ENDIF 

C Initialisation de la réception des valeurs de la solution des frontières 

C de recouvrement envoyées par le voisin de droite T_P+1 

IF(CF_P(T_P).NE.NSDOM) THEN 

NUMMES_P = 20 

CALL MPI_RECV_INIT(VALFRONSD((NSDOMPRO(T_P)+1)*2*NDCY+1), 

& 2*NDCY,MPI_DOUBLE_PRECISION,T_P+1,NUMMES_P, 

& MPI_COMM_WORLD,REQ_P(NUMMES_P+T_P+1),INFO_P) 

CALL MPI_START(REQ_P(NUMMES_P+T_P+1),INFO_P) 

ENDIF 

dans la routine CALCUL : 

SUBROUTINE CALCUL(...) 

include ’mpif.h’ 

C Variables 

...... 

10 CONTINUE 

C Test de réception des valeurs de la solution des frontières 

C de recouvrement 


NUMMES_P = 10 

CALL MPI_TEST(REQ_P(NUMMES_P+T_P-1),LOG_P, 

& STATUS_REQ_P(1,NUMMES_P+T_P-1),INFO_P) 

IF(LOG_P) CALL MPI_START(REQ_P(NUMMES_P+T_P-1),INFO_P) 

ENDIF 


NUMMES_P = 20 

CALL MPI_TEST(REQ_P(NUMMES_P+T_P+1),LOG_P, 

& STATUS_REQ_P(1,NUMMES_P+T_P+1),INFO_P) 

IF(LOG_P) CALL MPI_START(REQ_P(NUMMES_P+T_P+1),INFO_P) 

ENDIF 

C Prise en compte des conditions limites sur chacun des sous-domaines 

C ( modification du second membre ) 

.... 

3.20

C Relaxation 

CALL RELAXATION(...) 

C Test d’arr^et - > DIFFRELAX 

IF(DIFFRELAX.GT.EPSIRELAX) GOTO 10 

C Envoi des valeurs de la solution des frontières de recouvrement 

C au voisin de gauche T_P-1 


NUMMES_P = 20 

CALL MPI_ISEND(VALFRONSD(2*NDCY+1),2*NDCY, 

& MPI_DOUBLE_PRECISION,T_P-1, 

& NUMMES_P,MPI_COMM_WORLD,REQ_P(NUMMES_P+T_P),INFO_P) 

ENDIF 

C Envoi des valeurs de la solution des frontières de recouvrement 

C au voisin de droite T_P+1 


NUMMES_P = 10 

CALL MPI_ISEND(VALFRONSD(2*NDCY*NSDOMPRO(T_P)+1), 

& 2*NDCY,MPI_DOUBLE_PRECISION,T_P+1, 

& NUMMES_P,MPI_COMM_WORLD,REQ_P(NUMMES_P+T_P),INFO_P) 

ENDIF 

RETURN 

END 

Le rapatriement des solutions sur les sous-domaines est réalisée de la même manière que dans le cas synchrone 

en utilisant la routine MPI GATHERV. 

5.5 Exemple de gestion de la terminaison. 

Dans ce paragraphe, nous décrivons la mise en place du test d’arrêt pour les algorithmes asynchrones. Cette 

implantation est le même dans son principe pour P.V.M. ou M.P.I. 

Les variables utilisées sont : 

– CONV : INTEGER ; nombre de convergences successives de l’itération de Schwarz nécessaire pour qu’un 

processeur converge ; cette variable est initialisée à 1 si on veut utiliser le test simple. 

– DIFFSUP : DOUBLE PRECISION ; variable locale à un processeur contenant après chaque itération de 

Schwarz le max sur les sous-domaines du processeur de la norme de la différence entre deux itérés ; 

– EPSISC : DOUBLE PRECISION ; seuil de convergence de l’itération de Schwarz ; 

– SOMMETEST : INTEGER ; variable du processeur Maître qui contient le somme des éléments du tableau 

TEST ; si cette somme est égale à zéro, il y a convergence globale. 

– TEST : INTEGER ; tableau de taille N P qui contient l’état de convergence d’un processeur ; les éléments 

3.21

de ce tableau sont initialement égaux à CONV ; 

En utilisant P.V.M. la gestion de la terminaison s’écrit dans les algorithmes du Maître et de l’Esclave : 


◦ CALCUL 

IF(DIFFSUP.LE.EPSISC) THEN 

IF(TEST(I P).NE.0) TEST(I P)=TEST(I P)-1 

ELSE 

TEST(I P)=CONV 

ENDIF 

◦ Réception non bloquante des tests de convergence des Esclaves [ Réception 3 ] 

NUMMES P = 3 

DO J P=2,N P 

10 CALL PVMFNRECV(TIDS P(J P), NUMMES P,INFO P) 

IF(INFO P.GT.0) THEN 

CALL PVMFUNPACK(INTEGER4, TEST(J P),1,1,INFO P) 

GOTO 10 

ENDIF 

ENDDO 


SOMMETEST=0 

DO J P=1,N P 

SOMMETEST=SOMMETEST+TEST(J P) 

CONTINUE 

IF(SOMMETEST.EQ.0) THEN ”CONVERGENCE GLOBALE” 

fait 

• Envoi du message de CONVERGENCE GLOBALE aux processeurs Esclaves [ Envoi 2] 

• Réception de la solution de chaque processeur Esclave [ Réception 4 ] 

fin 

Algorithme 3.8 : Algorithmes Parallèles Asynchrones : le processeur Maître avec test d’arrêt. 

3.22


◦ réception non bloquante du message de CONVERGENCE GLOBALE [ Réception 2 ] 

◦ CALCUL 

IF(DIFFSUP.LE.EPSISC) THEN 

IF(TEST(I P).NE.0) TEST(I P)=TEST(I P)-1 

ELSE 

TEST(I P)=CONV 

ENDIF 

◦ Envoi du test de convergence au processeur Maître [ Envoi 3 ] 

NUMMES P = 3 

CALL PVMFPSEND(TIDS P(1), NUMMES P, TEST(I P),1,INTEGER,INFO P) 

fait 

• Envoi au processeur Maître de la solution sur chaque sous-domaine 

traité par le processeur [ Envoi 4 ] 

fin 

Algorithme 3.9 : Algorithmes Parallèles Asynchrones : le processeur Esclave avec test d’arrêt. 

3.23

3.24



244. 

2. J. Bernussou, F. Le Gall and G. Authié, About some iterative synchronous and asynchronous methods for 

Markov chain distribution computation, Proceedings of the 10-th IFAC World Congress (1987). 

3. D.P. Bertsekas and D. El Baz, Distributed asynchronous relaxation methods for convex network flow problems, 

SIAM J. on Control and Optimization, 25 (1987), pp. 74–85. 

4. D. P. Bertsekas, D. Castañon, J. Eckstein and S. Zenios, Parallel computing in network optimization, Handbooks 

in Operation Research and Management Science, 7 (1995), pp. 331–399 

5. E. Chajakis and S.A. Zenios, Synchronous and asynchronous implementations of relaxation algorithms for 

nonlinear network optimization, Parallel Computing, 17 (1991), pp. 873–894. 


7. D. El Baz, Asynchronous implementation of relaxation and gradient algorithms for convex network flow 

problems, Parallel Computing, 19 (1993), 1019–1028. 

8. D. El Baz, Parallel iterative algorithms for the solution of Markov systems, 33 rd IEEE Conference on 

Decision and Control, Orlando, U.S.A (1994), pp. 2524–2527. 

9. D. El Baz, P. Spitéri, J.C. Miellou and D. Gazen, Asynchronous iterative algorithms with flexible communication 

for nonlinear network flow problems, Journal of Parallel and Distributed Computing, 38 (1996), 

pp. 1–15. 

10. D. El Baz, Asynchronous gradient algorithms for a class of convex separable network flow problems, Computational 

Optimization and Applications, 5 (1996), pp. 187–205. 

11. D. El Baz, D. Gazen, J.C. Miellou and P. Spitéri, Mise en œuvre de méthodes itératives asynchrones avec 

communication flexible, Calculateurs Parallèles, 8 n ◦ 4 (1996). 

12. D. El Baz, P. Spitéri and J.C. Miellou, Distributed asynchronous iterative methods with order intervals for 

a class of nonlinear optimization problems, to appear in Journal of Parallel and Distributed Computing. 

13. L. Giraud, Implantations parallèles de méthodes de sous-domaines synchrones et asynchrones pour la 

résolution de problèmes aux limites, Thèse de Doctorat de l’Institut National Polytechnique de Toulouse, 

(1991). 

14. L. Giraud and P. Spitéri, Implementations of parallel solutions for nonlinear boundary value problems, 

Parallel Computing’91 Advances in Parallel Computing, Evans, Joubert, Liddel ed., Amsterdam : North- 

Holland, (1992), pp. 203-211. 

15. J. Julliand, G.R. Perrin et P. Spitéri, Simulations d’exécutions parallèles d’algorithmes de relaxation asynchrone., 

Rapport ERA CNRS de Mathématiques n ◦ 070 654, Université de Besançon, (1980). 

16. J. Julliand, G.R. Perrin et P. Spitéri, Simulations de types de communication appliqués à des algorithmes 

numériques, Rapport ERA CNRS Micro-système et Robotique n ◦ 070 906, Université de Besançon, (1981). 

17. J. Julliand, G.R. Perrin et P. Spitéri, Simulations d’exécutions parallèles d’algorithmes numériques asynchrones, 

1ère conférence AMSE, Lyon, 1981 et communication au colloque d’Analyse numérique d’Aussois, 

(1981). 



LCS report 1994-16, (1994). 

3.25

20. J.M. Perraudin, Résolution d’EDP non-linéaires par implantation parallèle d’une méthode de sous-domaines 

avec recouvrement, Rapport de stage de troisième année, E.N.S.E.E.I.H.T.-Informatique, (1993). 

21. J.L. Rosenfeld, A case study on programming for parallel processors, I.B.M., Thomas J. Watson, Research 

report, n ◦ RC-64, U.S.A. (1967). 

22. H. Songoro, Résolution numérique du recuit micro-onde 1D et 2D, Rapport de stage de troisième année, 

E.N.S.E.E.I.H.T.-Informatique, (1994). 



24. A. Uresin and M.Dubois, Parallel asynchronous algorithms for discrete data, Journal of the association for 

computing machinery, vol. 37, n ◦ 3 (1990), pp. 558–606. 

25. S. Zenios and R. Lasken, The Connection Machines CM-1 and CM-2 : solving nonlinear network problems, 

International Conference on Supercomputing, St Malo, France, (1988), pp. 648–658. 

26. S. Zenios and J. Mulvey, A distributed algorithm for convex network optimization problems, Parallel Computing, 

6 (1988), pp. 45–56. 

3.26

Chapitre 4 

Application des algorithmes 

asynchrones pour la résolution de 

problèmes de convection-diffusion 

linéaires et non-linéaires. 

Introduction. 

Les problèmes de convection-diffusion sont des problèmes qui apparaissent dans de nombreux domaines 

comme la mécanique des fluides, la finance ... La discrétisation des tels problèmes conduit à la résolution 

de grands systèmes d’équations. Dans ce contexte l’introduction d’algorithmes parallèles utilisant des méthodes 

de décomposition de domaines s’avère être très intéressante ( voir [1] ). 

La méthode alternée de Schwarz parallélisée avec les algorithmes synchrones et asynchrones décrits au chapitre 

1 ou avec les algorithmes itératifs asynchrones avec communication flexible exposés au chapitre 2 est tout à fait 

adaptée à la résolution d’un grand nombre de problèmes qui font intervenir l’équation de convection-diffusion. 

Dans le but d’illustrer l’approche théorique des chapitres 1 et 2, sont considérés le problème linéaire classique 

de convection-diffusion et différents problèmes non-linéaires aux limites qui dérivent du problème classique 

perturbé par un opérateur monotone non décroissant et diverses conditions aux limites. Des problèmes aux 

limites analogues ont été étudiés par différents chercheurs dans le cadre des algorithmes asynchrones classiques 

analysés au moyen des techniques de contraction ( voir [2], [3], [11], [14], [16] ). 

La discrétisation de tels problèmes en utilisant un schéma de discrétisation à cinq points pour le Laplacien 

et un schéma décentré adéquat pour la discrétisation des dérivées premières conduit à une matrice qui est une 

M-matrice. En perturbant cet opérateur par un opérateur monotone non décroissant, nous restons dans le cadre 

d’application des algorithmes asynchrones classiques ou à communication flexible. 

L’utilisation de schémas décentrés pour la résolution des problèmes de convection-diffusion réduit les phénomènes 

d’instabilité numérique en cas de forte convection. Ces schémas décentrés introduisent un autre aspect intéressant 

4.1

de cette étude ; les expérimentations numériques ont montré que si la méthode de résolution est une méthode 

de relaxation alors le nombre de relaxations était très différent suivant le sens de parcours des points de la grille 

au cours de la relaxation. En utilisant les techniques de discrétisation évoquées précédemment, il apparaît que 

la matrice de discrétisation obtenue est quasiment une matrice triangulaire. Ainsi une méthode de relaxation 

pour résoudre le système sur chaque sous-domaine et un parcours des points dans le bon sens, correspond à une 

méthode quasi-directe et converge en un faible nombre d’itérations. 

Le premier paragraphe de ce chapitre présente des exemples de problèmes où apparaît l’équation de convectiondiffusion 

et qui rentrent dans le cadre d’application des algorithmes asynchrones. Nous considérons deux classes 

de problèmes à résoudre selon la discrétisation du terme de convection par des schémas de discrétisation décentrés 

ou par des schémas de discrétisation centrés. Si les schémas de discrétisation sont des schémas décentrés, nous 

montrons que nous sommes dans le cadre d’application aussi bien des algorithmes asynchrones et synchrones 

classiques que dans celui des algorithmes asynchrones avec communication flexible. Par contre l’utilisation de 

schémas de discrétisation centrés, conduit à des problèmes où les hypothèses énoncées dans les chapitres 1 et 

2 pour l’application des algorithmes synchrones et asynchrones classiques et des algorithmes asynchrones avec 

communication flexible sont vérifiées sous certaines conditions que l’on précisera. 

Par la suite nous présentons différents résultats numériques de résolution d’un problème linéaire et d’un 

problème non-linéaire sur l’I.B.M. SP2, pour plusieurs maillages et différentes valeurs du coefficient de diffusion 

ν. Nous utilisons pour ces résolutions l’implantation à l’aide de P.V.M. et de M.P.I. des algorithmes synchrones ou 

asynchrones introduite au chapitre 3. La mise en place d’un algorithme séquentiel, d’un algorithme synchrone et 

des trois types d’algorithmes asynchrones permet de faire des comparaisons de performances entre ces différents 

algorithmes. 

Une synthèse des résultats ainsi qu’une comparaison entre les résultats obtenus avec P.V.M. et ceux obtenus 

avec M.P.I. terminent le présent chapitre. 

4.2

1 Cadre théorique pour le problème de convection-diffusion. 

Dans ce paragraphe, nous considérons des problèmes de convection-diffusion linéaires et non-linéaires pour lesquels 

nous exposons un cadre théorique général qui permet de montrer la convergence des algorithmes parallèles 

asynchrones classiques ou à communication flexible. 

Comme nous l’avons vu dans les chapitres 1 et 2, il suffira de montrer que l’opérateur Λ qui gouverne le 

problème s’écrit sous la forme 

Λ(X) = AX + φ(X) 

où A est la matrice de discrétisation du problème et est une M-matrice et φ est un opérateur monotone 

non décroissant ; ainsi la convergence des algorithmes parallèles asynchrones classiques et la convergence des 

algorithmes itératifs à communication flexible sont assurées. 

1.1 Cas de la discrétisation décentrée du terme de convection. 

1.1.1 Le problème linéaire de convection-diffusion. 

Considérons le problème linéaire classique de convection-diffusion : 

⎧ 

⎪⎨ 

⎪⎩ 

Trouver u ∈ H 1 0(Ω) solution de 

−ν∆u + a ∂u ∂u 

∂x + b ∂y + cu = f, dans Ω 

u = 0 sur ∂Ω 

où c ≥ 0, ν > 0 et Ω ⊂ IR 2 , f est une fonction de L 2 (Ω). 

Dans le but de simplifier la présentation, un maillage uniforme de Ω est considéré ; le pas de discrétisation est 

noté h. 

Dans un premier temps, une numérotation lexicographique des points du maillage est considérée. La discrétisation 

des opérateurs apparaissant dans le problème (4.1) est effectuée selon les règles suivantes : 

- le Laplacien est discrétisé en utilisant le schéma classique de discrétisation à cinq points ; 

- les dérivées premières sont discrétisées selon un schéma décentré qui tient compte du signe des coefficients 

a et b. Les schémas sont les suivants ⎧ : 

⎨ 

+ O(h), si a > 0, 

∂u 

∂x = 

∂u 

∂y = 

⎩ 

⎧ 

⎨ 

⎩ 

u(x,y)−u(x−h,y) 

h 

u(x+h,y)−u(x,y) 

h 

u(x,y)−u(x,y−h) 

h 

u(x,y+h)−u(x,y) 

h 

+ O(h), si a < 0. 

+ O(h), si b > 0, 

+ O(h), si b < 0. 

On obtient compte tenu de (4.2) pour l’équation de convection-diffusion les schémas de discrétisation : 

si a > 0 et b > 0 : 

−{ν+bh} u(x, y−h)−{ν+ah} u(x−h, y)+[4ν+{a+b}h+ch 2 ] u(x, y)−νu(x+h, y)−νu(x, y+h) = h 2 f(x, y) 

si a > 0 et b < 0 : 

−νu(x, y−h)−{ν+ah} u(x−h, y)+[4ν+{a−b}h+ch 2 ] u(x, y)−νu(x+h, y)−{ν−bh} u(x, y+h) = h 2 f(x, y) 

4.3 

(4.1) 

(4.2)

si a < 0 et b > 0 : 

−{ν+bh}u(x, y−h)−νu(x−h, y)+[4ν+{−a+b}h+ch 2 ]u(x, y)−{ν−ah}u(x+h, y)−νu(x, y+h) = h 2 f(x, y) 

si a < 0 et b < 0 : 

−νu(x, y−h)−νu(x−h, y)+[4ν−{a+b}h+ch 2 ] u(x, y)−{ν−ah} u(x+h, y)−{ν−bh} u(x, y+h) = h 2 f(x, y) 

Proposition 4.1. Soit A la matrice de discrétisation du problème (4.1). Si c est strictement positif alors A 

est une M-matrice. 

Dmonstration. Selon les schémas de discrétisation définis par (4.2), on vérifie par un simple calcul que les 

éléments hors diagonaux de la matrice A sont non positifs et que les éléments diagonaux de A sont positifs et 

ce quelque soit le signe de a et de b ; donc A est une Z-matrice. Comme c est strictement positif, A est une 

matrice à diagonale dominante stricte et donc une M-matrice. 

Remarque 4.1. dans le cas où c est égal à zéro, on vérifie par la même technique que A est une Z-matrice 

irréductible à diagonale dominante quelque soit le signe de a et de b ; ce qui implique que A est une M-matrice 

( voir [11] ). 

Dans un second temps, considérons une numérotation rouge-noir des points du maillage et notons ˙ A la matrice 

de discrétisation correspondante. 

Proposition 4.2. Si c est strictement positif alors ˙ A est une M-matrice. 

Dmonstration. Pour les schémas de discrétisation définis par (4.2), ˙ A est de façon évidente une Z-matrice. 

De plus ˙ A est aussi une matrice à diagonale dominante stricte ; donc ˙ A est une M-matrice. 

Remarque 4.2. Nous pouvons montrer directement que ˙ A est une M-matrice dès que A est une M-matrice. 

En effet ˙ A est obtenue à partir de A par une permutation qui préserve le signe des coefficients diagonaux et 

hors diagonaux. Nous avons ˙ A = P AP t où P est une matrice de permutation. Donc ˙ A est une Z-matrice. 

De plus, 

˙A −1 = (P AP t ) −1 = P A −1 P t . 

Il découle que ˙ A −1 est une matrice obtenue à partir de A −1 par la même permutation que celle considérée pour 

˙A. La matrice A étant une M-matrice, A −1 est une matrice non négative. Donc ˙ A −1 est aussi une matrice non 

négative et ˙ A une M-matrice. De la même façon, il découle de la proposition 4.1 et de la remarque 4.1 que ˙ A 

est une M-matrice dans le cas où c ≥ 0. 

1.1.2 Situation non-linéaire. 

Dans ce paragraphe, nous présentons divers problèmes aux limites non-linéaires où l’opérateur de convectiondiffusion 

apparaît avec différents types de non linéarités. 

La première application concerne un problème de climatisation par la frontière, modélisé par l’équation suivante 

( voir [1] ) : 

4.4

⎧ 

Trouver u ∈ V solution de 

⎪⎨ 

⎪⎩ 

−ν∆u + a ∂u ∂u 

∂x + b ∂y + cu = f , dans Ω 

∂u 

∂n + ϕ(u) = 0 , sur Γd 

u = 0 , sur ∂Ω − Γd 

où V={v ∈ H 1 (Ω)|v |∂Ω−Γ d = 0}, Ω ⊂ IR 2 , c ≥ 0, Γd ⊂ ∂Ω, f ∈ L 2 (Ω) et ϕ : IR → IR est une fonction continue 

non décroissante. Les graphes que l’on peut considérer pour ϕ ont la forme indiquée à la figure 4.1 : 

ϕ 

✻ 

 

 

 

(a) 

✲ 

u 

 

ϕ 

✻ 

✲ 

 

u 

(b) 

Figure 4.1 : Différents graphes pour ϕ 

Notons que le graphe (c) modélise une fonction multivoque correspondant à la condition aux frontières : 

∂u 

∂n + ϕ(u) ∋ 0. 

Les techniques de discrétisation présentées au paragraphe 1.1.1 peuvent être utilisées pour les points intérieurs 

de Ω. En particulier le schéma (4.2) est utilisé pour l’opérateur de convection. La discrétisation de la condition 

de Neumann conduit à la résolution des équations : 

pour les points de discrétisation situés sur Γd. 

où 

Ainsi le système discret à résoudre s’écrit : 

uj − uj−1 

h 

ϕ 

✻ 

(c) 

✲ 

u 

(4.3) 

+ ϕ(uj) = 0, (4.4) 

Λ(X) = 0, 

Λ(X) = AX + φ(X) − G, (4.5) 

et A est la matrice de discrétisation de la partie linéaire du problème, associée à la numérotation lexicographique 

du maillage, (G, X) ∈ IR dim(A) × IR dim(A) et φ est un opérateur diagonal monotone non décroissant. 

Remarque 4.3. Notons que les composantes de φ sont nulles pour les points intérieurs à Ω et égales à hϕ(uj) 

si j correspond à l’indice d’un point qui appartient à Γd. 

Proposition 4.3. A est une M-matrice. 

4.5

Dmonstration. Si c > 0, alors il découle de (4.4), de la proposition 4.1, et des conditions de Dirichlet définies 

sur ∂Ω − Γd que A est une Z-matrice à diagonale dominante stricte. Donc A est une M-matrice. Si c=0, alors 

la matrice A est à diagonale dominante. En utilisant la caractérisation des matrices irréductibles ( voir [12] ), 

on peut vérifier que A est une matrice irréductible à diagonale dominante ; donc A est aussi une M-matrice. 

Proposition 4.4. L’opérateur du problème (4.3) est un opérateur H-accrétif et également une M-fonction. 

Dmonstration. L’opérateur Λ qui s’écrit sous la forme d’une somme d’une M-matrice et d’un opérateur 

diagonal monotone croissant est un opérateur H-accrétif. 

Pour les mêmes raisons, l’opérateur Λ est une M-fonction. 

Corollaire 4.5. Les algorithmes asynchrones et synchrones classiques et les algorithmes asynchrones avec 

communication flexible appliqués à la résolution du problème (4.3) convergent. 

Remarque 4.4. L’approximation de la condition de Neumann par le schéma de discrétisation (4.4) conduit 

à une précision en O(h). La précision du schéma peut être améliorée en utilisant une méthode proposée par 

Golub and Meurant [4] basée sur l’utilisation de “points fantômes” situés en dehors de Ω et qui sont l’image 

des points intérieurs de la grille proches de Γd. Si Γd est l’intervalle [0, 1] de l’axe des x alors ∂u ∂u 

∂n = − ∂y 

condition de Neumann peut être approchée ainsi : 

ũj+1 − uj−1 

+ ϕ(uj) = 0, (4.6) 

2h 

où ũj+1 est un “point fantôme”. En injectant (4.6) dans le schéma de différences finies nous obtenons les schémas 

suivants selon le signe de a et b : 

si a > 0 et b > 0 : 

−(ν + ah)uj−m + (4ν + h(a + b) + ch 2 )uj − (2ν + bh)uj+1 − νuj+m + 2h(ν + bh)ϕ(uj) = h 2 fj (4.7) 

si a > 0 et b < 0 : 

−(ν + ah)uj−m + (4ν + h(a − b) + ch 2 )uj − (2ν − bh)uj+1 − νuj+m + 2hνϕ(uj) = h 2 fj 

si a < 0 et b > 0 : 

−νuj−m + (4ν + h(−a + b) + ch 2 )uj − (2ν + bh)uj+1 − (ν − ah)uj+m + 2h(ν + bh)ϕ(uj) = h 2 fj (4.9) 

si a < 0 et b < 0 : 

où m est égal à h −1 . 

−νuj−m + (4ν − h(a + b) + ch 2 )uj − (2ν − bh)uj+1 − (ν − ah)uj+m + 2hνϕ(uj) = h 2 fj 

et la 

(4.8) 

(4.10) 

Pour les schémas (4.7) à (4.8), on retrouve d’une part les propriétés de H-accrétivité et d’autre part les 

propriétés des M-fonctions. 

Remarque 4.5. Les résultats précédents peuvent être étendus au cas où une numérotation rouge-noir est 

considérée ( voir remarque 4.2 ). 

La seconde application concerne un problème de contrôle aux frontières avec feedback à priori. 

⎧ 

Trouver u tel que : 

⎪⎨ 

⎪⎩ 

−ν∆u + a ∂u ∂u 

∂x + b ∂y + cu = f dans Ω 

∂u 

∂n + ϕ(u) = 0 sur ∂Ω 

4.6 

(4.11)

où c > 0, f ∈ L 2 (Ω) et ϕ : IR → IR est une fonction continue non décroissante. Le problème (4.11) est proche 

du problème (4.3). Cependant la condition de Neumann définie sur toute la frontière ∂Ω au lieu de l’être sur 

une partie de ∂Ω conduit à une résolution plus difficile ; la condition c > 0 doit être vérifiée. La discrétisation 

du problème (4.11) utilisant le schéma classique à cinq points pour l’opérateur de diffusion, la formule (4.2) 

pour le terme de convection et les schémas (4.4) ou (4.6) pour les points appartenant à la frontière amène à la 

résolution d’un système analogue au système (4.5) qui, si c est strictement, définit soit un opérateur H-accrétif, 

soit une M-application. 

Nous considérons maintenant d’autres problèmes avec diverses non-linéarités qui sont définies sur Ω au lieu 

de ∂Ω. Le modèle général peut être donné par : 

⎧ 

⎪⎨ 

⎪⎩ 

Trouver u solution de 

−ν∆u + a ∂u ∂u 

∂x + b ∂y + cu + ϕ(u) = f , dans Ω 

C.L. 

(4.12) 

où c > 0, f ∈ L 2 (Ω), et ϕ : IR → IR est une fonction continue non décroissante et C.L. représente des conditions 

aux limites classiques ( i.e. Dirichlet, Neumann, Fourier et mixte ). En utilisant les schémas de discrétisation 

précédents, nous obtenons un système identique au système (4.5). Ce type de problème rentre aussi dans les 

cadres d’application envisagés aux chapitres 1 et 2. 

Parmi les nombreuses fonctions non-linéaires que l’on peut considérer, citons par exemple : ϕ(u) = e αu , avec 

α > 0, ϕ(u) = Log(β + δu), avec δ > 0 et un signe convenablement choisi pour β. 

Pour terminer signalons que l’on retrouve l’opérateur de convection-diffusion dans le problème 2D de Navier- 

Stokes lorsque l’on considère la formulation courant-tourbillon. Ce problème sera traité dans le chapitre suivant. 

1.1.3 Problèmes de convection-diffusion avec forte convection. 

Les problèmes de convection-diffusion où il y a dominance du terme de convection constituent une part 

importante des problèmes rencontrés dans les situations physiques réelles ( voir [10], [13] ). Dans ces problèmes, 

le coefficient de diffusion ν est petit. 

En discrétisant les termes de convection par les schémas décentrés (4.2) et si les coefficients de convection 

a et b sont de même signe, la matrice de discrétisation A présente une forme quasi-triangulaire ( pour une 

numérotation lexicographique des points, la matrice est quasi-triangulaire inférieure si a et b sont positifs, 

supérieure si a et b sont négatifs ). 

Ainsi si la méthode de résolution utilisée sur chaque sous-domaine de Ω est une méthode de relaxation, la 

résolution va s’effectuer en un faible nombre d’itérations si le sens de parcours des points de la grille tient compte 

de la forme quasi-triangulaire : un parcours dans le sens direct si a et b positifs, dans l’autre sens si a et b sont 

négatifs. En effet dans le cas limite où le coefficient de diffusion est nul, la matrice obtenue est triangulaire et 

la méthode de relaxation converge en une seule itération. 

Les quelques exemples du tableau 4.1 donnent pour différentes valeurs de a, b et du paramètre de relaxation 

ω le nombre total de relaxations de Gauss-Seidel nécessaires à la résolution du problème (4.1) pour un domaine 

Ω maillé par 48641 points et décomposé en 8 sous-domaines en utilisant l’un ou l’autre des sens de parcours des 

4.7

points. Le coefficient de diffusion ν est pris égal à 10 −2 . 

Sens Nombres de relaxations 

(a,b) de parcours ω = 0.50 ω = 0.75 ω = 1.00 ω = 1.25 ω = 1.50 

(0.5,1.5) Direct 10472 5820 3325 1715 521 

(0.5,1.5) Inverse 11985 7401 4974 3424 2269 

(5,15) Direct 3517 1602 564 diverge diverge 

(5,15) Inverse 5164 3278 2274 diverge diverge 

(50,150) Direct 2530 1044 167 2339 diverge 

(50,150) Inverse 4101 2636 1815 4691 diverge 

Table 4.1 : Influence du sens de parcours des points de la grille pour différentes valeurs des coefficients de convection 

quand le coefficient de diffusion est faible. 

Il apparaît clairement l’intérêt d’utiliser le sens direct, pour relaxer. Il est donc utile de regarder, quand on le 

peut, le signe des coefficients de convection et ceci quel que soit l’algorithme que l’on utilise. Ce procédé semble 

d’autant plus efficace que les valeurs de a et b sont grandes. 

1.2 Cas de la discrétisation centrée du terme de convection. 

1.2.1 Le problème linéaire de convection-diffusion. 

Nous considérons le problème (4.1) mais avec une discrétisation centrée du terme de convection. 

⎧ 

⎪⎨ 

⎪⎩ 

Trouver u ∈ H 1 0(Ω) solution de 

−ν∆u + a ∂u ∂u 

∂x + b ∂y + cu = f, dans Ω 

u = 0 sur ∂Ω 

où c ≥ 0, ν > 0 et Ω ⊂ IR 2 , f est une fonction de L 2 (Ω). 

Les schémas de discrétisation sont les suivants : 

⎧ 

⎨ 

⎩ 

∂u u(x+h,y)−u(x−h,y) 

∂x = 2h + O(h2 ), 

∂u u(x,y+h)−u(x,y−h) 

∂y = 2h + O(h2 ). 

(4.13) 

(4.14) 

Proposition 4.6. Soit A la matrice de discrétisation du problème (4.1) lorsque les termes de convection sont 

discrétisés par des schémas centrés. Si la condition 

| a | + | b | < 4 ν 

+ ch (4.15) 

h 

est vérifiée alors A est un opérateur H-accrétif. 

4.8

Dmonstration. Sous l’hypothèse (4.15), la matrice de discrétisation A est une matrice irréductible à diagonale 

dominante ; sa matrice de comparaison est une M-matrice donc A est une H-matrice. Selon la proposition 

1.12 du paragraphe 2.5, la matrice A est un opérateur H-accrétif. 

Proposition 4.7. De plus si les hypothèses suivantes sont vérifiées, 

A est une M-matrice. 

⎧ 

⎨ 

⎩ 

| a | ≤ 2ν 

h , 

| b | ≤ 2ν 

h , 

(4.16) 

Dmonstration. Les hypothèses (4.15) et (4.16) conduisent à une matrice de discrétisation A qui est une 

Z-matrice. De plus cette matrice est une matrice irréductible à diagonale dominante, c’est donc une M-matrice. 

Corollaire 4.8. Sous les hypothèses de la proposition 4.6 les algorithmes synchrones et asynchrones classiques 

convergent. 

Corollaire 4.9. Sous les hypothèses de la proposition 4.6 et 4.7, les algorithmes asynchrones avec communication 

flexible convergent. 

Remarque 4.6. Quelques soient les valeurs de a et b, il est toujours possible de prendre h suffisamment petit 

de manière à vérifier les hypothèses (4.15) et (4.16). 

1.2.2 Situation non-linéaire. 

Sous l’hypothèse (4.15), les problèmes non-linéaires exposés au paragraphe 1.1.2 rentrent dans le cadre d’application 

du chapitre 1 ; l’opérateur Λ est la somme d’une matrice accrétive et d’un opérateur diagonal croissant, ; 

donc Λ est un opérateur H-accrétif. 

Sous les hypothèses (4.15) et (4.16), l’opérateur Λ est la somme d’une M-matrice et d’un opérateur diagonal 

croissant. Λ est une M-fonction et les algorithmes envisagés aux chapitre 2 sont applicables. 

2 Expérimentations numériques pour le problème linéaire classique de convection-diffusion. 

Le problème traité dans ce paragraphe est le problème linéaire de convection-diffusion (4.1). Les expérimentations 

numériques ont été réalisées avec P.V.M. et M.P.I. pour trois tailles de problèmes. 

1. une taille modeste avec 48 641 points de discrétisation, le domaine Ω étant découpé en 8 sous-domaines 

d’approximativement 7100 points. Le pas d’espace h est égal à 7, 8.10 −3 . 

2. une taille moyenne avec 92 837 points de discrétisation, le domaine Ω étant découpé en 16 sous-domaines 

d’approximativement 7100 points. Dans ce cas h est égal à 7, 8.10 −3 . 

3. une grande taille avec 130 305 points de discrétisation, le domaine Ω étant découpé en 8 sous-domaines 

d’approximativement 19400 points. h est ici égal à 3, 2.10 −3 . 

Remarque 4.7. Pour ne pas avoir des sous-domaines trop étirés, Ω n’est pas obligatoirement le carré unité. Ce 

qui explique les valeurs de h. Pour chaque grandeur de problème, la zone de recouvrement comporte 12*NDCY, 

NDCY étant le nombre de points selon l’axe des Y. 

4.9

Pour chaque taille, nous avons considéré trois valeurs du coefficient de diffusion ν = 1, ν = 10 −1 et ν = 10 −2 . 

Les coefficients de convection a et b et le coefficient c ont été pris de telles façon que pour tous les maillages 

et tous les coefficients ν, nous obtenions après une discrétisation centrée ou décentrée des termes de convection 

une M-matrice. Pour des valeurs a = 1.5, b = 0.5 et c = 10, la matrice de discrétisation est une M-matrice. 

Les tests comportent des calculs avec une version séquentielle de l’algorithme de Schwarz, une version synchrone 

et les trois versions asynchrones introduites au chapitre 3, l’algorithme asynchrone Basse Fréquence de 

Communication ( B.F.C. ), l’algorithme asynchrone Moyenne Fréquence de Communication ( M.F.C. ) et 

l’algorithme asynchrone Haute Fréquence de Communication ( H.F.C ). Nous rappelons que les algorithmes 

asynchrones B.F.C. et M.F.C. implémentent les algorithmes asynchrones classiques tandis que l’algorithme 

asynchrone H.F.C est l’algorithme qui se rapproche le plus des algorithmes asynchrones avec communication 

flexible. 

Pour les algorithmes parallèles, nous avons fait varier le nombre des processeurs de 2 à 8 selon la taille du 

problème. 

2.1 Résultats détaillés de deux calculs avec discrétisation décentrée des termes de convection – Version P.V.M. 

On considère deux résolutions du problème linéaire. Dans la première résolution le terme de diffusion est 

ν = 0.01 et le maillage comporte 48641 points de discrétisation. La deuxième résolution est effectuée avec ν = 1 

et un maillage de 130 305 points. Dans les deux exemples, le domaine est découpé en 8 sous-domaines. 

Dans les tableaux suivants 4.2 et 4.3, sont donnés le nombre d’itérations de Schwarz ( entre parenthèses ) et 

le nombre de relaxations effectuées sur chaque sous-domaines par les différents types d’algorithmes ainsi que le 

temps de restitution. Les exécutions des algorithmes parallèles ont été réalisées sur 2 puis 4 processeurs. 

Signalons enfin que nous avons comparé pour tous les calculs effectués dans ce chapitre la solution obtenue 

avec la solution exacte. Les différences relatives de la solution calculée par rapport à solution exacte sont du 

même ordre pour tous les algorithmes, séquentiels, synchrones et asynchrones. 

Le tableau 4.3 ne comporte pas les résultats de la version B.F.C. de l’algorithme asynchrone car au cours 

des tests, il est apparu que ce type d’algorithme ne donnait pas toujours des résultats satisfaisants. 

Ces deux tableaux correspondent à deux cas extrêmes de l’ensemble des tests effectués et illustrent assez bien 

le comportement des algorithmes asynchrones. 

Dans le premier test, les processeurs n’ont pas assez de travail et on constate que pour les algorithmes 

asynchrones cela se traduit par un grand nombre d’itérations de Schwarz pour l’un des processeurs ( le premier 

en l’occurence ). 

Ce test correspond à un cas limite de l’utilisation des algorithmes asynchrones ; le problème comporte un 

nombre limité de points et le volume de calcul par processeur est insuffisant. C’est un des rares tests, comme 

on le verra par la suite, où l’algorithme synchrone est plus rapide que les algorithmes asynchrones. 

Dans le second test, le volume de travail est plus important pour chaque processeur, et le nombre d’itérations 

de Schwarz est du même ordre de grandeur pour tous les calculs. 

Si maintenant on regarde le nombre de relaxations effectuées sur chaque sous-domaine, on constate qu’il est 

du même ordre de grandeur pour tous les types d’algorithmes, ceci pour les deux tests. C’est ce nombre qui est 

4.10

Sous-domaine 1 2 3 4 5 6 7 8 Total Temps 

Séquentiel (4) (4) (4) (4) (4) (4) (4) (4) (32) 

406 441 435 427 422 418 423 353 3325 31.52s 

Processeur 1 2 

Synchrone (6) (6) (6) (6) (6) (6) (6) (6) (48) 

408 443 437 587 611 420 425 355 3686 20.28s 

Asynchrone (17) (17) (17) (17) (5) (5) (5) (5) (92) 

B.F.C. 419 454 448 398 548 419 424 354 3464 23.88s 

Asynchrone (54) (54) (54) (54) (9) (9) (8) (8) (250) 

M.F.C. 456 491 485 498 552 423 427 357 3689 22.20s 

Asynchrone (54) (54) (54) (54) (9) (9) (9) (8) (250) 

H.F.C. 456 491 485 498 552 423 428 357 3690 22.47s 

Processeur 1 2 3 4 

Synchrone (6) (6) (6) (6) (6) (6) (6) (6) (48) 

408 566 593 587 611 546 592 372 4275 13.48s 

Asynchrone (7) (7) (7) (7) (14) (13) (13) (81) (81) 

B.F.C. 409 568 594 589 639 449 559 379 4186 17.10s 

Asynchrone (83) (83) (26) (25) (11) (11) (10) (9) (258) 

M.F.C. 486 496 550 412 561 424 533 373 3835 13.19s 

Asynchrone (89) (89) (23) (22) (11) (10) (11) (10) (265) 

H.F.C. 491 503 547 413 565 414 535 374 3842 14.46s 

Table 4.2 : Problème linéaire – Version P.V.M. : coefficient de diffusion : ν = 10 −2 ; coefficients de convection : a = 1.5, 

b = 0.5 avec 48 641 points de discrétisation, 8 sous-domaines, discrétisation décentrée des dérivées premières. 

le plus en corrélation avec le temps de restitution. 

En dehors des cas limites, un nombre inférieur de relaxations pour un algorithme asynchrone par rapport 

à l’algorithme synchrone se traduira par un meilleur temps de restitution. Dans les cas limites, le temps de 

latence des communications conduit à une perte de temps qui n’est pas compensée par le gain sur le nombre de 

relaxations. C’est ce que l’on constate dans le tableau 4.2 pour le calcul avec quatre processeurs : l’algorithme 

asynchrone H.F.C., bien qu’effectuant moins de relaxations (3842) que l’algorithme synchrone (4275) est plus 

lent. 

L’étude de ces deux tests permet de dégager de façon assez rapide le comportement général des algorithmes 

asynchrones. De plus il permet de mettre en évidence l’importance du nombre de relaxations bien plus significatif 

que le nombre d’itérations de Schwarz. C’est pourquoi par la suite ce nombre d’itérations n’apparaîtra plus dans 

les tableaux de résultats. Notons cependant que dans la suite des tests, d’autres comportements des algorithmes 

asynchrones apparaîtront, notamment l’avantage de la non synchronisation. 

Remarque 4.8. Ces exemples détaillés concernent la version développée à l’aide de P.V.M. et une discrétisation 

décentrée des termes de convection. Nous obtenons le même type de résultats si on considère une discrétisation 

centrée des termes de convection et dans la version M.P.I. 

4.11

Sous-domaine 1 2 3 4 5 6 7 8 Total Temps 

Séquentiel (10828) (10828) (10828) (10828) (10828) (10828) (10828) (10828) (86624) 

20529 20367 20363 20305 20197 20008 19663 19225 160657 1h25m18.90s 

Processeur 1 2 

Synchrone (10588) (10588) (10588) (10588) (10588) (10588) (10588) (10588) (84704) 

20254 20221 20508 21460 21923 20426 19740 19167 163699 46m57.96s 

Asynchrone (10753) (10753) (10753) (10753) (10794) (10793) (10793) (10793) (86185) 

M.F.C. 20417 20204 20101 19591 20936 20227 19749 19263 160488 43m48.63s 

Asynchrone (10678) (10678) (10678) (10678) (10810) (10809) (10809) (10809) (85949) 

H.F.C. 20339 20125 20024 19518 21083 20250 19763 19275 160377 43m37.32s 

Processeur 1 2 3 4 

Synchrone (10568) (10568) (10568) (10568) (10568) (10568) (10568) (10568) (84544) 

20609 21459 21847 21609 21986 21475 21863 20010 170858 26m22.40s 

Asynchrone (12040) (12040) (10810) (10810) (10836) (10836) (10936) (10936) (89244) 

M.F.C. 21367 21711 20757 19921 20746 20000 20910 19932 165344 23m28.08s 

Asynchrone (12095) (12095) (11220) (11219) (10674) (10673) (11352) (11351) (90679) 

H.F.C. 21420 21487 21128 20953 20678 19660 21773 20299 167398 24m26.73s 

Table 4.3 : Problème linéaire – Version P.V.M. : coefficient de diffusion : ν = 1 ; coefficients de convection : a = 1.5, 


2.2 Résultats des calculs avec discrétisation décentrée des termes de convection. 

2.2.1 Implémentation avec P.V.M. 

Au cours des tests, on a constaté que la version B.F.C. de l’algorithme asynchrone donnait non seulement 

de mauvais temps de restitution mais en plus ne fonctionnait pas à coup sûr ; il est arrivé que le programme 

s’arrête sur une erreur de débordement de buffer. 

Ce débordement est dû à un manque de souplesse dans les communications et peut s’expliquer de la manière 

suivante : un processeur P peut être décalé dans ses calculs avec ses voisins P 1 et P 2 ; ceux-ci lui envoient les 

valeurs de la solution sur les frontières de recouvrement pendant qu’il effectue la résolution sur un sous-domaine. 

Dans la version B.F.C., P ne fait aucune communication au cours de son algorithme de résolution ; il n’envoie 

donc aucune valeur de la solution sur les frontières de recouvrement à P 1 et P 2. La résolution sur les domaines 

traités par P 1 et P 2 est de ce fait rapide et très vite ces derniers lui envoient d’autres valeurs de la solution. 

Les réceptions en attente vers P augmentent et si P ne termine pas sa résolution avant que le buffer ne soit 

plein, le programme s’arrête sur une erreur de débordement de buffer. 

Le fait de ne pas réceptionner avec une fréquence suffisante augmente les risque de mauvais fonctionnement. 

Ce risque disparaît lorsque l’on utilise la version M.F.C. de l’algorithme asynchrone où les réceptions ont 

lieu dans la boucle de relaxation. Mis à part certains cas limites où le nombre de points par processeur est 

insuffisant et où le volume de calcul n’est pas assez important ( cas avec ν = 10 −2 ), l’algorithme asynchrone 

M.F.C. présente de meilleurs temps que l’algorithme synchrone. Dans quelques cas ( cf. tableaux 4.4 et 4.7 ), 

on observe que, malgré un nombre de relaxations plus important, la version M.F.C. est plus rapide en temps 

4.12

Méthode de Nombre de Nombre de Temps Speed Up Efficacité 

Schwarz processeurs relaxations GS de restitution 

Séquentielle 1 66244 757.2 sec. - - 

Synchrone 2 68746 435.2 sec. 1.74 0.87 

Asynchrone B.F.C. 2 66296 508.8 sec. 1.48 0.74 

Asynchrone M.F.C. 2 70110 427.3 sec. 1.78 0.89 

Asynchrone H.F.C. 2 69873 426.9 sec. 1.77 0.89 

Synchrone 4 73247 251.0 sec. 3.02 0.75 









Synchrone 2 26430 140.8 sec. 1.62 0.81 




Synchrone 4 30678 88.5 sec. 2.60 0.65 






que l’algorithme synchrone. Il apparaît ici la souplesse des algorithmes asynchrones qui ne sont pas pénalisés 

par une quelconque synchronisation. Ils effectuent des relaxations supplémentaires au lieu de perdre du temps à 

se synchroniser, ce qui n’affecte pas le temps de restitution compte-tenu de la vitesse de calcul des processeurs. 

On constate aussi un bon comportement de l’algorithme asynchrone M.F.C. lorsque le nombre de processeurs 

augmente. L’efficacité reste satisfaisante dès que le ratio nombre de sous-domaines par processeur demeure 

supérieur à 2. Des tests avec un sous-domaine par processeur donnent des mauvais résultats ; notons cependant 

que les résultats sont mauvais pour l’algorithme synchrone. 

La version H.F.C. de l’algorithme asynchrone donne des résultats plus difficiles à analyser. Cette version 

semble être pénalisée par le nombre de communications et ses performances dépendent fortement des exécutions 

et du taux d’occupation du réseau. Il n’y a pas de règle précise pour comparer cette version à la version M.F.C. 

ou à l’algorithme synchrone. Elle peut donner d’excellents résultats comme des résultats moyens. Pour les 

4.13




Synchrone 2 3686 20.3 sec. 1.54 0.77 




Synchrone 4 4275 13.5 sec. 2.34 0.58 









Synchrone 2 163699 2818.0 sec. 1.82 0.91 



Synchrone 4 170858 1582.4 sec. 3.24 0.81 





problèmes suffisamment importants, elle reste cependant meilleure que l’algorithme synchrone. 

Si l’on considère des problèmes où la parallélisation est intéressante i.e. des problèmes conduisant à de gros 

volumes de calculs, ce qui arrive lorsque l’on utilise des maillages fins, on constate le bon comportement des 

algorithmes asynchrones M.F.C. et H.F.C., quel que soit le coefficient de diffusion. Par contre pour des 

problèmes plus petits, l’intérêt de l’asynchronisme est moins évident. 

Ce phénomène est génant pour la mise au point des programmes où il est préférable de tester ces derniers avec 

une taille conséquente du problème. En effet, si on considère une taille modeste du problème, les algorithmes 

asynchrones auront des performances inférieures aux algorithmes synchrones, dans la mesure où ils ne sont pas 

adaptés à ce type de situation. 

Les versions P.V.M. des algorithmes asynchrones pour des problèmes de convection-diffusion avec discrétisation 

décentrée des termes de convection permettent de tirer les premiers enseignements sur les algorithmes asynchrones 

sur machines à mémoire distribuée. 

L’algorithme asynchrone B.F.C. fonctionne difficilement, et quand il n’y a pas de problèmes lors de l’exécution 

4.14




Synchrone 2 91514 1245.2 sec. 1.68 0.84 



Synchrone 4 106547 797.1 sec. 2.62 0.66 








Synchrone 2 13895 198.3 sec. 1.58 0.79 



Synchrone 4 17037 126.2 sec. 2.49 0.62 





il conduit aux plus mauvais résultats en temps de restitution. 

L’algorithme asynchrone M.F.C. est la version la plus robuste qui donne pour tous les problèmes adaptés au 

parallélisme de meilleurs résultats que la version synchrone. 

L’algorithme asynchrone H.F.C. pose plus de problèmes ; les résultats dépendent fortement du taux d’occupation 

du réseaux. Quand le réseau est peu encombré, il donne d’excellents résultats. 

4.15




Synchrone 2 138776 849.3 sec. 1.92 0.96 



Synchrone 4 143598 449.4 sec. 3.64 0.91 



Synchrone 8 152387 262.1 sec. 6.24 0.78 








Synchrone 2 52430 264.8 sec. 1.80 0.9 



Synchrone 4 55509 156.1 sec. 3.05 0.763 



Synchrone 8 63751 92.3 sec. 5.16 0.645 





4.16




Synchrone 2 7201 37.2 sec. 1.78 0.89 



Synchrone 4 7789 22.4 sec. 2.96 0.74 



Synchrone 8 8982 11.4 sec. 5.82 0.728 





4.17

2.2.2 Implémentation avec M.P.I. 




Synchrone 2 68746 476.5 sec. 1.84 0.92 




Synchrone 4 73247 274.9 sec. 3.20 0.80 




Table 4.13 : Problème linéaire – Version M.P.I : coefficient de diffusion : ν = 1 ; coefficients de convection : a = 1.5, 





Synchrone 2 26430 157.7 sec. 1.72 0.86 




Synchrone 4 30678 101.6 sec. 2.66 0.66 




Table 4.14 : Problème linéaire – Version M.P.I : coefficient de diffusion : ν = 10 −1 ; coefficients de convection : a = 1.5, 


L’implémentation des algorithmes asynchrones à l’aide de M.P.I. donne des résultats assez comparables à ceux 

obtenus avec la version P.V.M. ; il y a cependant quelques différences intéressantes à signaler. 

La version B.F.C. de l’algorithme asynchrone a un meilleur comportement avec M.P.I. et fonctionne tout le 

temps. Pour tous les problèmes, quand le nombre de sous-domaines par processeur est de quatre, on obtient des 

résultats comparables aux autres versions asynchrones. Par contre, lorsqu’il y a seulement deux sous-domaines 

par processeur, ses performances sont moins bonnes. 

Notons que l’asynchrone B.F.C. conduit à une vitesse de convergence plus faible que les autres versions 

asynchrones. Le temps gagné au niveau des communications se perd par le non respect des principes de Gauss à 

propos de l’utilisation des valeurs les plus récentes des résultats des relaxations aux frontières de recouvrement. 

4.18




Synchrone 2 3686 27.8 sec. 1.38 0.69 




Synchrone 4 4275 21.2 sec. 1.82 0.46 




Table 4.15 : Problème linéaire – Version M.P.I. : coefficient de diffusion : ν = 10 −2 ; coefficients de convection : a = 1.5, 





Synchrone 2 163699 3226.4 sec. 1.86 0.93 




Synchrone 4 170858 1714.0 sec. 3.44 0.86 






L’algorithme asynchrone M.F.C. reste l’algorithme qui a le comportement le plus régulier et qui donne de 

meilleurs résultats que l’algorithme synchrone pour tous les problèmes de grande taille. 

La version H.F.C. de M.P.I. se comporte de façon plus régulière que la version H.F.C. de P.V.M. ; pour les 

grands problèmes où le nombre de sous-domaines par processeur est supérieur ou égal à quatre ( tables 4.16, 

4.17, 4.19, 4.20 ), cette version donne les meilleures efficacités. La gestion M.P.I. des communications permet 

de tirer le meilleur parti de ce type d’algorithme asynchrone avec communication flexible. 

4.19




Synchrone 2 91514 1432.6 sec. 1.72 0.86 




Synchrone 4 106547 863.9 sec. 2.84 0.71 









Synchrone 2 13895 233.2 sec. 1.58 0.79 




Synchrone 4 17037 142.8 sec. 2.56 0.64 






4.20




Synchrone 2 138776 947.7 sec. 1.90 0.95 




Synchrone 4 143598 522.7 sec. 3.46 0.87 




Synchrone 8 152387 260.2 sec. 6.98 0.87 









Synchrone 2 52430 302.7 sec. 1.86 0.93 


Asynchrone M.F.C. 2 50205 286,9 sec. 1.96 0.98 


Synchrone 4 55509 171.8 sec. 2.28 0.82 




Synchrone 8 63751 97.4 sec. 5.80 0.73 






4.21




Synchrone 2 7201 43.7 sec. 1.68 0.84 




Synchrone 4 7789 32.2 sec. 2.26 0.56 




Synchrone 8 8982 21.6 sec. 3.38 0.42 






4.22

2.3 Résultats des calculs avec discrétisation centrée des termes de convection. 

Dans les tableaux suivants ( 4.22 à 4.39 ), sont présentés les résultats des expérimentations, pour les mêmes 

types de problèmes que ceux considérés dans le paragraphe précédent, mais avec cette fois-ci une discrétisation 

centrée des termes de convection. 

Les résultats obtenus sont tout à fait comparables aux résultats des expérimentations avec discrétisation 

décentrée et il n’y a pas de différences notables à signaler entre les comportements des algorithmes asynchrones 

pour ce type de discrétisation et ceux observés dans le paragraphe précédent. 

Une différence cependant existe au niveau des résultats numériques où la précision de la solution obtenue est 

meilleure en utilisant une discrétisation centrée qu’une discrétisation décentrée. 





Synchrone 2 68706 434.0 sec. 1.72 0.86 




Synchrone 4 73216 261.4 sec. 2.86 0.72 





b = 0.5 avec 48 641 points de discrétisation, 8 sous-domaines, discrétisation centrée des dérivées premières. 

4.23




Synchrone 2 26543 137.5 sec. 1.66 0.83 




Synchrone 4 30002 86.3 sec. 2.64 0.66 




Table 4.23 : Problème linéaire – Version P.V.M. :coefficient de diffusion : ν = 10 −1 ; coefficients de convection : a = 1.5, 





Synchrone 2 2300 13.1 sec. 1.50 0.75 




Synchrone 4 2670 9.0 sec. 2.16 0.54 









Synchrone 2 163659 2823.0 sec. 1.82 0.91 



Synchrone 4 170821 1530.2 sec. 3.36 0.84 





4.24




Synchrone 2 91404 1264.2 sec. 1.66 0.83 



Synchrone 4 108310 820.1 sec. 2.56 0.64 








Synchrone 2 11344 161.8 sec. 1.56 0.78 



Synchrone 4 13722 103.1 sec. 2.45 0.61 








Synchrone 2 128702 849.2 sec. 1.82 0.91 



Synchrone 4 143534 457.9 sec. 3.38 0.84 



Synchrone 8 152322 289.1 sec. 5.36 0.67 





4.25




Synchrone 2 50449 248.6 sec. 1.88 0.94 



Synchrone 4 54249 166.3 sec. 2.80 0.70 



Synchrone 8 61630 93.6 sec. 5.00 0.62 








Synchrone 2 4511 27.8 sec. 1.52 0.76 



Synchrone 4 4870 16.5 sec. 2.56 0.64 



Synchrone 8 5605 10.2 sec. 4.14 0.52 





4.26





Synchrone 2 68706 481.7 sec. 1.80 0.90 



Asynchrone H.F.C 2 71259 474.3 sec. 1.84 0.92 

Synchrone 4 73216 275.4 sec. 3.20 0.80 




Table 4.31 : Problème linéaire – Version M.P.I. : coefficient de diffusion : ν = 1 ; coefficients de convection : a = 1.5, 





Synchrone 2 26543 159.7 sec. 1.72 0.86 




Synchrone 4 30002 109.9 sec. 2.50 0.62 






4.27




Synchrone 2 2300 19.8 sec. 1.36 0.68 




Synchrone 4 2670 16.6 sec. 1.64 0.41 









Synchrone 2 163659 3246.4 sec. 1.84 0.92 




Synchrone 4 170821 1682.4 sec. 3.58 0.89 






4.28




Synchrone 2 91404 1481.6 sec. 1.66 0.83 



Asynchrone H.F.C 2 81567 1113.7 sec. 2,20 1.10 

Synchrone 4 108310 909.21 sec. 2.68 0.67 









Synchrone 2 11344 185.1 sec. 1.64 0.82 




Synchrone 4 13722 119.0 sec. 2.56 0.64 






4.29




Synchrone 2 138702 919.9 sec. 1.90 0.95 




Synchrone 4 143543 493.4 sec. 3.52 0.88 




Synchrone 8 152322 273.8 sec. 6.40 0.80 









Synchrone 2 50449 282.9 sec. 1.86 0.93 




Synchrone 4 54249 165.2 sec. 3.20 0.80 




Synchrone 8 61630 105.2 sec. 5.00 0.62 






4.30




Synchrone 2 4511 31.6 sec. 1.60 0.80 




Synchrone 4 4870 22.2 sec. 2.26 0.56 




Synchrone 8 5605 19.4 sec. 2.58 0.32 






4.31

3 Expérimentations numériques pour un problème non-linéaire de convection-diffusion. 

Le problème traité dans ce paragraphe est le problème non-linéaire de convection-diffusion (4.3) présenté au 

paragraphe 1.1.2. La non-linéarité considérée est celle du graphe (a) de la figure 4.1. 

En prenant les mêmes valeurs pour les coefficients de convection a et b ainsi que pour le coefficient c, la 

matrice de discrétisation de la partie linéaire est une M-matrice quelle que soit la discrétisation centrée ou 

décentrée utilisée pour les termes de convection. L’opérateur Λ donné par l’équation (4.5) est donc la somme 

d’une M-matrice et d’un opérateur diagonal croissant. Les différents types d’algorithmes asynchrones, classiques 

et à communication flexible peuvent être appliqués à la résolution de ce problème non-linéaire. 

Les tableaux 4.40 à 4.63 présentent les différents résultats obtenus avec les versions P.V.M. puis M.P.I. des 

algorithmes. Au vu des résultats peu encourageants observés pour le problème linéaire, la version B.F.C. avec 

P.V.M. des algorithmes asynchrones n’a pas été implémentée pour le problème non-linéaire. 

Les problèmes considérés sont ceux de petite et grande taille avec 8 sous-domaines. 

Les enseignements tirés de ces expérimentations sont commentés au chapitre 3.3, page 4.44. 

3.1 Résultats des calculs avec discrétisation décentrée des termes de convection. 





Synchrone 2 89701 588.3 sec. 1.78 0.89 



Synchrone 4 95881 375.4 sec. 2.80 0.70 



Table 4.40 : Problème non linéaire – Version P.V.M. : coefficient de diffusion : ν = 1 ; coefficients de convection : a = 1.5, 


4.32




Synchrone 2 14290 80.2 sec. 1.57 0.79 



Synchrone 4 16331 53.3 sec. 2.36 0.59 



Table 4.41 : Problème non linéaire – Version P.V.M. : coefficient de diffusion : ν = 10 −1 ; coefficients de convection : 

a = 1.5, b = 0.5 avec 48 641 points de discrétisation, 8 sous-domaines, discrétisation décentrée des dérivées premières. 




Synchrone 2 2158 11.7 sec. 1.66 0.83 



Synchrone 4 2406 9.4 sec. 2.08 0.52 








Synchrone 2 200316 3649.3 sec. 1.78 0.89 



Synchrone 4 209395 1989.4 sec. 3.26 0.81 





4.33




Synchrone 2 35684 517.1 sec. 1.60 0.80 



Synchrone 4 40763 331.2 sec. 2.50 0.63 








Synchrone 2 6401 97.4 sec. 1.56 0.78 



Synchrone 4 7305 62.2 sec. 2.45 0.61 





4.34





Synchrone 2 89701 631.0 sec. 1.80 0.90 




Synchrone 4 95881 370.3 sec. 3.08 0.77 




Table 4.46 : Problème non linéaire – Version M.P.I :coefficient de diffusion : ν = 1 ; coefficients de convection : a = 1.5, 





Synchrone 2 14290 90.7 sec. 1.58 0.79 




Synchrone 4 16331 64.5 sec. 2.22 0.56 




Table 4.47 : Problème non linéaire – Version M.P.I : coefficient de diffusion : ν = 10 −1 ; coefficients de convection : 


4.35




Synchrone 2 2158 19.1 sec. 1.32 0.66 




Synchrone 4 2406 17.3 sec. 1.45 0.36 




Table 4.48 : Problème non linéaire – Version M.P.I. : coefficient de diffusion : ν = 10 −2 ; coefficients de convection : 





Synchrone 2 200316 3890.0 sec. 1.87 0.93 




Synchrone 4 209395 2136.5 sec. 3.40 0.85 




Table 4.49 : Problème non linéaire – Version M.P.I :coefficient de diffusion : ν = 1 ; coefficients de convection : a = 1.5, 


4.36




Synchrone 2 35684 551.0 sec. 1.62 0.81 




Synchrone 4 40763 364.3 sec. 2.46 0.61 







Schwarz processeurs relaxations GS de restitutiode restitution 


Synchrone 2 6401 111.1 sec. 1.50 0.75 




Synchrone 4 7305 74.5 sec. 2.24 0.56 






4.37

3.2 Résultats des calculs avec discrétisation centrée des termes de convection. 





Synchrone 2 89568 591.6 sec. 1.72 0.86 



Synchrone 4 95748 348.7 sec. 2.92 0.73 








Synchrone 2 13912 78.0 sec. 1.57 0.79 



Synchrone 4 15897 57.4 sec. 2.14 0.54 




a = 1.5, b = 0.5 avec 48 641 points de discrétisation, 8 sous-domaines, discrétisation centrée des dérivées premières. 

4.38




Synchrone 2 1456 8.9 sec. 1.52 0.76 



Synchrone 4 1617 7.0 sec. 1.92 0.48 








Synchrone 2 200181 3572.7 sec. 1.82 0.91 



Synchrone 4 209271 1980.0 sec. 3.30 0.82 








Synchrone 2 35332 498.7 sec. 1.64 0.82 



Synchrone 4 40369 380.3 sec. 2.16 0.54 





4.39




Synchrone 2 5406 85.4 sec. 1.56 0.78 



Synchrone 4 6171 53.0 sec. 2.50 0.62 





4.40





Synchrone 2 89568 631.3 sec. 1.76 0.88 




Synchrone 4 95748 369.9 sec. 3.00 0.75 




Table 4.58 : Problème non linéaire – Version M.P.I. : coefficient de diffusion : ν = 1 ; coefficients de convection : a = 1.5, 





Synchrone 2 13912 88.7 sec. 1.52 0.76 




Synchrone 4 15897 63.9 sec. 2.12 0.53 






4.41




Synchrone 2 1456 15.8 sec. 1.30 0.65 




Synchrone 4 1617 14.4 sec. 1.44 0.36 









Synchrone 2 200181 3901.2 sec. 1.80 0.90 




Synchrone 4 209271 2146.8 sec. 3.29 0.82 




Table 4.61 : Problème non linéaire – Version M.P.I. : coefficient de diffusion : ν = 1 ; coefficients de convection : a = 1.5, 


4.42




Synchrone 2 35332 554.8 sec. 1.78 0.89 




Synchrone 4 40369 358.1 sec. 2.76 0.69 







Schwarz processeurs relaxations GS de restitutiode restitution 


Synchrone 2 5406 95.7 sec. 1.48 0.74 




Synchrone 4 6171 65.7 sec. 2.16 0.54 






4.43

3.3 Commentaires sur les résultats du problème non-linéaire. 

Nous obtenons des résultats et des tendances comparables à ceux obtenus pour le problème linéaire. Pour les 

problèmes de grande taille les algorithmes asynchrones sont meilleurs que les algorithmes synchrones. 

Dans la version P.V.M., lorsque les paramètres sont identiques, on constate que les efficacités obtenues pour 

les versions linéaires et non-linéaires sont comparables ; dans certains cas les performances des algorithmes 

asynchrones sont meilleures. Par contre pour les algorithmes synchrones, les efficacités sont moins bonnes pour 

le problème non-linéaire. Pour ce problème de convection-diffusion non-linéaire, les algorithmes asynchrones 

avec P.V.M. ne sont pas pénalisés par la non-linéarité. 

Cette remarque est un peu moins vraie pour la version M.P.I, où les algorithmes synchrones et asynchrones 

obtiennent des efficacités moins bonnes pour un problème non-linéaire que pour un problème linéaire de même 

taille. 

4 Synthèse des différents résultats. 

Si nous nous intéressons dans un premier temps aux résultats du problème linéaire obtenus avec P.V.M., nous 

pouvons remarquer un mauvais fonctionnement de la version asynchrone B.F.C. dans de nombreuses situations. 

La version asynchrone M.F.C. est la version la meilleure et la plus régulière : elle est plus rapide en terme de 

temps de restitution et garde un bon comportement lorsque l’on fait varier le nombre de processeurs. La version 

asynchrone H.F.C. qui ne peut être appliquée que pour une discrétisation décentrée des termes de convection 

donne des résultats plus contrastés et son comportement dépend fortement de l’occupation du réseau. 

Avec M.P.I. la version B.F.C. fonctionne pour tous les problèmes linéaires envisagés et donne des résultats 

comparables aux autres versions asynchrones. La version asynchrone M.F.C. est toujours la version la plus 

régulière. Enfin pour les discrétisations décentrées, la version asynchrone H.F.C. montre un comportement 

meilleur qu’avec P.V.M. et on obtient pour les problèmes de grande taille ( les plus susceptibles d’intéresser la 

parallélisation ) les meilleurs temps de restitution. 

Nous obtenons pour les problèmes non-linéaires des résultats comparables à ceux obtenus pour le problème 

linéaire. Il faut cependant noter qu’avec les algorithmes asynchrones les efficacités restent intéressantes contrairement 

à la version synchrone où elles ont tendance à s’écrouler. 

Finalement nous pouvons remarquer que les algorithmes asynchrones sont vraiment efficaces pour les problèmes 

de grande taille ; c’est avec ces problèmes que l’on obtient de façon régulière de bons résultats pour toutes les 

versions asynchrones. De plus il convient d’ajouter qu’il est préférable de conserver plus de deux sous-domaines 

par processeurs afin d’obtenir de bonnes efficacités et de ne pas obligatoirement chercher à équilibrer la charge 

de travail entre les processeurs. 

5 Comparaison P.V.M. et M.P.I. 

Quand on compare les résultats obtenus avec P.V.M. et M.P.I, pour les différents problèmes considérés, 

linéaires ou non, on remarque tout d’abord que de façon générale la version M.P.I. donne de plus mauvais temps 

que la version P.V.M. Ceci est vrai quelque soit le type d’algorithme, séquentiel ou parallèles. Cela provient 

certainement de l’environnement d’exécution sur l’I.B.M.–SP2. 

4.44

Les versions P.V.M. des algorithmes asynchrones sont aussi meilleures en terme d’efficacité que les versions 

M.P.I. pour les problèmes non-linéaires que nous avons traités. 

Par contre au vu des résultats ( efficacité et speed up ), de la facilité et du confort de mise en œuvre, M.P.I. 

est mieux adapté aux algorithmes asynchrones que P.V.M. pour les problèmes linéaires. Les versions M.P.I. 

des algorithmes asynchrones fonctionnent à coup sûr contrairement à P.V.M. où la version Basse Fréquence de 

Communication conduit à des erreurs lors de l’exécution. 

De plus, avec M.P.I. et pour les problèmes linéaires de grande taille, les algorithmes asynchrones avec communication 

flexible permettent d’obtenir les meilleurs résultats. 

4.45

4.46


1. A. Bermudez, Contrôle par feedback à priori de systèmes régis par des équations aux dérivées partielles de 

type elliptique, Rapport de Recherche INRIA , 288 (1978). 

2. L. Giraud et P. Spitéri, Résolution parallèle de problèmes aux limites non-linéaires, M.2 A.N., 25 (1991), 

pp. 73-100. 

3. L. Giraud and P. Spitéri, Implementations of parallel solutions for nonlinear boundary value problems, 

Parallel Computing’91 Advances in Parallel Computing, Evans, Joubert, Liddel ed., Amsterdam : North- 

Holland, (1992), pp. 203-211. 

4. G.H. Golub et G.A. Meurant, Résolution numérique des grands systèmes linéaires, Eyrolles, (1983). 

5. R. Guivarch, H.C. Boisson, J.C. Miellou et P. Spitéri, Parallélisation de méthodes de sous-domaines pour la 

résolution de problèmes aux limites, Congrès National d’Analyse Numérique, Super-Besse (1995). 

6. R. Guivarch, H.C. Boisson et P. Spitéri, Résolution de problèmes de mécanique des fluides par des méthodes 

paralléles de décomposition de domaines, Congrès National d’Analyse Numérique, La Londe Les Maures 

(1996). 

7. R. Guivarch, P. Spitéri, J.C. Miellou and D. El Baz, Parallelization of subdomains methods with overlapping 

for the solution of convection-diffusion problem, Worshop on iterative methods, International Linear Algebra 

Year, Cerfacs Toulouse (1996), Rapport IRIT/96-36-R. 

8. R. Guivarch, Résolution en mécanique des fluides d’un problème de convection-diffusion par la méthode 

alternée de Schwarz, Journée sur l’utilisation des principaux environnements de programmation parallèle 

dans des applications de calcul scientifiques et de simulation, organisée par le CUTIS, le CAL MIP, la DR 

CNRS et le LAAS CNRS, Toulouse (1996). 

9. R. Guivarch, P. Spitéri, Solution of convection-diffusion problem by Schwarz alternating method using P.V.M. 

and M.P.I. on the I.B.M.-SP2, Parallel Computing ’97 (ParCo97) in Bonn, 16-19 September 1997. 

10. L. Meylheuc, Modélisation d’écoulements de fluides viscoélastiques par la méthode des volumes finis, Thèse 

de Doctorat, Université de Bordeaux 1, (1996). 

11. J.C. Miellou et P. Spitéri, Un critère de convergence pour des méthodes générales de point fixe, M.2 A.N., 

(1985), pp. 170–201. 



13. K. Revelli, Etude des instabilités gravitationnelles dans le procédé d’électrophorèse de zone à écoulement 

continu, Thèse de Doctorat, Université Paul Sabatier de Toulouse ( Sciences ), (1995). 

14. P. Spitéri, Simulation d’exécutions parallèles pour la résolution d’inéquations variationnelles stationnaires, 

Revue E.D.F., série C, n ◦ 1 (1983), pp. 149–159. 

15. P. Spitéri, Contribution à l’étude de grands systèmes non-linéaires, comportement d’algorithmes itératifs, 

stabilité de systèmes continus, Thèse de Doctorat ès Sciences, Besançon (1984). 

16. P. Spitéri, Parallel asynchronous algorithms for solving boundary value problems, In Parallel algorithms, Eds 

M. Cosnard et al., North Holland, (1986) pp. 73–84. 

4.47

4.48

Chapitre 5 

Application des algorithmes 

asynchrones et synchrones à un 

problème d’écoulements 

incompressibles en formulation 

fonction courant-rotationnel. 

Introduction. 

Dans leur formulation classique pression-vitesse, les équations de Navier-Stokes sont constituées par une 

équation d’évolution, permettant de déterminer la quantité de mouvement, couplée à une équation de conservation 

de la masse [3], [10]. L’aspect évolutif des équations de Navier-Stokes implique des difficultés spécifiques 

liées à la stabilité des schémas numériques ; dans le but de résoudre ces difficultés, on utilise des méthodes 

implicites qui conduisent après une linéarisation appropriée à résoudre de grands systèmes algébriques linéaires. 

Dans ce cas la résolution de ce système d’équations nécessite de résoudre le système algébrique de l’équation 

de conservation à chaque pas de temps. Étant donnée la grande taille de ces systèmes, le calcul parallèle est 

la seule méthode pratique pour résoudre ce type de problèmes. Cependant les méthodes de décomposition de 

domaines se prêtent mal à la résolution de l’équation de conservation de la masse. En effet il s’avère difficile 

d’assurer la conservation globale de la masse à partir de la conservation locale sur chaque sous-domaine. 

Cependant il est possible de mettre en œuvre les méthodes de décomposition de domaines si on modifie la 

formulation des équations de Navier-Stokes. En utilisant la formulation fonction courant-rotationnel, la pression 

est éliminée du système d’équations et le système résultant se compose d’une équation de conservation de 

Poisson couplée à une équation d’évolution de convection-diffusion [11], [28]. De plus en 2D, le champ évolutif 

des vitesses est réduit à une seule composante et cela simplifie la mise en œuvre des méthodes de décomposition 

de domaines. Cette formulation présente un avantage supplémentaire par rapport à la formulation directe dans 

la mesure où la condition de conservation de la masse n’apparaît plus explicitement. 

5.1

Le but du présent chapitre est de s’intéresser à la formulation fonction courant-rotationnel pour résoudre le 

système couplé des équations de Navier-Stokes en utilisant des méthodes de sous-domaines. La méthode alternée 

de Schwarz avec recouvrement est bien adaptée pour résoudre les problèmes de convection-diffusion [21]. Les 

opérateurs impliqués dans cette formulation permettent d’utiliser sous certaines conditions les algorithmes 

synchrones et asynchrones classiques ainsi que les algorithmes asynchrones avec communication flexible. 

Pour l’équation de Poisson apparaissant dans la formulation courant-rotationnel, nous utilisons une variante 

de la méthode alternée de Schwarz proposée par J.C. Miellou [24] ; dans ce cas de figure, cette méthode s’avère 

être une méthode directe et est particulièrement efficace en terme de temps de calcul pour résoudre des problèmes 

discrétisés de grande taille tout en étant très bien adaptée à l’implémentation parallèle [16]. Nous pouvons noter 

que cette méthode peut être aussi appliquée à l’équation de convection-diffusion mais nous verrons par la suite 

que pour un problème d’évolution, cette méthode est moins intéressante. 

Pour les deux variantes de la méthode alternée de Schwarz, les propriétés des opérateurs discrets sont telles 

que la convergence des algorithmes itératifs séquentiels et parallèles, synchrones ou asynchrones est garantie 

[27], [26], [34]. Nous pourrons donc utiliser les critères exposés aux chapitres 1 et 2. 

Les méthodes exposées précédemment sont testées sur le problème test de la cavité entraînée [31]. Les équations 

du problème sont présentées dans le paragraphe 1, les algorithmes numériques dans le paragraphe 2 et les 

expérimentations numériques dans le paragraphe 3 et une synthèse des résultats au paragraphe 4. 

5.2

1 Equations du problème. 

Soit Ω un ouvert borné inclus dans IR 2 . La formulation pression-vitesse des équations de Navier-Stokes pour 

les fluides incompressibles s’écrit de la manière suivante : 

⎧ 

⎪⎨ 

⎪⎩ 

∂u ∂v 

∂x + ∂y = 0 

∂u ∂u ∂u ∂p 

∂t + u ∂x + v ∂y = − ∂x + ν∆u 

∂v ∂v ∂v ∂p 

∂t + u ∂x + v ∂y = − ∂y + ν∆v 

u /∂Ω = UΓ ; v /∂Ω = VΓ 

⎫ 

u(x, y, t = 0) = U0 ; v(x, y, t = 0) = V0 

⎪⎬ 

, sur Ω × [0, T ] 

⎪⎭ 

où t est le temps courant, T est l’horizon, u et v sont les composantes du vecteur vitesse ( Vx = u ; Vy = v ), 

p est la pression scalaire, (U0; V0) sont les conditions initiales, (UΓ; VΓ) les conditions aux limites. La viscosité 

cinématique ν est liée au nombre adimensionnel de Reynolds (Re = ν −1 ). 

Ces équations peuvent être exprimées en utilisant la fonction de courant Ψ et la fonction rotationnel ω ; 

ces deux quantités vectorielles étant réduites dans le problème 2D à la composante perpendiculaire au plan 

d’écoulement du fluide. Les relations entre ces variables et les variables de la formulation pression-vitesse sont 

les suivantes : 

u = ∂Ψ 

∂y 

v = − ∂Ψ 

∂x 

⎫ 

⎪⎬ 

ω = − ∂u ∂v 

∂y + ∂x 

⎪⎭ ⇔ Ψ = (u dy − v dx) 

Les équations en formulation fonction courant-rotationnel s’énoncent de la façon suivante : 

⎧ 

⎪⎨ 

⎪⎩ 

−∆Ψ = ω 

∂ω 

∂t 

∂ω ∂ω 

+ u ∂x + v ∂y − ν∆ω = 0 

V /∂Ω = VΓ 

ω(x, y, 0) = ω0 

⎫ 

⎬ 

, sur Ω × [0, T ] 

⎭ 

Le principal avantage de cette formulation est l’élimination de la pression comme variable indépendante. De 

plus dans le cas bidimensionnel seules deux équations scalaires sont à résoudre. Cependant, les conditions aux 

limites sont généralement exprimées en terme de vitesse et il est donc nécessaire de transformer ces conditions 

pour la fonction courant. Notons que pour la fonction rotationnel qui est une variable intermédiaire, aucune 

condition limite n’est requise [11]. 

On peut montrer qu’une ligne de courant i.e. une ligne normale au champ de vitesse, est définie par une valeur 

constante de Ψ. Quand l’écoulement suit une paroi imperméable, celle ci peut être considérée comme une ligne 

de courant. En utilisant une telle condition, il est possible d’imposer une valeur nulle pour la vitesse normale 

à la paroi. Mais dans le but d’empêcher des vitesses tangentielles, par exemple pour une condition d’adhérence 

5.3 

(5.1) 

(5.2) 

(5.3)

qui apparaît sur une paroi fixe quand le fluide est visqueux, une autre condition doit être introduite via une 

contrainte particulière sur la vitesse aux frontières. 

Plus généralement la fonction de courant peut être calculée en intégrant le champ de vitesse le long de la 

frontière lorsque celui-ci est spécifié. Les conditions aux limites de Dirichlet peuvent être alors appliquées à la 

fonction courant. Pour la fonction rotationnel, les relations entre les valeurs sur les frontières et les valeurs à 

l’intérieur du domaine doivent être calculées. 

Afin de résoudre le problème couplé en régime permanent, on effectue une une discrétisation en temps implicite 

du problème. Dans la plus simple formulation d’Euler pour l’équation d’évolution, il est nécessaire de résoudre 

le système couplé suivant à chaque pas de temps : 

⎧ 

⎪⎨ 

⎪⎩ 

kω ′ + ū ∂ω′ 

∂x 

ω ′ /Γ = g(ū, ¯v, ¯ Ψ, ¯ω) 

−∆Ψ ′ = ω ′ 

Ψ ′ /Γ = 0 

+ ¯v ∂ω′ 

∂y − ν∆ω′ = k¯ω, dans Ω 

où les valeurs ’ correspondent aux valeurs de l’instant courant et les valeurs¯sont celles de l’instant précédent. 

k = (∆t) −1 est l’inverse du pas de temps. Le calcul des conditions aux limites ω /Γ pour le problème de la cavité 

entraînée est explicité au paragraphe 3. 

2 Algorithmes numériques. 

Il a été montré dans le paragraphe précédent que la résolution de l’équation de Navier-Stokes définie dans 

un domaine bidimensionnel Ω conduit à la résolution de deux problèmes couplés aux limites ; le premier est 

un problème classique de Poisson et le second un problème de convection-diffusion avec dans les deux cas 

des conditions aux limites de Dirichlet. Nous nous intéressons dans ce paragraphe à la résolution de ces deux 

problèmes. Étant donné les caractéristiques de chaque problème, nous allons résoudre le premier par une variante 

de la méthode alternée de Schwarz, tandis que nous utiliserons la méthode classique de Schwarz déjà mise en 

œuvre dans les chapitres précédents pour résoudre l’équation de convection-diffusion. 

2.1 Méthode alternée de Schwarz classique pour l’équation de convection-diffusion. 

Nous considérons tout d’abord l’équation d’évolution de convection-diffusion ; celle-ci peut être discrétisée 

selon un schéma implicite en temps ; ainsi le problème est remplacé par une suite de problèmes stationnaires du 

type : 

⎧ 

⎨ 

⎩ 

−ν∆ω + u ∂ω ∂ω 

∂x + v ∂y + kω = k¯ω, sur Ω 

ω /∂Ω = g 

où ¯ω est la valeur de ω à l’instant précédent. 

Le problème (5.5) est un problème de convection-diffusion linéaire déjà rencontré au chapitre 4 ; nous considérons 

dans le cas le plus simple une discrétisation par différences finies selon un pas d’espace h uniforme ; les résultats 

5.4 

(5.4) 

(5.5)

suivants restent cependant valides si nous utilisons des maillages non uniformes ou des méthodes par éléments 

finis ou volumes finis ( voir [16], [32], [34] ). 

Le Laplacien est discrétisé en utilisant un schéma de différences finies classique à cinq points. Les termes de 

convection peuvent être discrétisées par des schémas de discrétisation centrés ou décentrés en accord avec les 

signes de u et v ( voir l’équation (4.2) ). 

2.1.1 Cas des schémas de discrétisation décentrés. 

Pour les schémas de discrétisation décentrés des dérivées premières, nous montrons en appliquant le résultat 

de la proposition 4.1 du chapitre 4 que la matrice de discrétisation obtenue est une M-matrice. Le problème 

(5.5), discrétisé à l’aide de ces schémas rentre donc dans le cadre de la H-accrétivité et aussi des M-fonctions. 

Ainsi les algorithmes parallèles synchrones et asynchrones classiques et les algorithmes parallèles asynchrones 

avec communication flexible convergent. 

2.1.2 Cas des schémas de discrétisation centrés. 

Pour les schémas de discrétisation centrés des termes de convection, on peut montrer par une variante de 

Chazan-Miranker [5] ( pour de plus amples détails voir aussi [16], [26], [32] ) qu’il est toujours possible de 

prendre un pas de temps ∆t suffisamment petit de telle façon à ce que la matrice de discrétisation soit à 

diagonale dominante stricte ou soit irréductible à diagonale dominante. ∆t doit être choisi en fonction du pas 

d’espace h, du coefficient de diffusion et des composantes de la vitesse. Plus précisément si la condition suivante, 

analogue pour ce problème de la condition (4.15), est vérifiée : 

|u| + |v| ≤ 4ν 

+ kh (5.6) 

h 

avec |.| la norme infinie, alors la matrice de discrétisation est une H-matrice. Les algorithmes synchrones et 

asynchrones classiques appliqués à ce problème convergent. 

Remarque 5.1. Suivant l’évolution de la vitesse, nous pouvons adapter le pas de temps, pour qu’à tout 

moment le critère (5.6) soit vérifié. 

Les algorithmes asynchrones avec communication flexible sont plus délicats à appliquer avec ce type de 

discrétisation centrée des termes de convection. Le critère suivant qui est déduit de la proposition 4.7 et qui 

permet à la matrice de discrétisation d’être une Z-matrice 

⎧ 

⎨ 

⎩ 

| u | ≤ 2ν 

h , 

| v | ≤ 2ν 

h , 

est plus difficile à vérifier. En effet il ne fait plus intervenir le pas de temps. Si l’on ne connaît pas à priori 

l’évolution de la vitesse, nous ne sommes pas assurés de la convergence des algorithmes asynchrones avec 


5.5 

(5.7)

2.2 Une variante efficace de la méthode alternée de Schwarz pour l’équation de diffusion. 

La méthode alternée de Schwarz classique peut être aussi utilisée pour la résolution de l’équation de diffusion 

; dans ce paragraphe nous considérons une variante de la méthode alternée de Schwarz qui s’avère 

expérimentalement plus efficace pour ce type de problème que l’algorithme classique. Cette variante a été 

introduite et analysée par J.C. Miellou [24]. 

Pour exposer cette variante, nous reprenons les notations du paragraphe 3.1 du chapitre 1 pour décrire le 

découpage du domaine Ω en N sous-domaines. Ces notations sous les suivantes : 

Ω = N i=1 Ωi, 

 

Ωi+1 = ∅, 

Ωi 

γ1 

i = ∂Ωi Ωi−1, i ∈ {2, . . . , N}, 

γ2 

i = ∂Ωi Ωi+1, i ∈ {1, . . . , N − 1}, 

 

Γi = ∂Ωi ∂Ω 

où ∂Ω est la frontière du domaine Ω, ∂Ωi est la frontière de Ωi, γ 1 i ( resp. γ2 i 

droite ) du sous-domaine Ωi, Γi est la restriction de ∂Ω à Ωi. 

Ω1 

1 

γ γ γ 1 

2 

Ω 2 Ω 3 Ω 4 

γ γ 

2 

1 

γ γ 1 

2 2 2 2 

γ 

1 3 4 3 5 4 

Figure 5.1 : Exemple de décomposition du domaine Ω par cinq sous-domaines. 

) est la frontière gauche ( resp. 

Pour i ∈ {1, . . . , N}, nous pouvons associer au problème de diffusion le système suivant de problèmes aux 

limites : ⎧⎪ ⎨ 

⎪⎩ 

−∆Ψi = ωi sur Ωi 

Ψi /Γi = 0 

Ψi /γ 1 i 

Ψi /γ 2 i 

= Ψi−1 /γ 1 i 

= Ψi+1 /γ 2 i 


pour 1 ≤ i ≤ N − 1 

5.6 

Ω 5 

(5.8)

Pour i ∈ {1, . . . , N}, le système (5.8) peut être réécrit en deux systèmes : 

et ⎧⎪ ⎨ 

⎪⎩ 

⎧ 

⎪⎨ 

⎪⎩ 

−∆ ¯ Ψi = ωi sur Ωi 

¯Ψi /Γi = 0 

¯Ψi /γ 1 i 

¯Ψi /γ 2 i 

−∆ ˜¯ Ψi = 0 sur Ωi 

˜¯Ψi /Γi = 0 

˜¯Ψi /γ 1 i 

˜¯Ψi /γ 2 i 

= ˜¯ Ψi−1 /γ 1 i 

= ˜¯ Ψi+1 /γ 2 i 

= 0 pour 2 ≤ i ≤ N 

= 0 pour 1 ≤ i ≤ N − 1 

+ ¯ Ψi−1 /γ 1 i 

+ ¯ Ψi+1 /γ 2 i 


pour 1 ≤ i ≤ N − 1 

Soient ( ¯ Ψi, ˜¯ Ψi) les solutions de (5.9) et (5.10) ; alors la solution de (5.8) est obtenue par superposition : 

(5.9) 

(5.10) 

Ψi = ¯ Ψi + ˜¯ Ψi pour i ∈ {1, . . . , N} (5.11) 

La solution de (5.9) peut être obtenue facilement contrairement à la solution de (5.10) qui nécessite la résolution 

au préalable d’un problème de point fixe permettant de déterminer ses conditions aux limites [24]. 

En utilisant la numérotation des frontières donnée par la figure 5.1, la matrice T associée au problème de 

point fixe a, dans le cas d’une décomposition par cinq sous-domaines, la forme suivante : 

⎛ 

⎜ 

T = ⎜ 

⎝ 

I −T γ2 

1 

γ 1 2 

−T γ1 

2 

γ 2 1 

−τ γ1 

2 

γ 1 3 

0 0 0 0 0 0 

I 0 −τ γ2 

2 

γ 2 1 

0 I −T γ2 

2 

γ 1 3 

0 0 −T γ1 

3 

γ 2 2 

0 0 −τ γ1 

3 

γ 1 4 

0 0 0 0 

0 0 0 0 

I 0 −τ γ2 

3 

γ 2 2 

0 I −T γ2 

3 

γ 1 4 

0 0 0 0 −T γ1 

4 

γ 2 3 

0 0 0 0 −τ γ1 

4 

γ 1 5 

0 0 

0 0 

I 0 −τ γ2 

4 

γ 2 3 

0 I −T γ2 

4 

γ 1 5 

0 0 0 0 0 0 −T γ1 

5 

γ 2 4 

I 

⎞ 

⎟ 

⎠ 

(5.12) 

Les matrices T β α et τ δ γ représentent les interactions des frontières de recouvrement d’un sous-domaine sur les 

frontières des sous-domaines voisins incluses dans ce sous-domaines. Ainsi si on se place dans le sous-domaine 

Ω2, T γ1 

2 

γ 2 1 

dans Ω2. 

et τ γ2 

2 

γ 2 1 

sont respectivement les interactions de γ 1 2 et γ 2 2, frontières de Ω2 sur γ 2 1, frontière de Ω1 incluse 

5.7

Ω1 

Τ 

τ 

Ω2 Ω3 Ω4 

1 

γ γ γ 

2 

1 

γ γ 

2 

1 

γ γ 1 

2 2 2 2 

γ 

1 3 4 3 5 4 

Figure 5.2 : Interactions entre les frontières de recouvrement. 

Dans le cas de figure où les cinq sous-domaines sont identiques, la matrice T a la forme suivante : 

⎛ 

I −T 0 0 0 0 0 0 

⎞ 

⎜ 

−T 

⎜ −τ 

⎜ 0 

T = ⎜ 0 

⎜ 0 

⎜ 

⎝ 0 

I 

0 

0 

0 

0 

0 

0 

I 

−T 

−τ 

0 

0 

−τ 

−T 

I 

0 

0 

0 

0 

0 

0 

I 

−T 

−τ 

0 

0 

−τ 

−T 

I 

0 

0 

0 

0 

0 

0 

I 

0 

0 

0 

0 

−τ 

−T 

⎟ 

⎠ 

0 0 0 0 0 0 −T I 

Ω5 

(5.13) 

Pour simplifier la présentation des algorithmes, nous considérons par la suite le cas où tous les sous-domaines 

sont identiques. 

Compte tenu de la propriété de décroissance du noyau de Poisson [24], les sous-matrices T représentent les 

interactions fortes entre les frontières. Ces sous-matrices sont constituées de coefficients d’amplitude importante ; 

cette propriété montre que les inconnues sur une frontière de recouvrement d’un sous-domaine Ωj, intérieure à 

un sous-domaine Ωi sont fortement couplées aux inconnues de la frontière du sous-domaine Ωi la plus proche. 

Par contre les sous-matrices τ prennent en compte les interactions faibles entre les frontières éloignées ; ces 

sous-matrices ont des coefficients de faible amplitude. Cette propriété indique que les inconnues sur une frontière 

de recouvrement d’un sous-domaine Ωj, intérieure à un sous-domaine Ωi sont faiblement couplées aux inconnues 

de la frontière la plus éloignée de ce sous-domaine. 

Si on note b r i = ¯ Ψj /γ r i 

avec r = {1, 2} et j = i ± 1 et bi le vecteur de composantes b r i 

alors le problème (5.10) 

peut être résolu moyennant la résolution au préalable d’une équation de point fixe associée au problème linéaire 

suivant : 

T ϕ = b. (5.14) 

La solution de (5.14) fournit les conditions aux limites nécessaires à la résolution du problème (5.10). Ainsi, 

5.8

après la résolution de (5.14), la solution de (5.10) est obtenue en résolvant les problèmes suivants pour i ∈ 

{1, . . . , N} : 

⎧ 

⎪⎨ 

⎪⎩ 

−∆ ˜¯ Ψi = 0 sur Ωi 

˜¯Ψi /Γi = 0 

˜¯Ψi /γ 1 i 

˜¯Ψi /γ 2 i 

= ϕi−1 pour 2 ≤ i ≤ N 

= ϕi+1 pour 1 ≤ i ≤ N − 1 

Finalement la solution de l’équation de Poisson peut être obtenue par l’algorithme résumé ci-dessous : 

(5.15) 

1. pré-résolution : résolution du système de problèmes aux limites (5.9) indépendants qui fournit ( ¯ Ψi) pour 

i ∈ {1, . . . , N} ; 

2. résolution du système (5.14) via la résolution d’une équation de point fixe associée qui donne (ϕi) pour 

i ∈ {1, . . . , N} ; 

3. post-résolution : résolution du système de problèmes aux limites (5.15) ; on obtient ( ˜¯ Ψi) pour i ∈ {1, . . . , N} ; 

4. en regroupant les solutions des étapes 1 et 3, on trouve Ψi = ¯ Ψi + ˜¯ Ψi pour i ∈ {1, . . . , N} solution de 

(5.8). 

Remarque 5.2. Les étapes 1 et 3 correspondent à la résolution de problèmes aux limites complètement 

découplés qui peuvent être résolus de manière parallèle. La discrétisation de ces problèmes conduit à des systèmes 

linéaires de grande taille ; la résolution numérique de tels systèmes peut être réalisée en utilisant les algorithmes 

les plus efficaces, par exemple les méthodes multigrilles, les méthodes de gradient conjugué ... 

Remarque 5.3. La matrice T est l’analogue discret de l’opérateur intégral linéaire associé au noyau de 

Poisson. Compte tenu de la propriété de décroissance du noyau de Poisson, la convergence du schéma asynchrone 

appliqué à la résolution du problème de point fixe associé à l’équation (5.14) peut être montrée [24], [25]. Les 

méthodes asynchrones permettent de ne pas communiquer systématiquement les valeurs des composantes dont 

le calcul fait intervenir les coefficients de la matrice T associés aux blocs hors diagonaux τ. Dans ce cas, un 

schéma asynchrone appliqué sur un bloc de composantes est décrit de la manière suivante [1] : 

 

ϕ (p+1) 

i 

ϕ (p+1) 

i+1 

= bi + T ϕ (p) 

i+1 + τϕ(p−ri(p)) i−2 

= bi+1 + T ϕ (p+1) 

i 

+ τϕ (p−ri+1(p)) 

i+3 

où les retards ri(p) vérifient conformément aux hypothèses (1.9) et (eq.1.10) du chapitre 1 : 

(5.16) 

ri(p) ≤ p et lim 

p→∞ (p − ri(p)) = +∞ (5.17) 

Remarque 5.4. Si nous considérons le sous-domaine Ωi, la matrice T qui représente les interactions entre la 

est obtenue en résolvant une suite de problèmes de Poisson. 

frontière γ 2 i−1 et la frontière γ1 i 

5.9

La k ième colonne de T est obtenue comme la restriction de la solution du problème suivant : 

⎧ 

⎪⎨ 

⎪⎩ 

−∆zi = 0 sur Ωi, 

zi /Γi = 0, 

zi /γ 1 i 

zi /γ 2 i 

= ek, 

= 0, 

(5.18) 

aux points de γ 2 i−1 . ek étant le vecteur dont les composantes sont toutes égales à 0 sur les points de la frontière 

γ 1 i sauf pour le kième point de celle-ci où la composante vaut 1. 

De la même manière, la kième colonne de τ, matrice qui prend en compte les interactions entre la frontière 

est obtenue comme la restriction de la solution du problème : 

γ 2 i−1 et la frontière γ2 i 

aux points de γ 2 i−1 . 

⎧ 

⎪⎨ 

⎪⎩ 

−∆zi = 0 sur Ωi, 

zi /Γi = 0, 

zi /γ 1 i 

zi /γ 2 i 

= 0, 

= ek, 

Pour les matrices concernant la frontière γ1 i+1 , on utilise un procédé symétrique. 

3 Expérimentations numériques. 

(5.19) 

Les algorithmes précédents ont été testés sur le problème de la cavité entraînée 2D. Un fluide dans une cavité 

est mis en mouvement par une vitesse constante sur la paroi supérieure ; le nombre de Reynolds est le paramètre 

principal de ce problème. Ce cas test a été étudié par de nombreux auteurs comme G. de Vahl Davie [7], J.L. 

Estivalezes et al. [10], R. Schreiber and H.B. Keller [31] parmi d’autres. 

Ψ = 0, 

∂Ψ 

∂x 

= 0 

A 

Ψ = 0, ∂Ψ 

∂y 

Ψ = 0, ∂Ψ 

∂y 

= UAD 

✲ 

Ψ = 0, 

∂Ψ 

∂x = 0 

B 

 

= 0 

C 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fig. 5.1: Cavité entraînée 2D. 

5.10 

D

Pour ce problème, la condition aux limites pour le rotationnel est obtenue par des formules de discrétisation 

décentrées. Par exemple sur le point du maillage (i, N +1) de AD ( voir [11] et [15] ), différentes approximations 

peuvent être considérées en utilisant : 

2 points : ωi,N+1 = 



1 

2h2 (Ψi,N−1 − 8 Ψi,N) + 3 

h UAD(i) 

1 

3h2 (− Ψi,N−2 + 6 Ψi,N−1 − 21 Ψi,N ) + 4 

h UAD(i) 

1 

144h 2 (33 Ψi,N−3 − 208 Ψi,N−2 − 612 Ψi,N−1 − 1392 Ψi,N ) + 660 

144h UAD(i) 

(5.20) 

Les tableaux 5.1 à 5.19 contiennent les résultats des calculs pour différentes tailles de problèmes et différentes 

valeurs du nombre de Reynolds. Le nombre de sous-domaines est 6 ou 8. Le découpage du domaine Ω en sousdomaines 

s’effectue verticalement. Ces sous-domaines ont la même forme et le même nombre de points ; ainsi 

les matrices T et τ sont calculées une fois pour toute. 

Notons finalement que durant les étapes 1 et 3 de la variante de la méthode alternée de Schwarz, l’équation 

de diffusion a été résolue par une méthode de gradient conjugué et que pour résoudre l’équation de convectiondiffusion 

sur chaque sous-domaine, la méthode de Gauss-Seidel a été utilisée. 

3.1 Algorithmes séquentiels. 

Nous considérons dans un premier temps la résolution séquentielle de l’équation de Navier-Stokes. Dans ce 

paragraphe on compare, pour l’équation de diffusion seulement, l’efficacité de la méthode alternée de Schwarz 

classique avec la variante de la méthode alternée de Schwarz présentée au paragraphe 2.2. Le tableau 5.1 expose le 

détail des résultats expérimentaux. Les expériences numériques montrent que la variante de la méthode alternée 

de Schwarz est plus efficace que la méthode classique ; en effet pour cette variante les temps de restitution sont 

plus faibles pour toutes les tailles de problèmes. 

Notons que les temps de calcul n’augmentent pas exagérément avec la détermination des matrices d’interaction 

T et τ obtenues par la résolution des systèmes (5.18) et (5.19). L’intérêt de la variante de la méthode alternée 

de Schwarz pour ce type de problème réside dans le fait que ces matrices d’interaction sont calculées une fois 

pour toute et réutilisables pour chaque pas de temps. Si en plus ces matrices sont stockées dans des fichiers, elles 

peuvent resservir pour tous les calculs qui reposent sur une même géométrie où seuls changent les paramètres 

physiques du problème ( valeur du nombre de Reynolds, nombre de sous-domaines, vitesse sur la paroi supérieure 

de la cavité ). Ainsi le choix de cette variante de la méthode alternée de Schwarz conduit dans ce cas à une 

économie en calculs et en temps. 

Un autre point intéressant à analyser est le temps passé pour résoudre chacune des équations. Avec la méthode 

alternée de Schwarz classique, 73% du temps est utilisé pour résoudre l’équation de diffusion et 27% à résoudre 

l’équation de convection-diffusion. L’utilisation de cette variante inverse ce rapport ( 31% pour l’équation de 

Poisson, 69% pour l’équation de convection-diffusion ). 

La variante de la méthode alternée de Schwarz peut être aussi appliquée à la résolution du problème d’évolution 

de convection-diffusion. Cependant l’opérateur qui intervient dans ce problème change à chaque pas de temps ; 

en effet u et v ne dépendent pas seulement de l’espace mais aussi du temps. Si nous voulons utiliser cette 

méthode, il faut calculer pour chaque sous-domaine et à chaque pas de temps, les matrices d’interaction T et τ, 

qui sont maintenant différentes pour chaque sous-domaine. Dans ce cas de figure, les coûts de calcul s’avèrent 

5.11

Variante de la méthode de Schwarz Variante de la méthode de Schwarz 

taille de Méthode classique de Schwarz avec calcul des sans calcul des 

la grille matrices d’interaction matrices d’interaction 

Temps Nombre de Temps Nombre de Temps Nombre de 

elapsed résolutions du GC elapsed résolutions du GC elapsed résolutions du GC 

1739 4.58 sec. 378 4.24 sec. 59 3.04 sec. 12 

8075 60.28 sec. 1578 26.09 sec. 107 11.95 sec. 12 

34571 804.34 sec. 2880 272.91 sec. 203 55.42 sec. 12 

Table 5.1 : Comparaison de la méthode de Schwarz classique et de sa variante pour le premier pas de temps avec ou sans 

calcul des matrices d’interaction ( algorithme séquentiel ), Re = 1000 sur une Alliant FX80. 

être prohibitifs. 

3.2 Algorithmes parallèles. 

Les principaux paramètres qui influent sur les performances des algorithmes sont le nombre de Reynolds Re, 

le pas de discrétisation du maillage h, le pas de discrétisation en temps ∆t et le nombre de processeurs. 

Les expérimentations numériques ont été réalisées pour trois tailles de problèmes. 

1. une taille modeste avec 22 606 points de discrétisation, le domaine Ω étant découpé en 8 sous-domaines 

d’approximativement 4100 points. Le pas d’espace h est égal à 5, 6.10 −3 . 

2. une taille moyenne avec 64 400 points de discrétisation, le domaine Ω étant découpé en 8 sous-domaines 

d’approximativement 10000 points. Dans ce cas h est égal à 3.10 −3 . 

3. une grande taille avec 101 200 points de discrétisation, le domaine Ω étant découpé en 8 sous-domaines 

d’approximativement 14600 points. h est ici égal à 2.10 −3 . 

Remarque 5.5. Pour ne pas avoir des sous-domaines trop étirés, Ω n’est pas obligatoirement le carré unité. Ce 

qui explique les valeurs de h. Pour chaque grandeur de problème, la zone de recouvrement comporte 12*NDCY, 

NDCY étant le nombre de points selon l’axe Oy. Le recouvrement se fait suivant l’axe Ox. 

Pour chaque taille, nous avons considéré trois valeurs du nombre de Reynolds Re = 10, Re = 100, Re = 1000. 

Les problèmes discrétisés par des schémas centrés des termes de convection ont été résolus par une version 

séquentielle et par deux versions parallèles avec résolution de l’équation de convection-diffusion par un algorithme 

synchrone et par un algorithme asynchrone Moyenne Fréquence de Communication ( M.F.C. ). 

La résolution des problèmes discrétisés par des schémas décentrés des termes de convection a été effectuée par 

une version séquentielle, par trois versions parallèles avec résolution de l’équation de convection-diffusion par un 

algorithme synchrone pour la première, par un algorithme asynchrone Moyenne Fréquence de Communication 

( M.F.C. ) pour la deuxième et par un algorithme asynchrone Haute Fréquence de Communication ( H.F.C. ) 

en ce qui concerne la dernière. 

Remarque 5.6. Les tests de la résolution des problèmes discrétisés par des schémas centrés ne comportent pas 

de résultats avec la version H.F.C. de l’algorithme asynchrone car la convergence des algorithmes asynchrones 

avec communication flexible est délicate à assurer pour ce type de discrétisation ( voir paragraphe 2.1.2 ). 

5.12

Les résultats expérimentaux sont résumés dans les tableaux 5.2 à 5.19. Le nombre de relaxations de la méthode 

de Gauss-Seidel nécessaire à la résolution de l’équation de convection-diffusion est indiqué dans la troisième 

colonne des tableaux ; ce nombre comptabilise les relaxations de tous les sous-domaines et de tous les pas de 

temps. 

Pour toutes les expérimentations cent pas de temps ont été calculés ; le pas de discrétisation en temps est 

∆t = 10 −4 sauf pour les calculs relatifs au problème de grande taille et de nombre de Reynolds égal à 10 

( tableaux 5.8 et 5.17 ) où le pas de temps est de 10 −5 afin de vérifier la condition (5.6) du paragraphe 2.1.2. 

Nous avons utilisé de 2 à 8 processeurs suivant les tailles de problèmes étudiés. 

Lors de la comparaison des algorithmes parallèles nous avons considéré que pour un problème donné les 

algorithmes donnaient des résultats équivalents en terme d’efficacité si leurs efficacités différaient de moins de 

1%. Les résultats et les performances des algorithmes sont comparés en regardant leurs efficacités. 

3.2.1 Résultats des calculs avec discrétisation centrée des termes de convection. 




Synchrone 2 21418 535.4 sec. 1.60 0.80 


Synchrone 4 21418 417.1 sec. 2.05 0.51 


Table 5.2 : Problème de la cavité entrainée : Re = 10 avec 22 606 points de discrétisation, 8 sous-domaines, discrétisation 





Synchrone 2 9558 521.1 sec. 1.54 0.77 


Synchrone 4 9558 357.6 sec. 2.25 0.56 




5.13




Synchrone 2 5961 566.9 sec. 1.42 0.71 


Synchrone 4 5961 351.3 sec. 2.30 0.57 







Synchrone 2 47538 2373.7 sec. 1.72 0.86 


Synchrone 4 47538 1495.5 sec. 2.72 0.68 


Synchrone 8 47538 985.4 sec. 4.13 0.51 




Une comparaison des résultats donnés par les versions synchrone et M.F.C. de l’algorithme asynchrone 

montre trois types de situations : 

1. La version asynchrone est plus efficace ou équivalente à la version synchrone et le nombre de relaxations 

de la version asynchrone est moindre. 

2. La version asynchrone est plus efficace ou équivalente à la version synchrone et le nombre de relaxations 

de la version asynchrone est plus important. 

3. La version asynchrone est moins efficace que la version synchrone et le nombre de relaxations de la version 

asynchrone est moins important. 

5.14




Synchrone 2 13573 2053.7 sec. 1.78 0.89 


Synchrone 4 13573 1256.1 sec. 2.92 0.73 


Synchrone 8 13573 833.9 sec. 4.40 0.55 







Synchrone 2 7672 2024.4 sec. 1.71 0.85 


Synchrone 4 7672 1288.6 sec. 2.68 0.67 


Synchrone 8 7672 773.5 sec. 4.47 0.56 




Pour analyser ces comportements, nous nous intéressons aux résultats des différentes versions suivant le 

nombre de processeurs. 

1. Expérimentations avec 2 processeurs : les résultats obtenus sont contrastés suivant la taille des problèmes. 

La version asynchrone obtient de bon résultats pour la taille modeste, des résultats équivalent pour la 

taille moyenne mais de mauvais résultats pour la grande taille. 

La troisième situation où la version asynchrone est moins bonne que la version synchrone et le nombre de 

relaxations de la version asynchrone est moins important se retrouve exclusivement pour le problème de 

grande taille résolu avec 2 processeurs. C’est une situation nouvelle par rapport aux situations rencontrées 

aux chapitres précédents et difficile à expliquer. 

2. Expérimentations avec 4 processeurs : dans tous les cas de figure la version asynchrone est meilleure 

que la version synchrone à une exception près où elle est équivalente. Le nombre de relaxations de la 

version asynchrone est soit plus important, soit moins important ; on trouve le même phénomène que celui 

rencontré au chapitre 4 pour la résolution de l’équation de convection-diffusion. 

C’est avec ce nombre de processeurs que la différence de performance entre la version asynchrone et 

synchrone est la plus importante en terme d’efficacité. 

5.15



équentielle 1 19609 6289.2 sec. - - 

Synchrone 2 20670 3477.0 sec. 1.80 0.90 


Synchrone 4 20670 2082.6 sec. 3.02 0.75 


Synchrone 8 20670 1299.4 sec. 4.84 0.60 







Synchrone 2 20618 3535.1 sec. 1.86 0.93 


Synchrone 4 20618 2106.9 sec. 3.12 0.78 


Synchrone 8 20618 1293.7 sec. 5.10 0.64 




3. Expérimentations avec 8 processeurs : nous avons un bon comportement de la version asynchrone ; dans la 

plupart des cas la version asynchrone effectue plus de relaxations que la version synchrone. Là aussi, nous 

retrouvons un comportement rencontré au chapitre précédent : un où plusieurs processeurs effectuent 

un grand nombre de relaxations en attendant les valeurs nouvelles de la solution sur les frontières de 

recouvrement. Cela augmente fortement le nombre de relaxations total sans être pénalisant en temps de 

restitution. 

Pour résumer nous observons pour ces expérimentations un bon comportement de la version asynchrone 

pour des calculs effectués avec 8 processeurs mais surtout avec 4 processeurs. Le ratio de 2 sous-domaines par 

processeur semble être optimal. 

5.16




Synchrone 2 9232 3332.5 sec. 1.87 0.93 


Synchrone 4 9232 2072.0 sec. 3.00 0.75 


Synchrone 8 9232 1221.0 sec. 5.10 0.64 


Table 5.10 : Problème de la cavité entrainée : Re = 1000 avec 101 200 points de discrétisation, 8 sous-domaines, 

discrétisation centrée des termes de convection. 

5.17

3.2.2 Résultats des calculs avec discrétisation décentrée des termes de convection. 




Synchrone 2 20169 572.2 sec. 1.48 0.74 



Synchrone 4 20169 405.6 sec. 2.08 0.52 




décentrée des termes de convection. 




Synchrone 2 9675 511.4 sec. 1.56 0.78 



Synchrone 4 9675 348.0 sec. 2.30 0.58 





Pour ces problèmes avec discrétisation décentrée des termes de convection, nous comparons les deux versions 

asynchrones M.F.C. et H.F.C. avec la version synchrone et les versions asynchrones entre elles. 

Tout d’abord la version asynchrone M.F.C. est pour tous les types de problèmes meilleure ou équivalente à 

la version synchrone. On retrouve des comportements assez similaires à ceux du chapitre 4. 

Avec 2 ou 4 processeurs, la version asynchrone effectue moins de relaxations pour le problème de taille modeste 

avec Re = 10 et Re = 100 et pour le problème de grande taille quelque soit le nombre de Reynolds. Nous sommes 

dans des cas de figure où l’exécution de l’algorithme se déroule de manière favorable ; le volume de travail est 

suffisant et équilibré entre les processeurs. Aucun processeur ne fait d’itération à vide. 

Dans les autres cas de problèmes, taille modeste et Re = 1000 et taille moyenne avec 2 ou 4 processeurs 

et les expérimentations avec 8 processeurs, le nombre de relaxations effectués par la version asynchrone est 

plus important. Un ou plusieurs processeurs effectuent des relaxations à vide, les valeurs sur les frontières de 

recouvrement n’évoluant pas. 

5.18




Synchrone 2 5552 502.0 sec. 1.53 0.77 



Synchrone 4 5552 344.9 sec. 2.24 0.56 




discrétisation décentrée des termes de convection. 




Synchrone 2 39026 2360.5 sec. 1.70 0.85 



Synchrone 4 39026 1417.9 sec. 2.84 0.71 



Synchrone 8 39026 905.4 sec. 4.45 0.56 





Si on compare maintenant la version asynchrone H.F.C. avec la version synchrone, on remarque que la version 

asynchrone est plus performante ou équivalente pour tous les problèmes sauf pour le problème de taille moyenne 

avec 2 processeurs. La différence de performance avec la version synchrone est cependant moins nette que celle 

observée en comparant la version asynchrone M.F.C. avec la version synchrone. 

Si on compare les deux versions asynchrones, on remarque que, dans le cas des problèmes traités avec 8 

processeurs, la version H.F.C. est la plus performante. 

5.19




Synchrone 2 12896 2061.5 sec. 1.82 0.91 



Synchrone 4 12896 1291.3 sec. 2.90 0.72 



Synchrone 8 12896 823.9 sec. 4.55 0.57 





4 Synthèse des résultats des algorithmes asynchrones. 

Finalement au vu des résultats des calculs de ce chapitre, nous remarquons que les versions asynchrones des 

algorithmes ont de meilleures performances que la version synchrone surtout pour les problèmes de grande 

taille. On note également un bon comportement de la version asynchrone H.F.C. pour les calculs effectués en 

attribuant un sous-domaine à chaque processeur. Dans nombreux cas on remarque la présence de relaxations à 

vide qui ne se traduit pas par une augmentation du temps de restitution ; un petit nombre de processeurs ne 

recevant pas d’informations effectuent des relaxations de Gauss-Seidel avec les dernières valeurs de la solution 

sur les frontières de recouvrement. 

Cependant si on compare les résultats obtenus dans ce chapitre avec ceux du chapitre 4, on note une différence 

de performance moins nette entre les versions asynchrones et synchrones pour la résolution du problème de 

Navier-Stokes ( avec cependant, dans la plupart des cas, une efficacité meilleure pour les versions asynchrones ). 

Ceci est lié au fait que pour ce problème de Navier-Stokes, l’asynchronisme est surtout mis en œuvre pour 

résoudre l’équation de convection-diffusion. Dans la résolution de l’équation de Poisson, seule la résolution de 

l’équation de point fixe lors de la deuxième étape est parallélisable de façon asynchrone, la première et la 

troisième étapes consistant en la résolution directe sans échange d’information entre les processeurs. Lors de la 

résolution du problème de Navier-Stokes, les avantages de l’asynchronisme sont limités à chaque pas de temps 

par les étapes 1 et 3. Cette situation est différente de celle rencontrée dans le chapitre 4 où toute la résolution 

pouvait être parallélisée de façon asynchrone. 

5.20




Synchrone 2 7672 2022.5 sec. 1.72 0.86 



Synchrone 4 7672 1221.5 sec. 2.85 0.71 



Synchrone 8 7672 749.3 sec. 4.65 0.58 








Synchrone 2 19421 3483.4 sec. 1.80 0.90 



Synchrone 4 19421 2216.8 sec. 2.84 0.71 



Synchrone 8 19421 1324.2 sec. 4.75 0.59 





5.21




Synchrone 2 19503 3615.8 sec. 1.73 0.86 



Synchrone 4 19503 2174.7 sec. 2.88 0.72 



Synchrone 8 19503 1358.6 sec. 4.60 0.58 








Synchrone 2 9649 3460.1 sec. 1.78 0.89 



Synchrone 4 9649 1951.1 sec. 3.16 0.79 



Synchrone 8 9649 1207.0 sec. 5.10 0.64 





5.22



244. 

2. H.C. Boisson, I. d’Ast and P. Spitéri , Some subdomain algorithms and their parallel implementation for 

solving incompressible Navier-Stokes equations , Computational Fluid Dynamics’92, Ch Hirsh et al. editors, 

Amsterdam : Elsevier North Holland, 2 (1992) pp. 867–874. 

3. M. Braza, P. Chassaing and H. Ha Minh , Numerical study and physical analysis of the pressure velocity 

fields in the near wake of a circular cylinder , Journal of Fluid Mechanics, 165 (1986), pp. 79–130. 

4. Y. Chan, R. Glowinski, J. Périaux and O.B. Widlund, Domain decomposition methods, SIAM, (1989). 


6. Chow, Computational fluid Dynamics. 

7. G. De Vahl Davies , Natural convection of air in a square cavity : a benchmark numerical solution , Int. J. 

Numer. Methods in Fluid, 3 (1983), pp. 249–264. 

8. Q.V. Dinh, R. Glowinski and J. Périaux , Application of domain decomposition techniques to the natural 

solution of Navier-Stokes equations , GAMNI, (1980). 

9. Q.V. Dinh, R. Glowinski, B. Mantel, J. Périaux and P. Perrier, Subdomain solutions of nonlinear problems 

in fluid dynamics on parallel processors , 5 e colloque international sur les méthodes de calcul scientifique et 

technique, Versailles (1981). 

10. J.L. Estivalezes, H.C. Boisson, A. Kourta, P. Chassaing and H. Ha Minh , Performances of the PISO 

algorithm applied to natural oscillating convection in low Pr Fluids. Series on numerical methods in fluid 

dynamics, Vieweg Verlag, Braunschweig (1990). 

11. D. Euvrard , Résolution numérique des équations aux dérivées partielles, Masson (1988). 

12. D.J. Evans, Lishan Kang, Jianping Shao and Yuping Chen, The convergence rate of Schwarz alternating 

procedure (I) : for one-dimensional problems , Int. Jour. Comp. Math., 20 (1986), pp. 157–170. 

13. D.J. Evans, Lishan Kang, Jianping Shau and Yuping Chen, The convergence rate of Schwarz alternating 

procedure (II) for two dimensional problems, Int. Jour. Comp. Math., 20 (1986), pp. 325–339. 

14. D.J. Evans, Lishan Kang, Jianping Shau and Yuping Chen, The convergence rate of Schwarz alternating 

procedure (IV) : with pseudo boundary relaxation factor , Int. Jour. Comp. Math., 21 (1987), pp. 185–203. 

15. C.A.J. Fletcher , Computational techniques for fluid dynamics , Springer-Verlag (1988). 

16. L. Giraud, J.C. Miellou and P. Spitéri, Implementation of domain decomposition methods on shared memory 

multiprocessors, High-Performance Computing II, M. Durand and F. El Dabaghi ed., Elsevier North Holland, 

(1991) pp. 357–367. 

17. L. Giraud and P. Spitéri, Parallel resolution of nonlinear boundary values problems, M.2 A.N., 25 (1991), 

pp. 579–606. 

18. R. Guivarch, H.C. Boisson, J.C. Miellou et P. Spitéri, Parallélisation de méthodes de sous-domaines pour la 

résolution de problèmes aux limites, Congrès National d’Analyse Numérique, Super-Besse (1995). 

19. R. Guivarch, H.C. Boisson et P. Spitéri, Résolution de problèmes de mécanique des fluides par des méthodes 

paralléles de décomposition de domaines, Congrès National d’Analyse Numérique, La Londe Les Maures 

(1996). 

20. R. Guivarch, P. Spitéri, H.C. Boisson and J.C. Miellou, Schwarz alternating parallel algorithm applied to 

incompressible flow computation in vorticity stream function formulation, Rapport IRIT/96-04-R (1996), à 

5.23

paraître dans Parallel Algorithms and Applications (1997). 

21. K.H. Hoffmann and Jun Zou , Parallel efficiency of domain decomposition methods , Parallel Computing, 

19 (1993), pp. 1375–1391. 

22. Lishan Kang and D.J. Evans , he convergence rate of Schwarz alternating procedure (III) : for Neumann 

problems , Int. J. Comp. Math., 21 (1987), pp. 85–108. 


24. J.C. Miellou, Variantes synchrones et asynchrones de la méthode alternée de Schwarz , Rapport de recherche 

E.R.A. de mathématiques n ◦ 070654, Université de Besançon (1982). 

25. J.C. Miellou, G. Perrin and P. Spitéri , An inexpensive method of performance evaluation for subdomain 

decomposition parallel algorithms of three-dimensional elliptic problems , The J. of Systems and Software, 6 

(1986), pp .169–173. 

26. J.C. Miellou and P. Spitéri, Un critère de convergence pour des méthodes générales de point fixe, M.2 A.N., 

(1985), pp. 170–201. 

27. J.C. Miellou, L. Giraud, A. Laouar and P. Spitéri, Subdomain decomposition methods with overlapping and 

asynchronous iterations, Progress in partial differential equations, M. Chipot and J. Saint Jean Paulin ed., 

Longman, Pitman Research Notes in Mathematics Series, (1991), pp. 166–183. 

28. H. Ha Minh, H.C. Boisson and G. Martinez , Unsteady mixed convection heat transfer around a circular 

cylinder, Momentum and heat transfer processes in recirculating flows, B.E. Launder and J.C. Humphrey 

editors, A.S.M.E. Annual winter meeting, Heat transfer division, 13 (1980), pp. 35–44. 



30. S.V. Patankar , Numerical heat transfer and fluid flow , Mc Graw-Hill (1980). 

31. R. Schreiber and H.B. Keller , Driven cavity flows by efficient numerical techniques , Journal of Computational 

Physics, 49 (1983), pp. 1983. 

32. P. Spitéri, Parallel asynchronous algorithms for solving boundary value problems , In Parallel algorithms, 

Eds M. Cosnard et al., North Holland, (1986) pp. 73–84. 

33. P. Spitéri and H.C. Boisson , Subdomain predictor-corrector algorithms for solving the incompressible Navier- 

Stokes equation , Asymptotic and numerical methods for partial differential equations with critical parameters 

NATO ASI series, H.G. Kaper and M. Garbey editors, Kluwer Academic Publishers, 384 (1993), 

pp. 335–347. 



35. R.S. Varga, Matrix iterative analysis, Prentice Hall (1962). 

5.24

Chapitre 6 

Étude numérique d’un problème 

d’électrophorèse en écoulement 

continu. 

Introduction. 

Les techniques les plus largement utilisées pour analyser les mélanges de protéines biologiques sont basées 

sur le principe de la séparation par électrophorèse. De petites quantités de matière, injectées dans une solution 

liquide stabilisée par la présence d’un gel, migrent sous l’effet d’un champ électrique. 

On étudie les transferts couplés de masse et de quantité de mouvement de la solution et des protéines injectées 

dans une cellule sous l’effet des forces électriques. La simulation numérique directe par résolution des équations 

de transport du fluide est le moyen le plus adapté pour isoler les contributions spécifiques de chacun des 

phénomènes en présence. 

La modélisation de ces phénomènes conduit à la résolution de problèmes d’équations aux dérivées partielles 

couplées comportant : 

- l’équation de Navier-Stokes, régissant l’hydrodynamique, 

- l’équation de transport de la concentration des espèces en présence, 

- l’équation de potentiel généralisée du champ électrique. 

La complexité de ce problème réside essentiellement dans le fait que le domaine d’étude est tridimensionnel 

et dans des non-linéarités présentes dans l’équation de Navier-Stokes ainsi que de forts phénomènes convectifs 

pris en compte dans l’équation de concentration, ce qui corrélativement induit pour ce problème de mauvais 

conditionnements numériques. 

Dans une première partie de ce chapitre, nous exposons les phénomènes physiques intervenant dans l’électrophorèse 

et nous donnons la modélisation mathématique de ce type de problème. Nous montrons ensuite que ces équations 

peuvent être discrétisées de telle manière à obtenir sept systèmes linéaires couplés pour lesquels les matrices de 

discrétisation rentrent dans le cadre de l’accrétivité et des M-fonctions présentées aux chapitres 1 et 2. 

6.1

En ce qui concerne les essais numériques, en raison des contraintes de temps seule une version séquentielle du 

code a été mise en place afin de vérifier la faisabilité numérique des simulations. Nous indiquons les méthodes de 

résolution choisies pour résoudre chacun des systèmes linéaires et donnons les résultats des essais numériques. 

6.2

1 Position du problème. 

1.1 Le principe de l’électrophorèse en écoulement continu. 

L’électrophorèse en écoulement continu est un procédé qui permet de séparer des mélanges de protéines. Ce 

procédé se déroule dans une longue cellule parallélépipédique à travers laquelle coule à faible vitesse une solution 

tampon ( voir figure 6.1 ). La solution contenant le mélange à séparer est injectée dans cet écoulement par une 

face de la cellule ( face C ) sous forme d’un fin filament liquide. Deux électrodes situées de part et d’autre de 

la cellule ( faces E et F ) créent un champ électrique à travers la largeur de la cellule. 

Les protéines sont portées tout au long de la cellule par l’écoulement de la solution tampon et de plus migrent 

sous l’influence du champ électrique. La distance latérale de migration de chaque protéine est donnée par le 

produit de sa mobilité électrique par la force électrique et la durée de sa présence dans la cellule ; les différentes 

espèces de protéines ayant des mobilités différentes, elles peuvent donc être recueillies séparément à la sortie de 

la cellule ( face D ). 

Nous supposons l’écoulement isotherme et l’absence de réaction chimique. Ainsi les différents coefficient physiques 

intervenant dans ce phénomène restent constants. 

x 

y 

z 

Face C 

Face E 

écoulement 

principal 

Face F 

Face A 

+ - 

A 

B 

Face B 

Face D 

jet de protéines A+B 

Figure 6.1 : Le principe de l’électrophorèse en écoulement continu. 

6.3

1.2 Les phénomènes physiques mis en jeu. 

Les phénomènes physiques auxquels nous nous intéressons dans la présente étude sont : 

- La conservation de la masse. 

- L’écoulement principal ( du fluide tampon ) : il s’agit d’un écoulement 3D, décrit par le vecteur vitesse 

V , fonction de la pression et soumis à l’effet électrocinétique. 

- Le transport des protéines : on s’intéresse à la répartition spatiale des protéines par l’intermédiaire de la 

concentration c, qui dépend de V . 

- L’effet électrocinétique, lié aux variations spatiales du potentiel ( donc du champ électrique ) en fonction 

de la concentration des différentes espèces ioniques. 

2 Équations du problème. 

2.1 Variables physiques et coefficients. 

Dans les équations du problème d’électrophorèse on cherche à déterminer en chaque point P de coordonnées 

(x, y, z) du volume d’électrophorèse Ω : 

- Le champ de vitesse du fluide V (u, v, w), 

- la pression p, 

- le champ électrique E(Ex, Ey, Ez), 

- pour chaque protéine m, sa concentration cm, 

- le potentiel Φ. 

Les grandeurs physiques qui interviennent dans les équations sont les suivantes : 

- La température T , 

- la viscosité cinématique du fluide ν, 

- la masse volumique du fluide ρ, 

- la permittivité diélectrique du fluide ɛ, 

- le coefficient de diffusion de la protéine m Dm, 

- la conductivité électrique du fluide K, 

- la conductivité ionique moyenne de la protéine m λm, 

- la mobilité électrophorétique de la protéine m um. 

2.2 Les équations du problème. 

2.2.1 La conservation de la masse. 

Le principe de conservation de la masse s’énonce de la manière suivante : 

6.4

avec 

ou encore 

 

D 

Dt Ω ρ(x, t)dt = 0 

D ∂ ∂ ∂ ∂ 

Dt = ∂t + u ∂x + v ∂y + w ∂z 

∂ρ 

∂t + div(ρ V ) = 0 

Comme l’écoulement est incompressible, ρ est constant et l’équation de conservation de la masse, exprimée 

en repère cartésien, aboutit à la relation : 

∂u ∂v ∂w 

+ + = 0 (6.1) 

∂x ∂y ∂z 

Cette équation qui n’apparaitra pas directement dans la résolution sera utilisée pour la résolution de l’équation 

d’écoulement 3D. 

2.2.2 L’équation d’écoulement 3D. 

L’écoulement principal est décrit par les équations de Navier-Stokes 3D avec champ de forces extérieures. 

⎧ 

⎪⎨ 

⎪⎩ 

 

∂u ∂u ∂u 

∂t + u ∂x + v ∂y 

 

∂v ∂v ∂v 

∂t + u ∂x + v ∂y 

∂w 

∂t 

avec pour i = x ou i = y ou i = z 

∂w ∂w 

+ u ∂x + v ∂y 

2.2.3 L’équation de transport des protéines. 

 

∂u + w ∂z 

+ w ∂v 

∂z 

+ w ∂w 

∂z 

 

 

∂p 

= ν∆u − 1 

ρ ∂x + ɛ div(Ex. E), 

∂p 

= ν∆v − 1 

ρ ∂y + ɛ div(Ey. E), 

∂p 

= ν∆w − 1 

ρ ∂z + ɛ div(Ez. E). 

div(Ei. E) = ∂ 

∂x EiEx + ∂ 

∂y EiEy + ∂ 

∂z EiEz 

Le transport des protéines est modélisé par l’équation de transport 3D suivante : 

où ϕ est le terme source. 

2.2.4 L’équation de potentiel. 

∂cm 

∂t 

+ u ∂cm 

∂x 

+ v ∂cm 

∂y 

Le potentiel Φ est régi par une équation de Poisson généralisée : 

ou encore − ∂ 

∂x 

(6.2) 

+ w ∂cm 

∂z − Dm∆cm = ϕ. (6.3) 

− div (K grad Φ) = ∆Q, 

∂Φ ∂ (K ∂x ) − ∂y 

6.5 

∂Φ ∂ (K ∂y ) − ∂y 

∂Φ (K ∂y ) = ∆Q, 

(6.4)

avec Q = Q0 + RT umcm, R étant la constante des gaz parfaits, et K = K0 + λmcm. 

L’équation d’écoulement (6.2) est couplée à cette dernière équation par la relation : 

2.3 Les conditions aux limites. 

2.3.1 Les conditions aux limites de l’écoulement 3D. 

E = − 

grad Φ (6.5) 

Le fluide tampon et les protéines entrent par la face supérieure C de la cellule et sortent par la face inférieure D. 

Nous considérons que la vitesse satisfait à des conditions de Dirichlet non homogènes sur la face C et des 

conditions de Neumann homogènes pour la face D. Sur les quatre autres faces, on suppose que la vitesse est 

nulle ; on impose donc des conditions de Dirichlet homogènes sur ces faces. 

Les conditions s’énoncent ainsi de la manière suivante : 

⎧ 

⎪⎨ 

⎪⎩ 

u /A = v /A = w /A = 0, 

u /B = v /B = w /B = 0, 

u /C = w /C = 0, 

v /C = VC 

∂u ∂v ∂w 

∂n = /D ∂n = /D ∂n = 0, /D 

u /E = v /E = w /E = 0, 

u /F = v /F = w /F = 0 

2.3.2 Les conditions aux limites associées à l’équation de transport. 

Les protéines pénètrent dans la cellule par la face C ; la concentration est donc connue sur cette face, ce qui 

conduit à des conditions de Dirichlet non homogènes. A priori la concentration est libre sur les cinq autres faces 

ce que l’on traduit par des conditions de Neumann homogènes. 

Cependant, étant donnée la forme très allongée de la cellule, on suppose que le jet de protéines n’atteint pas 

au cours de son trajet dans la cellule les faces E et F des électrodes. Nous prenons donc comme conditions 

aux limites sur ces faces E et F des conditions de Dirichlet homogènes, ce qui a pour effet d’améliorer le 

conditionnement du système discrétisé de l’équation de concentration. 

Les conditions limites pour la concentration de la protéine m sont donc les suivantes : 

6.6 

(6.6)

2.3.3 Les conditions aux limites de potentiel. 

⎧ 

⎪⎨ 

⎪⎩ 

∂cm 

∂n = 0, /A 

∂cm 

∂n = 0, /B 

cm/C = cJet 

∂cm 

∂n = 0, /D 

cm/E = 0, 

cm/F = 0 

Le potentiel est connu et constant en tout point des deux électrodes c’est à dire sur les faces latérales E et F. 

Nous avons donc des conditions de Dirichlet non homogènes sur ces faces. 

Les deux autres faces verticales A et B sont isolées électriquement ; on leur associe des conditions de Dirichlet 

non homogènes définies par une interpolation linéaire du potentiel entre les deux électrodes. 

Sur les faces horizontales C et D, on fixe des conditions aux limites de type Dirichlet non homogènes, données 

par la solution de l’équation de potentiel restreinte à chacune de ces faces. Ces conditions sont calculées 

préalablement. Étant donné que la concentration sur la face C ne varie pas au cours du temps, le potentiel 

sur cette face est calculé une fois pour toute et les conditions sur cette face ne changent pas. Par contre la 

concentration sur la face D dépend du temps et donc à chaque pas de temps il faut recalculer le potentiel sur 

cette face pour obtenir les conditions aux limites manquantes de l’équation 3D. 

Si LongZ est la largeur de la cellule, les conditions aux limites s’écrivent : 

⎧ 

⎪⎨ 

⎪⎩ 

Φ /A = 

Φ /B = 

Φ /C = ΦC 

Φ /D = ΦD(t) 

Φ /E = ΦE 

Φ /F = ΦF 

(LongZ −z)ΦE+zΦF 

LongZ 

(LongZ −z)ΦE+zΦF 

LongZ 

6.7 

(6.7) 

(6.8)

3 Discrétisation des équations. 

3.1 L’équation d’écoulement 3D. 

Nous allons résoudre cette équation de Navier-Stokes en utilisant l’algorithme PISO avec une discrétisation 

des équations par la méthode des volumes finis. Nous allons vérifier que l’utilisation de cet algorithme et la 

discrétisation par la méthode des volumes finis conduit à des problèmes où les hypothèses énoncées aux chapitres 

1 et 2 pour l’application des algorithmes synchrones et asynchrones classiques et des algorithmes asynchrones 

avec communication flexible sont vérifiées. 

3.1.1 Rappel de l’algorithme PISO. 

L’algorithme PISO (Pressure Implicit with Splitting of Operators), mis au point par R.I. Issa [9], permet la 

résolution des équations de Navier-Stokes pour un écoulement incompressible. 

Le schéma d’Euler à la base de la discrétisation temporelle des équations nous fournit une formulation d’avancement 

en temps inconditionnellement stable. 

Le principe de l’Operator Splitting permet de traiter le couplage des variables ( V , p) en divisant chaque pas 

de temps en trois ”sous-pas”. 

- Un pas prédicteur, implicite en vitesse, permet à partir des champs V (n) = (U (n) , V (n) , W (n) ) et p (n) 

d’obtenir les champs V ∗ = (U ∗ , V ∗ , W ∗ ) et p (n) . Mais à cet instant, l’équation de conservation de la masse 

n’est pas vérifiée. 

- On effectue alors un premier pas correcteur qui impose cette dernière condition, pour aboutir aux 

champs V ∗∗ = (U ∗∗ , V ∗∗ , W ∗∗ ) et p ∗ et à une conservation approchée de la masse, 

- puis un second pas correcteur permet d’améliorer le degré d’approximation des équations de conservation 

de la quantité de mouvement. On obtient finalement les champs V ∗∗∗ = (U ∗∗∗ , V ∗∗∗ , W ∗∗∗ ) = V (n+1) 

et p ∗∗ = p (n+1) . 

On montre [9] que deux pas correcteurs suffisent pour assurer la convergence de l’approximation à l’instant 

tn+1 vers la solution exacte. 

3.1.1.1 Pas prédicteur. 

Il permet de calculer de façon implicite V ∗ = (U ∗ , V ∗ , W ∗ ), solution des équations de la quantité de mouvement 

avec la pression p (n) . 

Il s’agit alors de résoudre les équations : 

( 1 

δt − Ai 0)u ∗ i = H ′ i(u ∗ i ) − 1 

ρ ∆i p n + Si + 1 

δt un i 

L’opérateur ∆i représente la discrétisation de l’opérateur ∂ 

∂xi ( xi = x ou xi = y ou xi = z ). 

L’opérateur Hi = A i 0+H ′ i représente la discrétisation des flux convectifs et diffusifs, Ai 0 étant le terme diagonal. 

Si représente le terme source de l’équation égal à ɛ.div (Exi .E). 

6.8 

(6.9)

Remarque 6.1. Le pas prédicteur revient à résoudre trois systèmes d’équations indépendants qui calculent 

chacun d’entre eux une composante de la vitesse. Ces trois systèmes peuvent être résolus en parallèle. 

3.1.1.2 Premier pas correcteur. 

Ce premier pas explicite calcule le champ des vitesses V ∗∗ qui, associé à la pression p ∗ , vérifie les équations 

approchées de Navier-Stokes discrètes et l’équation de continuité : 

 

( 1 

δt − Ai0)u ∗∗ 

i = H′ i (u∗ 1 

i ) − ρ∆i p∗ + Si + 1 

δt uni div V ∗∗ = 0 

L’approximation consiste à maintenir inchangé le terme H ′ i (u∗ i ). 

En soustrayant l’équation précédente à l’équation (6.9), on obtient : 

d’où 

( 1 

δt − Ai 0)(u ∗∗ 

i − u ∗ i ) = − 1 

ρ ∆i(p ∗ − p n ), 

u ∗∗ 

i = u ∗ i − 1 

ρ 

( 1 

δt − Ai 0) −1 ∆i(p ∗ − p n ). 

L’équation de continuité div V ∗∗ = 0 s’écrit sous forme discrétisée : 

 

i 

∆i(u ∗∗ 

i ) = 0. 

Finalement l’équation du premier pas correcteur s’écrit de la manière suivante : 

− 

i 

∆i( 1 1 

( 

ρ δt − Ai0) −1 ∆i(p ∗ − p n )) = − 

i 

∆i u ∗ i 

(6.10) 

Cette équation permet de calculer la correction de pression p c = p ∗ − p n . Pour obtenir p ∗ et u ∗∗ 

i , il suffit alors 

de faire p ∗ = p n + p c et u ∗∗ 

i = u∗ i 

3.1.1.3 Second pas correcteur. 

1 1 − ρ ( δt − Ai0) −1∆i pc . 

À partir des champs V ∗∗ = (U ∗∗ , V ∗∗ , W ∗∗ ) et p ∗ , on calcule les champs V ∗∗∗ = (U ∗∗∗ , V ∗∗∗ , W ∗∗∗ ) et p ∗∗ ; 

on améliore la prise en compte de l’équation de continuité en considérant l’équation de Navier-Stokes discrétisée 

sous une forme plus complète en faisant évoluer le terme H ′ i (u∗∗ 

i ). 

On considère pour ce faire l’équation de la quantité de mouvement sous la forme suivante : 

En soustrayant (6.11) à (6.9), on obtient : 

u ∗∗∗ 

i 

( 1 

δt − Ai0)u ∗∗∗ 

i = H ′ i(u ∗∗ 

i ) − 1 

ρ ∆i p ∗∗ + Si + 1 

δt uni . (6.11) 

= u ∗∗ 

i + ( 1 

δt − Ai 0) −1 (H ′ i(u ∗∗ 

i − u ∗ i ) − 1 

ρ ∆i(p ∗∗ − p ∗ )). 

6.9

Donc : 

div V ∗∗∗ = div V ∗∗ + 

i 

∆i( 1 

δt − Ai 0) −1 (H ′ i(u ∗∗ 

i − u ∗ i ) − 1 

ρ ∆i(p ∗∗ − p ∗ )) 

Sachant que div V ∗∗ = div V ∗∗∗ = 0 , on obtient alors pour p cc = p ∗∗ − p ∗ l’équation : 

− 

i 

∆i( 1 1 

( 

ρ 

δt − Ai 0) −1 ∆i(p cc )) = − 

i 

∆i(( 1 

δt − Ai 0) −1 H ′ i(u ∗∗ 

i − u ∗ i )) (6.12) 

On remarque ainsi que la matrice du second pas correcteur est la même que celle du premier : les équations 

du premier pas correcteur et du second pas correcteur ne diffèrent que par leur second membre. 

3.1.2 Rappel de la méthode des volumes finis. 

Il existe pour la simulation d’écoulement de fluide diverses méthodes d’intégration dont les plus utilisées sont 

les différences finies, les volumes finis et les éléments finis. 

L’inconvénient majeur de la méthode des éléments finis est la complexité de sa mise en oeuvre. D’un autre 

côté, la méthode des différences finies n’assure pas toujours la conservation des équations physiques continues 

lors de la discrétisation de celles-ci, au contraire de la méthode des volumes finis qui exprime la conservation de 

la variable sur un volume d’intégration fini. 

Le principe de conservation s’exprime alors par l’intégration sur chacun de ces volumes de l’équation de 

transport. 

3.1.2.1 Les maillages décalés. 

Contrairement aux discrétisations utilisées dans les chapitres précédents, nous sommes amenés à définir en 

plus du maillage principal, sur lequel sera calculée la pression, plusieurs maillages décalés les uns par rapport 

aux autres sur lesquels une seule composante de la vitesse sera calculée. Ainsi, en aucun point du domaine on ne 

connaîtra directement à la fois la pression et le vecteur vitesse : il faudra faire des extrapolations pour obtenir 

toutes les grandeurs en un même point. 

L’utilisation des maillages décalés est motivée par le fait qu’une instabilité numérique peut apparaître lorsqu’on 

calcule toutes les grandeurs sur un même maillage. 

Nous utilisons donc quatre maillages : un maillage principal sur lequel on calcule la pression et trois maillages 

décalés sur chacun desquels on calcule une composante de la vitesse. Ces composantes étant calculées sur les 

frontières du volume de contrôle, la détermination des maillages décalés permet en même temps de définir les 

volumes de contrôle en chaque point. 

6.10

W 

. 

m 

δ 

u 

x 

δ 

p 

x 

w 

δ 

p 

x 

e 

w 

N 

Points du maillage principal. 

n 

M 

s 

S 

Points du maillage décalé pour U. 

Points du maillage décalé pour V. 

e 

E 

Oz 

Oy 

δ p y n 

s 

δ 

p 

y 

Ox 

m 

δ 

v 

y 

Figure 6.2 : Coupe du maillage suivant un plan parallèle au plan xOy. 

– La pression est calculée aux points M, E, W, N, S, H, B. 

– La vitesse U est calculée aux points e et w. 

– La vitesse V est calculée aux points n et s. 

– La vitesse W est calculée aux points h et b. 

– Le volume de contrôle autour du point M a pour taille δux m × δvy m × δwz m . 

– De même le volume de contrôle autour du point w pour le calcul de U a pour taille δpx w × δvy m × δwz m . 

3.1.2.2 Forme générale des équations discrétisées du pas prédicteur. 

Pour le pas prédicteur, on s’intéresse aux systèmes linéaires A U U = b U , A V V = b V , A W W = b W obtenus à 

partir des équations continues. Les trois matrices se construisent de la même façon. 

On note par Θ une composante quelconque de la vitesse ( Θ = u ou Θ = v ou Θ = w). Pour l’équation de 

transport qui calcule la composante Θ, il s’agit d’intégrer sur un volume V ol = ∆x ∆y ∆z autour d’un point 

du maillage décalé pour la composante Θ de la vitesse ( voir figure 6.4 ), l’équation : 

∂(Θ) 

∂t 

+ 

j 

∂ 

∂xj 

[ujΘ − ∂(νΘ) 

] = BΘ 

∂xj 

(6.13) 

Finalement nous obtenons pour chaque point M d’un maillage décalé en utilisant a méthode des volumes finis 

et les travaux de Patankar [12], une équation de la forme : 

6.11

avec 

W 

m 

δ 

u 

x 

δ 

p 

x 

w 

δ 

p 

x 

e 

w 

H 


h 

M 

b 

B 


Points du maillage décalé pour W. 

e 

E 

Oy 

Oz 

δ 

p 

z 

h 

δ 

p 

z 

b 

Figure 6.3 : Coupe du maillage suivant un plan parallèle au plan xOz. 

−a Θ BΘB − a Θ S ΘS − a Θ W ΘW + a Θ M ΘM − a Θ EΘE − a Θ N ΘN − a Θ HΘH = b Θ 

b Θ 

= 

Vol 

BΘ dx dy dz + 

Ox 

∆x ∆y ∆z 

Θ 

δt 

(n) 

M , 

δ z 

w 

m 

(6.14) 

où les coefficients a Θ ∗ sont les composantes de la matrice A U si Θ = U, de la matrice A V si Θ = V ou de la 

matrice A W si Θ = W . 

Pour l’analyse de la convergence des algorithmes asynchrones, les valeurs de ces coefficients sont importantes ; 

ainsi, pour la composante U, nous les définissons de la manière suivante, en utilisant toujours les notations de 

Patankar et Pi le nombre local de Peclet sur la face i : 

• Face basse du volume de contrôle δpx w × δvy m × δwz m : 

a U B = Db α(|Pb|) + max(0, Fb) 

avec Db = ν δpxmδvy m 

δpzb , Fb = Wb δwzm et Pb = Fb 

Db 

• Face sud du volume de contrôle δpx w × δvy m × δwz m : 

a U S = Ds α(|Ps|) + max(0, Fs) 

avec Ds = ν δpxmδwz m 

δpys , Fs = Vs δvym et Ps = Fs 

Ds 

6.12

. 

m 

δ 

p 

x 

w e 

δ 

u 

x δ 

u 

x 

N 


n 

W w M e E 

m 

δ 

v 

y 

s 

S 



Figure 6.4 : Coupe selon un plan parallèle au plan xOy du volume de contrôle autour d’un point du maillage décalé 

pour U. 

• Face ouest du volume de contrôle δpx w × δvy m × δwz m : 

Oz 

Oy 

δ p y n 

s 

δ 

p 

y 

a U W = Dw α(|Pw|) + max(0, Fw) 

Ox 

avec Dw = ν δvym δwz m 

δuxw , Fw = Uw δpxm et Pw = Fw 

Dw 

• Face est du volume de contrôle δpx w × δvy m × δwz m : 

a U E = De α(|Pe|) + max(0, Fe) 

avec De = ν δvym δwz m 

δuxe , Fe = Ue δpxm et Pe = Fe 

De 

• Face nord du volume de contrôle δpx w × δvy m × δwz m : 

a U N = Dn α(|Pn|) + max(0, Fn) 

avec Dn = ν δpxmδwz m 

δpyn , Fn = Vn δvym et Pn = Fs 

Dn 

• Face haute du volume de contrôle δpx w × δvy m × δwz m : 

a U H = Dh α(|Ph|) + max(0, Fh) 

avec Dh = ν δpxmδvy m 

δpzh , Fh = Wh δwzm et Ph = Fh 

Dh 

6.13

• et enfin 

a Θ M = a Θ B + a Θ S + a Θ W + a Θ E + a Θ N + a Θ H + δpx m δvy m δwz m 

Nous définissons les coefficients pour les matrices A V et A W de manière analogue. 

La fonction α(|Pi|) dont différentes valeurs sont données dans la table 6.1 est utilisée pour définir plusieurs 

schémas de discrétisation [12] : 

Schéma : α(|Pi|) 

Différences centrées : 1 − 0.5|Pi| 

Amont : 1 

Hybride : Max(0; 1 − 0.5|Pi|) 

Power Law : Max(0; (1 − 0.5|Pi|) 5 ) 

Exponentiel : |Pi|/(exp|Pi| − 1) 

Table 6.1 : Définition de α(|Pi|). 

Pour les points au voisinage des frontières, les coefficients correspondants sont nuls : 

• près de la frontière basse ( resp. haute ), a Θ B ( resp. aΘ H 

• près de la frontière sud ( resp. nord ), a Θ S ( resp. aΘ N 

• près de la frontière ouest ( resp. est ), a Θ W ( resp. aΘ E 

) est nul, 

) est nul, 

) est nul. 

Proposition 6.1. Les trois matrices A U , A V et A W sont des matrices à diagonale dominante. 

Dmonstration. Ce résultat provient directement de la définition des coefficients des différentes matrices. 

Proposition 6.2. Les trois matrices A U , A V et A W sont des M-matrices pour tous les schémas de discrétisation 

du tableau 6.1 excepté pour le schéma de différences centrées. Pour le schéma de différences centrées, si |Pi| ≤ 2, 

A U , A V et A W sont alors des M-matrices. 

Dmonstration. En effet les coefficients diagonaux de ces matrices sont strictement positifs et les coefficients 

hors-diagonaux sont strictement négatifs ; les trois matrices sont des Z-matrices. De plus ces matrices sont 

irréductibles et selon la proposition précédente à diagonale dominante ; ce sont donc des M-matrices. 

Corollaire 6.3. Les algorithmes synchrones et asynchrones classiques appliqués à la résolution des trois 

systèmes linéaires du pas prédicteur de la méthode PISO convergent. 

Corollaire 6.4. Les algorithmes asynchrones avec communication flexible appliqués à la résolution des trois 

systèmes linéaires du pas prédicteur de la méthode PISO convergent. 

Remarque 6.2. Compte-tenu des résultats des chapitres 1 et 2, on peut envisager la résolution de ces systèmes 

par la méthode alternée de Schwarz avec communication asynchrone. 

3.1.2.3 Forme générale des équations discrétisées des pas correcteurs en pression. 

Pour les deux pas correcteurs le système à résoudre est de la forme : 

6.14 

δt 

.

⎧ 

⎨ 

et f = 

⎩ 

− 

i 

1 1 ∆i( ρ ( δt − Ai0) −1∆i(pγ )) = f 

équivalent à 

A P p γ = f 

avec p γ ⎧ 

⎨ p 

= 

⎩ 

c pour le premier pas correcteur, 

pcc pour le second pas correcteur. 

−( div 

V ∗ )P pour le premier pas correcteur, 

− 1 

i ∆i(( δt − Ai0) −1 H ′ i (u∗∗ i − u∗i )) pour le second pas correcteur. 

W 

. 

m 

δ 

u 

x 

δ 

p 

x 

w 

δ 

p 

x 

e 

w 

N 


n 

M 

s 

S 



e 

E 

Oz 

Oy 

δ p y n 

δ 

p 

y 

s 

Ox 

m 

δ 

v 

y 

Figure 6.5 : Coupe selon un plan parallèle au plan xOy du volume de contrôle autour d’un point du maillage principal. 

Après discrétisation nous obtenons pour chaque point M du maillage principal une équation de la forme : 

−dBp γ γ 

B − dSpS − dW p γ 

W + dM p γ γ 

M − dEpE − dN p γ γ 

N − dHpH = fM 

(6.16) 

6.15 

(6.15)

avec : ⎧⎪ ⎨ 

⎪⎩ 

dB = 1/(a W P (b) δwz m δpz b ) 

dS = 1/(a V P (s) δvy m δpy s ) 

dW = 1/(a U P (w) δux m δpx w ) 

dE = 1/(a U P (e) δux m δpx e ) 

dN = 1/(a V P (n) δvy m δpy n ) 

dH = 1/(a W P (h) δwz m δpz h ) 

dM = dB + dS + dW + dE + dN + dH. 

Finalement la matrice A P des systèmes correcteurs dont les coefficients sont les d∗ possède les propriétés 

suivantes que l’on montre d’une manière similaire à celle utilisée au paragraphe précédent. 

Proposition 6.5. La matrice A P est à diagonale dominante. 

Proposition 6.6. La matrice A P est une M-matrice. 

Corollaire 6.7. Les algorithmes synchrones et asynchrones classiques appliqués à la résolution des systèmes 

linéaires des deux pas correcteurs de la méthode PISO convergent. 

Corollaire 6.8. Les algorithmes asynchrones avec communication flexible appliqués à la résolution des 

systèmes linéaires des deux pas correcteurs de la méthode PISO convergent. 

Remarque 6.3. Comme pour les équations de vitesse, nous pouvons envisager la parallélisation de la 

résolution de ces systèmes par la méthode alternée de Schwarz avec communication asynchrone. 

3.1.3 L’équation de transport des protéines. 

L’équation de transport (6.3) est une équation de convection-diffusion qui présente une forme similaire à celle 

de l’équation de convection-diffusion (5.5) du chapitre 5. 

Nous considérons une discrétisation par différences finies. Le Laplacien est discrétisé en utilisant un schéma 

de différences finies classique à sept points. Les termes de convection peuvent être discrétisés par des schémas 

de discrétisation centrés ou décentrés en accord avec les signes de u, v et w ( voir l’équation (4.2) ). 

Nous arrivons aux mêmes conclusions que celles exprimées au paragraphe 2 du chapitre 5 : 

- la matrice de discrétisation obtenue par des schémas de discrétisation décentrés des termes de convection 

est une M-matrice ; le problème (6.3) discrétisé à l’aide de ces schémas rentre dans le cadre de la Haccrétivité 

et aussi des M-fonctions. Ainsi les algorithmes parallèles synchrones et asynchrones classiques 

et les algorithmes parallèles asynchrones avec communication flexible convergent. 

- sous certaines hypothèses sur la norme de la vitesse analogue à celle du chapitre 5 condition 5.6, des pas 

de discrétisation en espaces et du pas de temps, la matrice de discrétisation obtenue par des schémas 

de discrétisation centrés des termes de convection est une M-matrice et le problème (6.3) rentre dans le 

cadre de la H-accrétivité et aussi des M-fonctions. Les algorithmes parallèles synchrones et asynchrones 

classiques et les algorithmes parallèles asynchrones avec communication flexible convergent. 

6.16

3.1.4 L’équation de potentiel. 

On discrétise ce problème par différences finies. Le schéma numérique est le même pour chacun des trois 

termes du premier membre ; il est obtenu par la moyenne de deux schémas intermédiaires. 

 

pour y = yj et z = zk fixés. 

Nous nous intéressons par exemple à la discrétisation de − ∂ 

∂x 

K ∂φ 

∂x 

Par simplification on note hi = xi − xi−1, Ki = K(xi, yj, zk) = Kijk, Φi = Φ(xi, yj, zk) = Φijk. 

• schéma “avant-arrière” 

 

− ∂ 

∂x 

• schéma “arrière-avant” 

 

xi,yj,zk 

− ∂ 

∂x 

K ∂φ 

∂x 

K ∂φ 

∂x 

 

 

xi 

xi 

h 2 i 

= − 1 

 

hi+1 

Ki+1 

= − 1 

hi+1 

 

Ki+1 

 

∂Φ 

∂x − Ki 

i+1 

Φi+1−Φi 

hi+1 

= − Ki 

hihi+1 Φi−1 

 

Ki 

+ hihi+1 

= − 1 

 

hi 

Ki 

= − 1 

hi 

 

Ki 

 

∂Φ 

∂x − Ki−1 

i 

Φi+1−Φi 

hi+1 

 

− Ki 

 

∂Φ 

∂x i 

Ki+1 

+ h2 

i+1 

 

∂Φ 

 

∂x i−1 

 

− Ki−1 

= − Ki−1 

h2 

Ki−1 

Φi−1 + h i 

2 + 

i 

Ki 

hihi+1 

h 2 i 

Φi−Φi−1 

hi 

Φi−Φi−1 

 

 

Φi − Ki+1 

h2 Φi+1 

i+1 

hi 

 

Φi − Ki 

hihi+1 Φi+1 

Le schéma de discrétisation final est obtenu en prenant la demi-somme de chacun des schémas pré-cédants. 

Nous obtenons pour la dérivée seconde par rapport à x : 

− ∂ 

 

∂x K ∂φ 

 

 

1 Ki−1 

∂x = 2 − + Ki 

 

Ki−1 

Φi−1 + + hihi+1 

2Ki 

hihi+1 

De même pour les autres dérivées par rapport à y et par rapport à z : 

− ∂ 

 

∂y 

− ∂ 

 

∂z 

K ∂φ 

∂y 

K ∂φ 

∂z 

 

 

xi,yj,zk 

xi,yj,zk 

= 

= 

 

1 Kj−1 

2 − h2 + 

j 

Kj 

 

Kj−1 

Φj−1 + 

hjhj+1 

h2 + 

j 

2Kj 

hjhj+1 

 

1 Kk−1 

2 − h2 + 

k 

Kk 

 

Φk−1 + 

hkhk+1 

Kk−1 

h 2 

k 

+ 2Kk 

hkhk+1 

Ki+1 

+ h2 

Ki 

Φi − hihi+1 i+1 

Kj+1 

+ h2 

Kj 

Φj − hjhj+1 j+1 

Kk+1 + h2 

Kk 

Φk − hkhk+1 k+1 

Ki+1 

+ h2 

Φi+1 

i+1 

(6.17) 

Kj+1 

+ h2 

Φj+1 

j+1 

(6.18) 

Kk+1 + h2 

Φk+1 

k+1 

(6.19) 

Finalement la matrice de discrétisation P de l’équation de potentiel est une matrice heptadiagonale. Pour 

trouver le potentiel nous résolvons le système suivant : 

où SΦ = ∆Q. 

P Φ = SΦ 

(6.20) 

La conductivité électrique K étant une grandeur positive, il est à noter que ce type de schéma conduit à une 

matrice P définie positive ; on peut calculer l’erreur de troncature et vérifier qu’elle tend vers 0 avec le pas de 

discrétisation . 

6.17

Nous pouvons énoncer de façon évidente la proposition et les corollaires suivants : 

Proposition 6.9. la matrice P du système discrétisé de l’équation de potentiel est une M-matrice. 

Corollaire 6.10. Les algorithmes synchrones et asynchrones classiques appliqués à la résolution du système 

linéaire de l’équation de potentiel convergent. 

Corollaire 6.11. Les algorithmes asynchrones avec communication flexible appliqués à la résolution du 

système linéaire de l’équation de potentiel convergent. 

Remarque 6.4. La méthode alternée de Schwarz avec communication asynchrone peut être mise en œuvre 

pour paralléliser la résolution de ce problème. 

4 Méthodes de résolution des systèmes linéaires. 

Dans un premier temps afin de tester notre code de résolution, nous cherchons à résoudre de manière 

séquentielle le problème d’électrophorèse. 

Pour toutes les équations intervenant dans le problème d’électrophorèse, nous obtenons des matrices de 

discrétisation non-symétriques, soit en raison de leur forme propre ( équation de potentiel par exemple ), soit 

en raison du maillage irrégulier que nous sommes amenés à utiliser compte tenu de la forme fortement allongée 

de la cellule. 

Il nous faut donc utiliser des méthodes efficaces de résolution séquentielle des systèmes linéaires : nous nous 

sommes intéressés à plusieurs méthodes suivant les équations : 

- Pour les équations de vitesse de la méthode P.I.S.O., nous avons mis en place la méthode du Bi-gradient 

conjugué avec un préconditionnement diagonal classique. 

- Afin de résoudre les équations de correction en pression de la méthode P.I.S.O., nous utilisons la méthode 

du Bi-gradient conjugué avec un premier préconditionnement selon une méthode introduite par J.C. 

Miellou [11] puis un second préconditionnement diagonal classique. 

- La méthode du Bi-gradient conjugué stabilisé permet de résoudre les équations de transport et de potentiel. 

4.1 La méthode du Bi-gradient conjugué pour le problème d’écoulement. 

Les matrices A U , A V et A W du pas prédicteur de la méthode P.I.S.O. sont définies positives et donc inversibles. 

Elles sont non-symétriques si le maillage est irrégulier. La méthode du Bi-gradient conjugué est bien adaptée à la 

résolution des systèmes non-symétriques ; elle présente plus de régularité au niveau des résultats de convergence 

que la méthode du gradient conjugué ”squared”. Dans cette méthode nous utilisons comme préconditionnement 

le préconditionnement diagonal classique. 

En ce qui concerne les matrices de discrétisation des pas correcteurs, nous n’avons la diagonale dominance 

stricte pour aucun point du maillage : l’équation algébrique A P p γ = f admet soit aucune solution, soit une 

infinité (la solution est alors définie à une constante près). 

Pour avoir une solution unique, il est alors au moins nécessaire de fixer la correction de pression en un point 

du domaine : les hydrauliciens choisissent classiquement d’imposer p c = 0 dans le coin sud-ouest du bas. 

Cependant, la diagonale dominance n’étant assurée qu’en trois points, la résolution des équations de correction 

6.18

en pression est plus lente que celle des équations de vitesse où il y a diagonale dominance stricte en chaque point. 

Afin de palier au mauvais conditionnement de la matrice de discrétisation nous utilisons un préconditionnement 

proposé par J.C. Miellou [11] et décrit dans l’annexe D, qui a pour effet d’augmenter la diagonale et de régulariser 

le problème ; on constate aussi une accélération de la convergence. Ainsi la matrice de discrétisation de correction 

de pression peut être préconditionnée d’une part avec un préconditionnement qui augmente le terme diagonale 

et d’autre part avec le préconditionnement diagonal classique. 

Pour le préconditionnement de J.C. Miellou, nous avons choisi d’augmenter la diagonale de la matrice par le 

terme maximal de la diagonale multiplié par un coefficient compris entre 0 et 1. 

4.2 La méthode du Bi-gradient conjugué stabilisé pour les équations de transport et de potentiel. 

Les matrices de discrétisation de l’équation de transport et de l’équation de potentiel étant non-symétriques, 

nous utilisons pour résoudre les systèmes linéaires associés la méthode du Bi-gradient stabilisé décrite dans 

l’annexe E. Cette méthode et ses avantages sont décrit dans [1] ; elle donne des meilleures convergences pour la 

résolution de nos systèmes linéaires que la méthode du Bi-gradient conjugué. 

5 Quelques Résultats Numériques. 

Dans un premier temps nous avons réalisé les simulations avec une seule protéine ; l’indice m qui indiquait 

l’espèce de la protéine dans les équations de transport et de potentiel n’apparaît pas dans ce paragraphe. 

5.1 Le maillage. 

La cellule d’électrophorèse est une cellule parallélépipédique très fine et allongée. L’épaisseur de la cellule ( axe 

Ox ) est prise égale à 3.10 −3 m, sa longueur ( axe Oy ) est de 0, 3m et sa largeur ( axe Oz ) est 0, 1m. 

Nous considérons un maillage avec 20 points selon l’axe Ox. Afin de mailler correctement la zone centrale 

autour du jet de protéines nous considérons un maillage dont les cellules sont deux fois plus longues ( axe 0z ) 

que larges ( axe Ox ) dans le plan (xOz) dans la zone de projection de la protéine. Nous ne pouvons garder ce 

type de maillage tout au long de l’axe Oz ; tous les dix points nous multiplions la taille d’une cellule selon Oz 

par deux. Nous arrivons à un découpage de l’axe Oz avec 70 points ( voir figures 6.6 et fig.6.11 ). 

Finalement nous découpons la longueur de la cellule selon l’axe Oy par 50 points. 

Récapitulons : 

- Épaisseur ( Ox ) : 3.10−3 m , 20 points, maillage régulier ; 

- Longueur ( Oy ) : 0, 3 m , 50 points, maillage régulier ; 

- Largeur ( Oz ) : 0, 1 m , 70 points, maillage irrégulier. 

Nous obtenons un maillage comportant 70 000 points intérieurs. 

6.19

z 

0.056 

0.054 

0.052 

0.05 

0.048 

0.046 

0 0.5 1 1.5 2 2.5 3 

x 10 −3 

0.044 

x 

Figure 6.6 : Maillage autour de la zone de jet ( Plan xOz ). 

6.20

z 

0.1 

0.09 

0.08 

0.07 

0.06 

0.05 

0.04 

0.03 

0.02 

0.01 

0 0.5 1 1.5 2 2.5 3 

x 10 −3 

0 

x 

Figure 6.7 : Maillage d’un plan xOz. 

6.21

5.2 Valeurs indicatives des différents paramètres. 

5.2.1 Problème d’écoulement. 

Afin de diminuer le nombre de paramètres, nous passons selon un procédé classique en physique aux valeurs 

adimensionnelles ∗ : 

u ∗ = u 

um 

; E ∗ = E 

Em 

; p ∗ = p 

ρu2 , 

m 

nous obtenons la forme simplifiée suivante pour l’équation d’écoulement de la composante u de la vitesse : 

∂u ∗ 

∂t 

+ u∗ ∂u∗ 

∂x 

+ v∗ ∂u∗ 

∂y 

 

∂u∗ 

+ w∗ = 

∂z 

1 

Re ∆u∗ − ∂p∗ 

∂x + ɛE2 m 

ρU 2 m 

div(E ∗ x. E ∗ ) (6.21) 

avec Em potentiel moyen, Um vitesse moyenne et Re nombre de Reynolds ; nous prendrons alors pour Re et 

des valeurs vérifiant : 

ɛE 2 

m 

ρU 2 m 

- Re ≤ 10 ; 

- ɛE2 m 

ρU 2 ≤ 0.1. 

m 

Les vitesses initiales sont les suivantes : 

- u = w = 0, 

- v est nulle sur les faces des électrodes et possède les profils indiqués sur la figure 6.8 i.e. 

avec vmoy = 2, 5.10 −3 m/s. 

v 

x 10−6 

2.5 

2 

1.5 

1 

0.5 

v = 

6 vmoyen 

(x(épaisseur − x)) 

épaisseur 

profil de la vitesse v initiale selon l’ épaisseur 

0 0.5 1 1.5 2 2.5 3 

x 10 −3 

0 

x 

1.5 

1 

0.5 

0 

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 

Figure 6.8 : Profil de la vitesse initiale v. 

La pression initiale découle de la vitesse initiale ; son équation est : 

12 vmoyen 

p = − 

Re épaisseur y 

6.22

5.2.2 Équation de transport. 

Les paramètres apparaissant dans l’équation déterminant la concentration de la protéine ont les valeurs 

suivantes : 

- le coefficient de diffusion Dm est de l’ordre de 10 −4 , 

- le terme source ϕ est nul, 

- la concentration initiale est nulle sauf pour les points du jet de la protéine où elle est égale à 1. Le jet est 

l’ensemble des points (x, y, z) vérifiant 

avec 

- xjet = 1, 5.10 −3 m, 

- zjet = 50.10 −3 m, 

- rjet compris entre 0, 75.10 −3 m et 1.10 −3 m. 

(xjet − x) 2 + (zjet − z) 2 ≤ r 2 jet, 

- la concentration limite sur la face supérieure ( qui est en fait le terme source ) est 1 pour les points inclus 

dans le disque (xjet − x) 2 + (zjet − z) 2 ≤ r2 jet et nulle ailleurs. Les conditions limites sur les autres faces 

sont données dans le paragraphe 2.3.2 du présent chapitre. 

5.2.3 Équation de potentiel. 

- La conductivité K est de la forme 

avec K0 = 122.10 −4 S/m et Kmax = 150.10 −4 S/m, 

- La mobilité u = −15.10 −9 m 2 V −1 s −1 , 

- la constante des gaz parfaits R = 287 J/Kg/ o K, 

- la température est T = 294 o K, 

K = K0 + (Kmax − K0)C, 

- le potentiel sur les électrodes est tel que la différence de potentiel soit de 3500V/m : 

5.3 Différentes courbes. 

φE = 350 V 

φF = 0 V. 

Les résultats présentés dans ce paragraphe proviennent d’une simulation où l’horizon de temps est 10 secondes 

et où le pas de temps est 0.1 seconde ( 100 itérations temporelles ). En raison de contraintes de temps, nous 

avons réduit la longueur de la cellule à 0.18 m et par conséquent le nombre de points de discrétisation dans la 

longueur à 30. Avec ces 42000 points intérieurs une simulation dure à peu près 9 heures sur une station SUN 

SPARC5. 

Les courbes suivantes donnent la forme de la concentration pour différents temps espacés de 0.5 seconde dans 

une coupe selon l’épaisseur en x = 1, 5.10 −3 m ( le milieu de l’épaisseur ). 

Chaque figure présente deux courbes : 

6.23

- une vue 3D des valeurs de la concentration sur le plan de la coupe, 

- une courbe des équivaleurs de la concentration ( il est à noter que sur cette figure la cellule est représentée 

avec une rotation de 90 o par rapport à la réalité ). 

Concentration 

z 

0.1 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 

Itération 5 − mesh 

0 

0 

0.05 

Itération 5 − contour 2D 

y 

0.1 

0.15 

5 10 15 

y 

20 25 30 

Figure 6.9 : Concentration à l’instant t=0,5. 

6.24 

0.2

Concentration 

Concentration 

0.05 

z 

0.1 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 

0.1 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


6.25 

0.2 

0.2

Concentration 

Concentration 

0.06 

0.04 

0.02 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.06 

0.04 

0.02 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


6.26 

0.2 

0.2

Concentration 

Concentration 

0.04 

0.02 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.04 

0.02 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


6.27 

0.2 

0.2

Concentration 

Concentration 

0.04 

0.02 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.03 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


6.28 

0.2 

0.2

Concentration 

Concentration 

0.03 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.03 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


6.29 

0.2 

0.2

Concentration 

Concentration 

0.03 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.03 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


6.30 

0.2 

0.2

Concentration 

Concentration 

0.03 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.03 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


6.31 

0.2 

0.2

Concentration 

Concentration 

0.03 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


6.32 

0.2 

0.2

Concentration 

Concentration 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


0.05 

z 


0 

0 

0.05 


y 

0.1 

0.15 

5 10 15 

y 

20 25 30 


6.33 

0.2 

0.2

Concentration 

0.02 

0.01 

z 

0.1 0 

70 

60 

50 

40 

30 

20 

10 

0.05 

z 


0.05 

0 0 

y 


0.1 

0.15 

5 10 15 

y 

20 25 30 


6.34 

0.2


1. R. Barret and all. Templates for the solution of linear systems : building blocks for iterative, SIAM publications 

(1994). 

2. E. Braun, Electrophorèse en flot continu : modélisation numérique, Rapport de stage de troisième année, 


3. P. Bricard, Etude algorithmique numérique des équations du problème d’électrophorèse, Rapport de stage de 

troisième année, E.N.S.E.E.I.H.T.-Informatique, (1993). 

4. M.J. Clifton, H. Roux-de-Balmann and V. Sanchez, Electrohydrodynamic Deformation Of The Sample 

Stream in Continuous-flow Electrophoresis With an AC Electric Field, The Canadian Journal Of Chemical 

Engineering, 70 (1992), pp. 1055–1062. 

5. M.J. Clifton and V. Sanchez, Continuous-flow electrophoresis : numerical simulation of electrokinetics and 

electrohydrodynamics, 43rd Congress of the International Astronautical Federation, August 28-September 5, 

1992/ Washington, DC. 

6. M.J. Clifton, Numerical simulation of protein separation by continuous-flow electrophoresis, Electrophoresis, 

14 (1993), pp. 1284–1291. 

7. M. Coulon, Résolution des équations de Navier-Stokes pour un écoulement incompressible, Rapport de stage 


8. J.L. Estivalezes et A. Rompteaux, Etude comparative des différentes méthodes itératives pour la résolution de 

grands systèmes linéaires creux, ONERA/CERT/DERMES, Rapport final nx 2648.00-2644.00/DERMES, 

(1990). 

9. R.I. Issa, Solution of the implicitely discretised fluid flow equations by operator splitting, Journal of Computational 

Physics, 62 (1986), pp. 40–65. 

10. N. Jouve, Modélisation et optimisation du procédé d’électrophorèse de zone à écoulement continu. Limites 

d’application au sol en microgravité, Thèse de Doctorat, Université Paul Sabatier de Toulouse ( Sciences ), 

(1991). 

11. J.C. Miellou , Une méthode du gradient conjugué préconditionné,dans le cas d’opérateur non borné ( application 

à la résolution de problèmes de Poisson avec condition de Neumann, par la méthode alternée de 

Schwarz). Communication au XV ième Colloque d’Analyse Numérique, Belgodère (1982). 

12. S.V. Patankar. Numerical heat transfer and fluid flow, Mc Graw-Hill (1980). 

13. P. Spitéri and H.C. Boisson Subdomain predictor corrector algorithms for solving incompressible Navier- 

Stokes equation, Asymptotic and numerical methods for partial differential equations with critical parameters 

NATO ASI series, H.G. Kaper and M. Garbey editors, Kluwer Academic Publishers, 384 (1993), pp. 335–347. 

6.35

6.36

Annexe A 

Récapitulatif des routines P.V.M. 

utilisées. 

( voir aussi P.V.M. 3 USER’S GUIDE AND REFERENCE MANUAL ). 

PVMFBUFINFO( BUFID, BYTES, MSGTAG, TID, INFO ) 

retourne des informations un buffer message. 

INTEGER BUFID, BYTES, MSGTAG, TID, INFO 

BUFID est l’identificateur du buffer message ; 

BYTES retourne la taille en bytes du message ; 

MSGTAG retourne le label du message ; 

TID retourne l’émetteur ; 

INFO code d’état retourné par la routine ; une valeur inférieure à zéro indique une erreur. 

PVMFEXIT( INFO ) 

dit au pvmd local que le processus quitte P.V.M. 

INTEGER INFO 


PVMFINITSEND( ENCODING, BUFID ) 

initialise le buffer d’envoi et spécifie l’encodage du message. 

INTEGER ENCODING, BUFID 

ENCODING spécifie le shéma d’encodage du prochain message ; 


les valeurs prédéfinies de ENCODING en FORTRAN sont : 

PVNDEFAULT le codage XDR est utilisé. Il permet de faire communiquer un réseau hétérogène de 

machines ; 

PVMRAW Pas de codage, les messages sont envoyés dans leur format original ; 

PVMINPLACE les données ne sont pas recopiées dans le buffer qui contient seulement les pointeurs 

sur les données. 

PVMFMCAST( NTASK, TIDS, MSGTAG, INFO ) 

envoie les données du buffer message actif à un ensemble de tâches. 

A.1

INTEGER NTASK, TIDS(*), MSGTAG, INFO 

NTASK nombre de tâches destinataires ; 

TIDS tableau de taille au moins NTASK qui contient les identificateurs des tâches destinataires ; 

MSGTAG label fourni par l’utilisateur du message à envoyer ; 


PVMFMYTID( TID ) 

retourne l’identificateur du processus. 

INTEGER TID 

TID identificateur de la tâche du processus P.V.M. appelant ; une valeur inférieure à zéro indique une 

erreur. 

PVMFNRECV( TID, MSGTAG, INFO ) 

réception non-bloquante. 

INTEGER TID, MSGTAG, INFO 

TID identificateur fourni par l’utilisateur du processus émetteur ; la valeur -1 permet de recevoir un 

message de la part de n’importe quel des processus ; 

MSGTAG label fourni par l’utilisateur du message ; la valeur -1 permet de recevoir n’importe quel message 

; 


PVMFPACK( WHAT, XP, NITEM, STRIDE, INFO ) 

empaquete dans le buffer message actif les données. 

< type > XP 

INTEGER WHAT, NITEM, STRIDE, INFO 

WHAT type de données à empaqueter ; 

XP pointeur sur le début de la donnée à empaqueter ; 

NITEM nombre total d’éléments à empaqueter ( pas le nombres de bytes ) ; 

STRIDE le saut à utiliser lors de l’empaquetage des éléments ; 


PVMFPARENT( TID ) 

retourne l’identificateur du processus qui a crée le processus appelant. 

INTEGER TID 

TID retourne l’identificateur de la tâche parent du processus appelant ; si le processus appelant n’a pas 

été créé par un PVM SPAWN alors TID=PVMNOPARENT. 

PVMFPSEND( TID, MSGTAG, BUF, LEN, DATATYPE, INFO ) 

empaquete et envoie un message en une fois. 

< type > BUF 

INTEGER TID, MSGTAG, LEN, DATATYPE, INFO 

TID identificateur de la tâche réceptrice ; 

MSGTAG label fourni par l’utilisateur du message ; 

BUF pointeur sur le buffer à envoyer ; 

LEN longueur du buffer ; 

DATATYPE type de données du buffer ; 


A.2

PVMFRECV(TID, MSGTAG, BUFID ) 

reçoit un message. 

INTEGER TID, MSGTAG, BUFID 

TID identificateur fourni par l’utilisateur du processus émetteur ; la valeur -1 permet de recevoir un 

message de la part de n’importe quel des processus ; 

MSGTAG label fourni par l’utilisateur du message ; la valeur -1 permet de recevoir n’importe quel message 

; 

BUFID retourne la valeur de l’dentificateur du nouveau buffer de récption actif. 

PVMFSEND( TID, MSGTAG, INFO ) 

envoie les données du buffer message actif. 

INTEGER TID, MSGTAG, INFO 

TID identificateur du processus destinateur ; 

MSGTAG label fourni par l’utilisateur du message ; 


PVMFSPAWN( TASK, FLAG, WHERE, NTASK, TIDS, NUMT ) 

lance des nouveaux processus P.V.M. 

CHARACTER STRING TASK 

INTEGER NTASK, TIDS(*), NUMT 

TASK chaîne de caractères contenant le nom du fichier exécutable du processus P.V.M. à lancer ; 

FLAG option de spawn ; 

WHERE chaîne de caractères spécifiant où commencer le processus P.V.M. ; 

NTASK nombre de copies de l’exécutable à lancer ; 

TIDS tableau de taille au moins égal à NTASK ; au retour ce tableau contient les identificateurs des 

processus P.V.M. lancés par cette routine ; 

NUMT retourne le nombre de tâches lancées. 

les options prédéfinies de FLAG en FORTRAN sont : 

PVMDEFAULT P.V.M. choisit les machines sur lesquelles les processus seront activés ; 

PVMARCH WHERE définit un type d’architecture ; 

PVMHOST WHERE définit une machine particulière ; 

PVMDEBUG démarre les processus sous debugger. 

PVMFUNPACK( WHAT, XP, NITEM, STRIDE, INFO ) 

dépaquete le buffer message actif. 

< type > XP 

INTEGER WHAT, NITEM, STRIDE, INFO 

WHAT type de données à empaqueter ; 

XP pointeur sur le début de la donnée à empaqueter ; 

NITEM nombre total d’éléments à empaqueter ( pas le nombres de bytes ) ; 

STRIDE le saut à utiliser lors de l’empaquetage des éléments ; 


A.3

A.4

Annexe B 

Récapitulatif des routines M.P.I. 

utilisées. 

( voir aussi M.P.I. : A Message Passing Interface Standard ). 

– routines de communication point à point : 

MPI SEND( BUF, COUNT, DATATYPE, DEST, TAG, COMM, IERROR ) 

envoi bloquant en mode standard. 

BUF(*) 

INTEGER COUNT, DATATYPE, DEST, TAG, COMM, IERROR 

BUF adresse du buffer d’envoi ; 

COUNT nombre d’élément du buffer ; 

DATATYPE type des données ; 

DEST rang du destinataire ; 

TAG label du message ; 

COMM communicateur ; 

IERROR code d’état retourné par la routine. 

MPI RECV( BUF, COUNT, DATATYPE, SOURCE, TAG, COMM, STATUS, IERROR ) 

réception bloquante. 

BUF(*) 

INTEGER COUNT, DATATYPE, SOURCE, TAG, COMM, 

STATUS(MPI STATUS SIZE), IERROR 

BUF adresse du buffer de réception ; 



SOURCE rang fourni par l’utilisateur de l’émetteur ; 

TAG label fourni par l’utilisateur du message ; 


STATUS retourne le rang de l’émetteur et le label du message reçu ; 


B.1

MPI ISEND( BUF, COUNT, DATATYPE, DEST, TAG, COMM, REQUEST, IERROR ) 

lance un envoi non-bloquant en mode standard. 

BUF(*) 

INTEGER COUNT, DATATYPE, DEST, TAG, COMM, REQUEST, IERROR 

BUF adresse du buffer d’envoi ; 




TAG label du message ; 


REQUEST numéro de la requête ; 


MPI IRECV( BUF, COUNT, DATATYPE, SOURCE, TAG, COMM, REQUEST, IERROR ) 

lance une réception non-bloquante. 

BUF(*) 

INTEGER COUNT, DATATYPE, SOURCE, COMM, TAG, COMM, REQUEST, IERROR 


COUNT nombre d’éléments du buffer ; 







MPI TEST( REQUEST, FLAG, STATUS, IERROR ) 

teste la complétion d’une requête. 

LOGICAL FLAG 

INTEGER REQUEST, STATUS(MPI STATUS SIZE), IERROR 


FLAG vrai si l’opération est faite ; 

STATUS retourne le rang de l’émetteur et le label du message de la requête testée ; 


MPI CANCEL( REQUEST, IERROR ) 

annule une requête. 

INTEGER REQUEST, IERROR 



MPI SEND INIT( BUF, COUNT,DATATYPE, DEST, TAG, COMM, REQUEST, IERROR ) 

crée une requête de communication persistante pour une opération d’envoi en mode standard. 

BUF(*) 

INTEGER COUNT, DATATYPE, DEST, TAG, COMM, REQUEST, IERROR 

BUF adresse du buffer de d’envoi ; 


B.2







MPI RECV INIT( BUF, COUNT,DATATYPE, SOURCE, TAG, COMM, REQUEST, IERROR ) 

crée une requête de communication persistante pour une opération de réception. 

BUF(*) 

INTEGER COUNT, DATATYPE, SOURCE, COMM, TAG, COMM, REQUEST, IERROR 










MPI START( REQUEST, IERROR ) 

active une requête de communication persistante. 

INTEGER REQUEST, IERROR 



– routines de communication collective : 

MPI GATHER( SENDBUF, SENDCOUNT, SENDTYPE, RECVBUF, RECVCOUNT, RECVTYPE, 

ROOT, COMM, IERROR ) 

Chaque processus ( processus Root inclu ) envoie le contenu de son buffer d’envoi au processus Root ; le 

processus Root reçoit les messages et stocke les données selon le rang des processus émetteurs ; les données 

ont la même taille. 

SENDBUF(*), RECVBUF(*) 

INTEGER SENDCOUNT, SENDTYPE, RECVCOUNT, RECVTYPE, ROOT, COMM, IERROR 

SENDBUF adresse du buffer d’envoi ; 

SENDCOUNT nombre d’éléments du buffer d’envoi ; 

SENDTYPE type des données du buffer d’envoi ; 

RECVBUF adresse du buffer de réception ( significatif pour le processeur qui réceptionne ) ; 

RECVCOUNT nombre d’éléments pour chaque simple réception ( significatif pour le processeur qui 

réceptionne ) ; 

RECVTYPE type des données du buffer de réception ; 

ROOT rang du processeur de réception ; 



MPI GATHERV( SENDBUF, SENDCOUNT, SENDTYPE, RECVBUF, RECVCOUNTS, DISPLS, 

B.3

RECVTYPE, ROOT, COMM, IERROR ) 

Même chose que MPI GATHER mais les données des messages peuvent avoir des tailles différentes. 


INTEGER SENDCOUNT, SENDTYPE, RECVCOUNT(*), DISPLS(*), RECVTYPE, ROOT, 

COMM, IERROR 





RECVCOUNT tableau qui contient le nombre d’éléments qui sont reçus de chaque processus ( significatif 

pour le processeur qui réceptionne ) ; 

DISPLS tableau dont l’entrée i spécifie le déplacement relatif dans RECVBUF pour être à l’endroit où 

placer les données provenant du processus i ( significatif pour le processeur qui réceptionne ) ; 


ROOT rang du processeur de réception ; 



MPI ALLGATHERV( SENDBUF, SENDCOUNT, SENDTYPE, RECVBUF, RECVCOUNTS, 

DISPLS, RECVTYPE, COMM, IERROR ) 

La routine MPI ALLGATHERV peut être vu comme un MPI GATHERV où tous les processus recoivent 

les données. 


INTEGER SENDCOUNT, SENDTYPE, RECVCOUNT(*), DISPLS(*), RECVTYPE,COMM, 

IERROR 





RECVCOUNT tableau qui contient le nombre d’éléments qui sont reçu de chaque processus ( significatif 

pour le processeur qui réceptionne ) ; 

DISPLS tableau dont l’entrée i spécifie le déplacement relatif dans RECVBUF pour être à l’endroit où 

placer les données provenant du processus i ( significatif pour le processeur qui réceptionne ) ; 




– routines de groupes : 

MPI COMM SIZE( COMM, SIZE, IERROR ) 

retourne le nombre de processus appartenant au groupe de communication. 

INTEGER COMM, SIZE, IERROR 


SIZE nombre d’éléments dans le groupe de COMM ; 


MPI COMM RANK( COMM, RANK, IERROR ) 

B.4

etourne le rang du processus. 

INTEGER COMM, RANK, IERROR 


RANK rang du processus appelant dans le groupe de COMM ; 


– routines de gestion des processus : 

MPI INIT( IERROR ) 

routine d’initialisation. 

INTEGER IERROR 


MPI FINALIZE( IERROR ) 

routine de terminaison. 

INTEGER IERROR 


– variables prédéfinies : 

MPI COMM WORLD INTEGER 

communicateur prédéfini ; 

MPI DOUBLE PRECISION INTEGER 

type MPI correspondant au type double précision de FORTRAN ; 

MPI INTEGER INTEGER 

type MPI correspondant au type INTEGER de FORTRAN ; 

B.5

Annexe C 

Récapitulatif des variables utilisées. 

Les variables sont listées par ordre alphabétique. 

– CD P et CF P : INTEGER 

tableaux de taille N P ; CD P( I P ) contient le numéro du premier sous-domaine confié au processeur I P 

et CF P( I P ) le numéro du dernier ; 

– DEST : INTEGER 

numéro du processeur destinataire ; 

– DIFF : DOUBLE PRECISION 

tableau de taille NSDOM qui contient pour chaque sous-domaine la norme de la différence entre deux itérés 

de Schwarz ; 

– DIFFRELAX : DOUBLE PRECISION 

norme de la différence entre deux itérés successifs de l’itération de relaxation ; 

– DIFFSUP : DOUBLE PRECISION 

variable locale à un processeur contenant après chaque itération de Schwarz le max sur les sous-domaines 

du processeur de la norme de la différence entre deux itérées ; 

– EPSIRELAX : DOUBLE PRECISION 

seuil de convergence de l’itération de relaxation ; 

– EPSISC : DOUBLE PRECISION 

seuil de convergence de l’itération de Schwarz ; 

– I P : INTEGER 

numéro du processeur courant ; il varie de 1 à N P pour P.V.M., 1 étant par convention le numéro du 

Maître ; 

– INFO P : INTEGER 

variable qui contient des informations sur le déroulement d’une instruction P.V.M. ; 

– LARGEURSD : INTEGER 

tableau de taille N P ; LARGEURSD ( T P ) contient le nombre de points des sous-domaines traités par 

le processeur T P ; 

– LOG P : LOGICAL 

variable en sortie de MPI TEST ; 

C.1

– N P : INTEGER 

nombre de processeurs ; 

– NDCY : INTEGER 

nombre de points dans la direction de l’axe des ordonnées = nombre de points d’une frontière de recouvrement 

; 

– NSD : INTEGER 

nombre maximal de points par sous-domaine ; 

– NSDOM : INTEGER 

nombre de sous-domaines ; 

– NSDOMPRO : INTEGER 

tableau de taille N P qui contient le nombre de sous-domaines par processeurs ; 

– NUMMES P : INTEGER 

numéro du message ; 

– POINTLARGEUR : INTEGER 

tableau de taille N P ; POINTLARGEUR ( T P ) contient les déplacements dans WSOLSD pour pointer 

sur les données provenant du processeur T P ; 

– POINTNSDOM : INTEGER 

tableau de taille N P ; POINTNSDOM ( T P ) contient les déplacements dans DIFF pour pointer sur les 

données provenant du processeur T P ; 

– REQ P : INTEGER 

numéro de la requête ; 

– SOMMETEST : INTEGER 

variable du processeur Maître qui contient le somme des éléments du tableau TEST ; si cette somme est 

égale à zéro, il y a convergence globale. 

– SOURCE : INTEGER 

numéro du processeur émetteur ; 

– STATUS REQ P : INTEGER 

tableau qui contient pour chaque requête des informations la concernant ; 

– T P : INTEGER 

numéro du processeur courant pour M.P.I. ; il varie de 0 à N P-1, 0 étant le numéro du Maître ou Root ; 

– TEST : DOUBLE PRECISION 

tableau de taille N P qui contient pour chaque processeur l’indicateur sur son état de convergence ; 

– TIDS P : INTEGER 

tableau de taille N P qui contient les numéros d’identification TID des processeurs ; TIDS P( 1 ) est le 

numéro du Maître ; 

– VALFRONSD : DOUBLE PRECISION 

tableau qui contient les valeurs de la solution sur les frontières de recouvrement ; 

– WSOLSD : DOUBLE PRECISION 

tableau de taille NSDOM*NSD qui contient la solution sur chaque sous-domaine. 

C.2

Annexe D 

Un préconditionnement de la méthode 

du gradient conjugué. 

Cette annexe est tirée de la communication de J.C. Miellou au XV ième Colloque d’Analyse Numérique [8]. 

1 Notations ; position du problème. 

Soient V , H, V ′ trois espaces de Hilbert séparables sur le corps des réels, vérifiant : 

et on note par : 

- ∀u, v ∈ V , ((u, v)) le produit scalaire sur V , 

soit ||v|| la norme associée de v. 

- ∀u, v ∈ H, (u, v) le produit scalaire sur H, 

V ⊂ H ⊂ V ′ avec injections compactes et denses. (D.1) 

V ′ est le dual de V, (D.2) 

- ∀u ′ ∈ V ′ , ∀v ∈ V , la forme bilinéaire mettant V ′ et V en dualité. 

Remarque D.1. Si, de plus, u ′ ∈ V ′ est un élément de H, alors = (u ′ , v). 

On suppose que : 

 

Soit A ∈ L(V, V ′ ) un opérateur autoadjoint : 

∀u, v ∈ V < Au, v >=< Av, u > . 

Les hypothèses (D.1) à (D.4) étant vérifiées, on sait que : 

(D.3) 

< Av, v >≥ C||v|| 2 ∀v ∈ V où C > 0. (D.4) 

D.1

′ ∈ V ′ étant donné, il existe un unique u ∗ ∈ V tel que 

Au ∗ = b ′ 

On se place dans une situation dans laquelle on n’a pas d’algorithme permettant une obtention directe de u ∗ , 

mais par contre, on suppose que : 

⎧ 

⎪⎨ 

⎪⎩ 

∃µ0 > 0 tel que ∀µ ≤ µ0, on dispose de J A µ = (I + µA) −1 ∈ L(V ′ , V ); 

ou tout au moins que l’on sait résoudre facilement tout problème de la forme : 

 

Trouver u ∈ V tel que : 

u + µAu = v ′ avec v ′ ∈ V ′ donné. 

2 Une méthode du gradient conjugué préconditionné. 

Compte-tenu des hypothèses (D.3) et (D.4), le problème (D.5) est équivalent au problème d’optimisation : 

où J = 1 

2 < Av, v > − < b′ , v >. 

I étant l’identité dans V , nous écrirons que : 

de plus : 

 

Trouver u ∗ ∈ V tel que : 

J(u ∗ ) ≤ J(v) ∀v ∈ V, 

 

1 A = µ ((I + µA) − I) = M − R 

où M = 1 

µ (I + µA); R = 1 

µ I. 

(D.5) 

(D.6) 

(D.7) 

(D.8) 

M −1 = µJ A µ ∈ L(V ′ , V ). (D.9) 

On peut résoudre le problème (D.7) par l’algorithme classique du gradient conjugué préconditionné en utilisant 

la matrice M −1 comme matrice de préconditionnement [4]. 

2.1 Initialisation : 

D’après (D.6), nous pouvons obtenir : 

d’où : 

et d’après (D.9) et (D.12) : 

 

Soit u 0 ∈ V (D.10) 

u 1 solution de u 1 + µAu 1 = u 0 + µb ′ 

(D.11) 

r 1 = −Au 1 + b ′ = 1 

µ (u1 − u 0 ) ∈ V. (D.12) 

p 1 = h 1 = M −1 r 1 ∈ V 

Ap 1 = AM −1 r 1 = (I − 1 

µ M −1 )r 1 = (I − J A µ )r 1 ∈ V 

D.2 

(D.13)

2.2 Boucle : 

∀i ∈ IN, i ≥ 1 

u i+1 = u i + αip i 

h i+1 = M −1 r i+1 

3 Vitesse de convergence de l’algorithme : 

⎧ 

⎪⎨ 

⎪⎩ 

αi = (ri , M −1 r i ) 

(Ap i , p i ) 

; r i+1 = r i − αiAp i 

; βi = (ri+1 , M −1 r i+1 ) 

(r i , M −1 r i ) 

p i+1 = h i+1 + βip i 

Ap i+1 = AM −1 r i+1 + βiAp i 

= (I − 1 

µ M −1 )r i+1 + βiAp i 

= (I − J A µ )r i+1 + βiAp i 

= r i+1 − 1 

µ hi+1 + βiAp i 

(D.14) 

(D.15) 

(D.16) 

(D.17) 

(D.18) 

Proposition D.1. Les hypothèses (D.1) à (D.4), (D.6) étant vérifiées, alors ∃K > 0 tel que l’itéré u i+1 de 

l’algorithme du gradient conjugué vérifie : 

∀i ∈ IN, ||u i+1 − u ∗ || ≤ K( 

 

µC 

1 − 

1 + 

1+µC 

) 

µC 

1+µC 

i ||u 1 − u ∗ ||. (D.19) 

4 Application à la résolution du problème de Poisson avec conditions de Neumann. 

Soit Ω un domaine de IR n de frontière régulière ∂Ω. Considérons le problème : 

où k ∈ IR + , f ∈ L 2 (Ω) et g ∈ H −1/2 (∂Ω). 

⎧ 

⎨ 

⎩ 

−∆y ∗ + ky ∗ = f |Ω 

∂y ∗ 

∂n = g |∂Ω, 

Soit Zk l’ensemble des éléments de H 1 (Ω) vérifiant : 

−∆z + kz = 0 |Ω 

D.3 

(D.20) 

(D.21)

D’après [5] la trace sur ∂Ω d’un éléments de Zk est dans H−1/2 (∂Ω). Inversement, soit v ∈ H−1/2 (∂Ω) et 

z(v) la solution du problème de Dirichlet associé à (D.21) et soit C(v) = ∂z(v) 

∂n . On sait, par [9], qu’il existe 

|∂Ω 

un unique C(v) ∈ H−1/2 (∂Ω). 

Si < , > désigne la dualité entre H −1/2 (∂Ω) et H 1/2 (∂Ω), ∀v, u ∈ H 1/2 (∂Ω) : 

n ∂z(v) ∂z(u) 

< C(v), u >=< C(u), v >= ( 

+ kz(v)z(u))dx (D.22) 

∂xi ∂xi 

Ω 

i=1 

En prenant V = H 1/2 (∂Ω) ; H = L 2 (Ω) ; V ′ = H −1/2 (∂Ω) et A = C on est dans les conditions d’application des 

résultats des paragraphes précédents où on remplace la résolution de (D.20) par celle d’une suite de problèmes 

de la forme : ⎧ ⎨ 

⎩ 

−∆y + ky = ˜ f 

y + µ ∂ 

∂n = ˜g. 

Rfrences. 

(D.23) 

1. Bergman and Schiffer, Kernel Functions and elliptic differential equations in mathematical physics. New- 

York, Acad. Press (1953). 

2. J.W. Daniel, The conjuguate gradient method for linear and non linear operator equations, SIAM J. Numer. 

Anal., Vol. 4, n ◦ 1 (1967), pp. 11–35. 

3. Dinh, Thèse de 3 e cycle, Paris (1982). 

4. P. Lascaux et R. Théodor, Analyse numérique matricielle appliquée à l’art de l’ingénieur, tome 2. Masson 

(1987). 

5. Lions et Magenes, Problèmes aux limites non homogènes et applications, T. 1, Dunod (1968). 

6. T.A. Manieufel, An imcomplete factorization technique for positive definite linear system, Math. of Computation, 

vol. 34, number 150, (1980), pp. 473–497. 

7. J.C. Miellou , Variantes synchrones et asynchrones de la méthode alternée de Schwarz , Rapport de recherche 

E.R.A. de mathématiques n ◦ 070654, Université de Besançon, (1982). 

8. J.C. Miellou , Une méthode du gradient conjugué préconditionné,dans le cas d’opérateur non borné ( application 

à la résolution de problèmes de Poisson avec condition de Neumann, par la méthode alternée de 

Schwarz). Communication au XV ième Colloque d’Analyse Numérique, Belgodère (1982). 

9. Nedelec, Planchard, Une méthode variationnelle d’éléments finis pour la résolution d’un problème extérieur, 

RAIRO, 7 (1973), pp. 105–129. 

D.4

Annexe E 

La méthode du BiGradient Conjugué 

Stabilisée ( Bi-CGSTAB ). 

La méthode du BiGradient Conjugué Stabilisée a été développée pour résoudre des systèmes non-symétriques 

tout en évitant les cas de convergence irrégulière de la méthode du gradient conjugué carré (CGS) ( voir Van 

der Vorst [1] ). 

La méthode du BiGradient Conjugué Stabilisée préconditionnée par la matrice M est énoncée par le pseudocode 

de la page suivante [2]. 

Rfrences. 

1. H. Van Der Vors, Bi-CGSTAB : A fast and smoothy converging variant of Bi-CG for the solution of nonsymmetric 

linear systems, SIAM J. Sci. Statis. Comput., 13 (1992), pp. 631–708. 

2. R. Barret and all. Templates for the solution of linear systems : building blocks for iterative methods, SIAM 

publications (1994). 

E.1

Calculer r 0 = b − Ax 0 pour une solution initiale x 0 . 

Choisir ˜r 

Pour i = 1, 2, . . . faire : 

ρi−1 = ˜r T r i−1 

si ρi−1 = 0 échec de la méthode 

si i = 1 

p i = r i−1 

sinon 

βi = (ρi−1/ρi−2)(αi−1/ωi−1) 

p i = r i−1 + βi−1(p i−1 − ωi−1v i−1 ) 

fin si 

résoudre M ˆp = p i 

v i = Aˆp 

αi = ρi−1/˜r T v i 

s = r i−1 − αiv i 

test d’arrêt : si s est suffisament petit : x i = x i−1 + αi ˆp et arrêt. 

résoudre M ˆs = s 

t = Aˆs 

ωi = t T s/t T t 

x i = x i−1 + αi ˆp + ωiˆs 

r i = s − ωit 

test d’arrêt : si r i est suffisament petit : arrêt, 

sinon continuation à moins que ωi = 0. 

fin. 

Algorithme E.10 : La méthode du BiGradient Conjugué Stabilisée avec préconditionnement. 

E.2

Table des Matires 

0 Introduction générale. 0.1 

1 Algorithmes parallèles asynchrones et synchrones classiques. 1.1 

1 Rappel de la modélisation des algorithmes de relaxation synchrones et asynchrones – résultats 

de convergence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 

1.1 Définitions. Un résultat de convergence en norme vectorielle. . . . . . . . . . . . . . 1.3 

1.2 Un résultat de convergence en norme scalaire. . . . . . . . . . . . . . . . . . . . . . 1.5 

2 Analyse de la convergence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 

2.1 Rappel de la notion d’accrétivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 

2.1.1 Définitions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 

2.1.2 Cas de IR n : caractérisation des matrices fortement accrétives. . . . . . . . . 1.7 

2.1.3 Perturbation d’un opérateur accrétif par un opérateur diagonal. . . . . . . . 1.8 

2.2 Caractérisation d’une classe d’opérateurs assurant la convergence des algorithmes asynchrones 

: les opérateurs H-accrétifs . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.9 

2.3 Un résultat de contraction en norme vectorielle pour une décomposition en blocs du 

problème. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.10 

2.4 Convergence des algorithmes asynchrones associés à la décomposition en sous-domaines 

du problème. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.12 

2.5 Critères d’application des algorithmes asynchrones et synchrones classiques dans le cas 

discret. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.14 

3 Application à la méthode alternée de Schwarz. . . . . . . . . . . . . . . . . . . . . . . . . 1.14 

3.1 Rappels sur la méthode alternée de Schwarz. . . . . . . . . . . . . . . . . . . . . . . 1.14 

3.2 Méthode alternée de Schwarz et algorithmes parallèles asynchrones et synchrones. . . 1.16 

3.3 Exemples de problèmes d’utilisation de la méthode alternée de Schwarz et des algorithmes 

parallèles asynchrones et synchrones. . . . . . . . . . . . . . . . . . . . . . . . . . . 1.18 

4 Références du chapitre 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.23 

2 Algorithmes itératifs asynchrones avec communication flexible. 2.1 

1 Position du problème - rappels sur les notions de M-fonction et de coercivité pour l’ordre. . . 2.2 

2 Λ-sur-applications et nouvelles méthodes asynchrones. . . . . . . . . . . . . . . . . . . . . 2.3 

2.1 Itérations asynchrones avec communication flexible. . . . . . . . . . . . . . . . . . . 2.3 

2.2 Une classe particulière de Λ-sur-applications. . . . . . . . . . . . . . . . . . . . . . 2.7 

i

2.3 Critères d’applications des algorithmes itératifs asynchrones avec communication flexible. 2.7 

2.4 Lien avec la méthode alternée de Schwarz. . . . . . . . . . . . . . . . . . . . . . . . 2.8 

3 Exemples d’applications des algorithmes itératifs asynchrones avec communication flexible. . 2.8 


3 Implémentation des algorithmes parallèles synchrones et asynchrones. 3.1 

1 Description du multiprocesseur I.B.M.-SP2. . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 

2 Description des outils de parallélisation P.V.M. et M.P.I. . . . . . . . . . . . . . . . . . . . 3.3 

2.1 Présentation de l’environnement Parallel Virtual Machine ( P.V.M. ). . . . . . . . . 3.3 

2.2 Présentation de l’environnement Message Passing Interface ( M.P.I. ). . . . . . . . . 3.4 

3 Rôle général du Maître et des Esclaves. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 

4 Mise en œuvre des algorithmes synchrones . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 

4.1 Le Maître et l’Esclave synchrones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 

4.2 Algorithme synchrone et P.V.M. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7 

4.3 Algorithme synchrone et M.P.I. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.9 

4.4 Quelques enseignements liés à l’utilisation de P.V.M. et M.P.I. pour développer les algorithmes 

synchrones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.10 

5 Mise en œuvre des algorithmes asynchrones . . . . . . . . . . . . . . . . . . . . . . . . . . 3.11 

5.1 Le Maître et l’Esclave asynchrones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.11 

5.2 Test d’arrêt et Terminaison. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.14 

5.3 Algorithmes asynchrones et P.V.M. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.15 

5.4 Algorithmes asynchrones et M.P.I. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.18 

5.5 Exemple de gestion de la terminaison. . . . . . . . . . . . . . . . . . . . . . . . . . 3.21 


4 Application des algorithmes asynchrones pour la résolution de problèmes de convectiondiffusion 

linéaires et non-linéaires. 4.1 

1 Cadre théorique pour le problème de convection-diffusion. . . . . . . . . . . . . . . . . . . . 4.3 

1.1 Cas de la discrétisation décentrée du terme de convection. . . . . . . . . . . . . . . . 4.3 

1.1.1 Le problème linéaire de convection-diffusion. . . . . . . . . . . . . . . . . . 4.3 

1.1.2 Situation non-linéaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 

1.1.3 Problèmes de convection-diffusion avec forte convection. . . . . . . . . . . . 4.7 

1.2 Cas de la discrétisation centrée du terme de convection. . . . . . . . . . . . . . . . . 4.8 

ii

1.2.1 Le problème linéaire de convection-diffusion. . . . . . . . . . . . . . . . . . 4.8 

1.2.2 Situation non-linéaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.9 

2 Expérimentations numériques pour le problème linéaire classique de convection-diffusion. . . 4.9 

2.1 Résultats détaillés de deux calculs avec discrétisation décentrée des termes de convection 

– Version P.V.M. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.10 

2.2 Résultats des calculs avec discrétisation décentrée des termes de convection. . . . . . 4.12 

2.2.1 Implémentation avec P.V.M. . . . . . . . . . . . . . . . . . . . . . . . . . 4.12 

2.2.2 Implémentation avec M.P.I. . . . . . . . . . . . . . . . . . . . . . . . . . 4.18 

2.3 Résultats des calculs avec discrétisation centrée des termes de convection. . . . . . . 4.23 



3 Expérimentations numériques pour un problème non-linéaire de convection-diffusion. . . . . 4.32 

3.1 Résultats des calculs avec discrétisation décentrée des termes de convection. . . . . . 4.32 



3.2 Résultats des calculs avec discrétisation centrée des termes de convection. . . . . . . 4.38 



3.3 Commentaires sur les résultats du problème non-linéaire. . . . . . . . . . . . . . . . 4.44 

4 Synthèse des différents résultats. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.44 

5 Comparaison P.V.M. et M.P.I. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.44 


5 Application des algorithmes asynchrones et synchrones à un problème d’écoulements 

incompressibles en formulation fonction courant-rotationnel. 5.1 

1 Equations du problème. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 

2 Algorithmes numériques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 

2.1 Méthode alternée de Schwarz classique pour l’équation de convection-diffusion. . . . 5.4 

2.1.1 Cas des schémas de discrétisation décentrés. . . . . . . . . . . . . . . . . . 5.5 

2.1.2 Cas des schémas de discrétisation centrés. . . . . . . . . . . . . . . . . . . 5.5 

2.2 Une variante efficace de la méthode alternée de Schwarz pour l’équation de diffusion. 5.6 

3 Expérimentations numériques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.10 

iii

3.1 Algorithmes séquentiels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.11 

3.2 Algorithmes parallèles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.12 

3.2.1 Résultats des calculs avec discrétisation centrée des termes de convection. . 5.13 

3.2.2 Résultats des calculs avec discrétisation décentrée des termes de convection. 5.18 

4 Synthèse des résultats des algorithmes asynchrones. . . . . . . . . . . . . . . . . . . . . . . 5.20 


6 Étude numérique d’un problème d’électrophorèse en écoulement continu. 6.1 

1 Position du problème. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 

1.1 Le principe de l’électrophorèse en écoulement continu. . . . . . . . . . . . . . . . . . 6.3 

1.2 Les phénomènes physiques mis en jeu. . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 

2 Équations du problème. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 

2.1 Variables physiques et coefficients. . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 

2.2 Les équations du problème. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 

2.2.1 La conservation de la masse. . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 

2.2.2 L’équation d’écoulement 3D. . . . . . . . . . . . . . . . . . . . . . . . . . 6.5 

2.2.3 L’équation de transport des protéines. . . . . . . . . . . . . . . . . . . . . 6.5 

2.2.4 L’équation de potentiel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5 

2.3 Les conditions aux limites. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6 

2.3.1 Les conditions aux limites de l’écoulement 3D. . . . . . . . . . . . . . . . . 6.6 

2.3.2 Les conditions aux limites associées à l’équation de transport. . . . . . . . . 6.6 

2.3.3 Les conditions aux limites de potentiel. . . . . . . . . . . . . . . . . . . . . 6.7 

3 Discrétisation des équations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.8 

3.1 L’équation d’écoulement 3D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.8 

3.1.1 Rappel de l’algorithme PISO. . . . . . . . . . . . . . . . . . . . . . . . . . 6.8 

3.1.2 Rappel de la méthode des volumes finis. . . . . . . . . . . . . . . . . . . . 6.10 

3.1.3 L’équation de transport des protéines. . . . . . . . . . . . . . . . . . . . . 6.16 

3.1.4 L’équation de potentiel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.17 

4 Méthodes de résolution des systèmes linéaires. . . . . . . . . . . . . . . . . . . . . . . . . . 6.18 

4.1 La méthode du Bi-gradient conjugué pour le problème d’écoulement. . . . . . . . . . 6.18 

4.2 La méthode du Bi-gradient conjugué stabilisé pour les équations de transport et de potentiel. 

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.19 

iv

5 Quelques Résultats Numériques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.19 

5.1 Le maillage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.19 

5.2 Valeurs indicatives des différents paramètres. . . . . . . . . . . . . . . . . . . . . . 6.22 

5.2.1 Problème d’écoulement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.22 

5.2.2 Équation de transport. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.23 

5.2.3 Équation de potentiel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.23 

5.3 Différentes courbes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.23 


A Récapitulatif des routines P.V.M. utilisées. A.1 

B Récapitulatif des routines M.P.I. utilisées. B.1 

C Récapitulatif des variables utilisées. C.1 

D Un préconditionnement de la méthode du gradient conjugué. D.1 

1 Notations ; position du problème. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D.1 

2 Une méthode du gradient conjugué préconditionné. . . . . . . . . . . . . . . . . . . . . . . D.2 

2.1 Initialisation : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D.2 

2.2 Boucle : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D.3 

3 Vitesse de convergence de l’algorithme : . . . . . . . . . . . . . . . . . . . . . . . . . . . . D.3 

4 Application à la résolution du problème de Poisson avec conditions de Neumann. . . . . . . D.3 

E La méthode du BiGradient Conjugué Stabilisée ( Bi-CGSTAB ). E.1 

v

TH`ESE - Enseeiht

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?