25.06.2013 Views

Polycopié de P. TEYSSANDIER. - Observatoire de Paris

Polycopié de P. TEYSSANDIER. - Observatoire de Paris

Polycopié de P. TEYSSANDIER. - Observatoire de Paris

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Master “Sciences <strong>de</strong> l’Univers et techniques spatiales”<br />

Niveau M1<br />

Introduction aux théories relativistes<br />

et à leurs applications<br />

Rédaction provisoire du cours <strong>de</strong> l’année 2008-2009<br />

Pierre Teyssandier<br />

<strong>Observatoire</strong> <strong>de</strong> <strong>Paris</strong>,<br />

Département SYRTE/CNRS-UMR 8630


Table <strong>de</strong>s matières<br />

1 Notions préliminaires 4<br />

1.1 Observateurs. Objets. Particules . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />

1.2 Événements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />

1.3 Notion <strong>de</strong> variété. Variété <strong>de</strong>s événements . . . . . . . . . . . . . . . . . . . . . 5<br />

1.4 Fonctions scalaires. Hypersurfaces . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

1.5 Courbe différentiable sur une variété . . . . . . . . . . . . . . . . . . . . . . . . 9<br />

1.6 Coïnci<strong>de</strong>nce d’événements. Ordre temporel . . . . . . . . . . . . . . . . . . . . . 9<br />

1.7 Horloges standard. Temps propre. Ligne d’univers d’une particule . . . . . . . . 10<br />

2 Champs <strong>de</strong> vecteurs. Champs <strong>de</strong> tenseurs 12<br />

2.1 Champs <strong>de</strong> vecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />

2.2 Champs <strong>de</strong> vecteurs covariants . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

2.3 Définition générale <strong>de</strong>s champs <strong>de</strong> tenseurs . . . . . . . . . . . . . . . . . . . . . 15<br />

2.4 Exemples <strong>de</strong> champs <strong>de</strong> tenseurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />

2.5 Addition et multiplication <strong>de</strong>s tenseurs . . . . . . . . . . . . . . . . . . . . . . . 18<br />

2.6 Contraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />

2.7 Critères <strong>de</strong> tensorialité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />

2.8 Tenseurs symétriques et tenseurs antisymétriques . . . . . . . . . . . . . . . . . 23<br />

2.9 Composantes covariantes et contravariantes . . . . . . . . . . . . . . . . . . . . . 23<br />

3 Espace-temps <strong>de</strong> Minkowski 28<br />

3.1 Principes fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />

3.2 Lois <strong>de</strong> transformation <strong>de</strong>s coordonnées galiléennes . . . . . . . . . . . . . . . . 30<br />

3.3 Mouvement relatif <strong>de</strong> <strong>de</strong>ux référentiels galiléens . . . . . . . . . . . . . . . . . . 32<br />

3.4 Intervalle entre <strong>de</strong>ux points-événements . . . . . . . . . . . . . . . . . . . . . . . 32<br />

3.5 Classification <strong>de</strong>s intervalles. Cône isotrope . . . . . . . . . . . . . . . . . . . . . 36<br />

3.6 Lignes d’univers du genre temps . . . . . . . . . . . . . . . . . . . . . . . . . . . 37<br />

3.7 Temps propre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

4 Cinématique relativiste 47<br />

4.1 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47<br />

4.2 Transformations spéciales <strong>de</strong> Lorentz . . . . . . . . . . . . . . . . . . . . . . . . 47<br />

4.3 Loi <strong>de</strong> composition relativiste <strong>de</strong>s vitesses . . . . . . . . . . . . . . . . . . . . . 51<br />

4.4 Aberration <strong>de</strong> la lumière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />

4.5 Effet Doppler-Fizeau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

1


5 Dynamique relativiste (I) 62<br />

5.1 Principe d’équivalence <strong>de</strong>s référentiels galiléens . . . . . . . . . . . . . . . . . . . 62<br />

5.2 Quantité <strong>de</strong> mouvement et énergie cinétique d’une particule isolée . . . . . . . . 63<br />

5.3 Energie d’une particule. Inertie <strong>de</strong> l’énergie . . . . . . . . . . . . . . . . . . . . . 65<br />

5.4 Relations entre l’énergie et la quantité <strong>de</strong> mouvement d’une particule . . . . . . 67<br />

5.5 Particules <strong>de</strong> masse nulle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />

5.6 Loi fondamentale <strong>de</strong> la dynamique . . . . . . . . . . . . . . . . . . . . . . . . . 68<br />

5.7 Particule chargée dans un champ électromagnétique . . . . . . . . . . . . . . . . 71<br />

5.8 Un exemple : mouvement d’une charge dans un champ magnétique constant<br />

uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72<br />

6 Dynamique relativiste (II) 75<br />

6.1 Quadri-vecteur vitesse unitaire d’une particule . . . . . . . . . . . . . . . . . . . 75<br />

6.2 Quadrivecteur impulsion-énergie . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />

6.3 Quadrivecteur accélération . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />

6.4 Loi <strong>de</strong> la dynamique en formalisme quadridimensionnel . . . . . . . . . . . . . . 75<br />

6.5 Dynamique <strong>de</strong>s milieux continus . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />

7 Gravitation et relativité 76<br />

7.1 La théorie newtonienne <strong>de</strong> la gravitation . . . . . . . . . . . . . . . . . . . . . . 76<br />

7.2 Analyse critique <strong>de</strong> la théorie newtonienne . . . . . . . . . . . . . . . . . . . . . 79<br />

7.3 Introduction <strong>de</strong>s théories métriques . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />

7.4 Une conséquence <strong>de</strong> l’approximation newtonienne : l’effet Doppler gravitationnel 86<br />

7.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89<br />

8 Notion d’approximation postnewtonienne <strong>de</strong>s théories métriques 90<br />

8.1 Notion d’approximation postnewtonienne . . . . . . . . . . . . . . . . . . . . . . 90<br />

8.2 Quels termes faut-il retenir à l’approximation postnewtonienne ? . . . . . . . . . 92<br />

8.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />

9 Quelques effets classiques prévus par les théories métriques 95<br />

9.1 Temps <strong>de</strong> propagation d’un rayon lumineux entre <strong>de</strong>ux points . . . . . . . . . . 95<br />

9.2 Équations <strong>de</strong>s géodésiques d’une métrique à symétrie sphérique statique . . . . . 100<br />

9.3 Déviation <strong>de</strong> la lumière par une masse à symétrie sphérique . . . . . . . . . . . . 102<br />

9.4 Avance séculaire du périhélie d’une planète . . . . . . . . . . . . . . . . . . . . . 105<br />

9.5 Que faire pour aller plus loin ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

10 La relativité générale 112<br />

10.1 Les équations d’Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112<br />

10.2 La métrique <strong>de</strong> Schwarzschild extérieure . . . . . . . . . . . . . . . . . . . . . . 115<br />

10.3 Forme isotropique <strong>de</strong> la métrique <strong>de</strong> Schwarzschild . . . . . . . . . . . . . . . . . 117<br />

10.4 Géodésiques <strong>de</strong> la métrique <strong>de</strong> Schwarzschild . . . . . . . . . . . . . . . . . . . . 118<br />

10.5 Déviation <strong>de</strong>s rayons lumineux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121<br />

10.6 Avance séculaire du périhélie d’une planète . . . . . . . . . . . . . . . . . . . . . 123<br />

10.7 Horizon et trou noir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125<br />

2


A Espaces affines. Espaces euclidiens 128<br />

A.1 Espaces affines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128<br />

A.1.1 Définition d’un espace affine . . . . . . . . . . . . . . . . . . . . . . . . . 128<br />

A.1.2 Repère d’un espace affine . . . . . . . . . . . . . . . . . . . . . . . . . . . 129<br />

A.1.3 Changements <strong>de</strong> repères . . . . . . . . . . . . . . . . . . . . . . . . . . . 130<br />

A.2 Espace euclidien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131<br />

A.2.1 Définition d’un espace euclidien . . . . . . . . . . . . . . . . . . . . . . . 131<br />

A.2.2 Espace euclidien rapporté à un repère orthonormé . . . . . . . . . . . . . 132<br />

A.3 Espace proprement euclidiens . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133<br />

A.4 Espace-temps <strong>de</strong> Minkowski <strong>de</strong> dimension n . . . . . . . . . . . . . . . . . . . . 133<br />

B Analyse tensorielle 135<br />

B.1 Caractère non intrinsèque <strong>de</strong> la dérivation partielle usuelle . . . . . . . . . . . . 135<br />

B.2 Dérivation covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136<br />

B.3 Expression explicite <strong>de</strong> la dérivée covariante d’un champ <strong>de</strong> tenseurs arbitraire . 137<br />

B.4 Connexion linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138<br />

B.5 Conséquences fondamentales <strong>de</strong>s formules <strong>de</strong> transformation <strong>de</strong>s coefficients <strong>de</strong><br />

connexion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140<br />

B.6 Dérivée covariante totale le long d’une courbe . . . . . . . . . . . . . . . . . . . 142<br />

B.7 Transport par parallélisme le long d’une courbe . . . . . . . . . . . . . . . . . . 143<br />

B.8 Courbes autoparallèles d’une connexion . . . . . . . . . . . . . . . . . . . . . . . 144<br />

C Connexion et courbure sur une variété riemannienne 146<br />

C.1 Connexion riemannienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146<br />

C.2 Géodésiques d’une variété riemannienne . . . . . . . . . . . . . . . . . . . . . . 149<br />

C.3 Tenseur <strong>de</strong> courbure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153<br />

C.4 Propriétés du tenseur <strong>de</strong> courbure . . . . . . . . . . . . . . . . . . . . . . . . . . 156<br />

C.5 Tenseur <strong>de</strong> Ricci. Scalaire <strong>de</strong> courbure . . . . . . . . . . . . . . . . . . . . . . . 157<br />

C.6 Opérateurs différentiels sur une variété riemannienne . . . . . . . . . . . . . . . 157<br />

C.7 Quelques relations utiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160<br />

C.8 Applications à l’espace euclidien à 3 dimensions . . . . . . . . . . . . . . . . . . 161<br />

D Quantité <strong>de</strong> mouvement et énergie cinétique d’une particule isolée 163<br />

D.1 Détermination <strong>de</strong> la fonction M <br />

m, v2<br />

c2 <br />

. . . . . . . . . . . . . . . . . . . . . . 165<br />

<br />

D.2 Détermination <strong>de</strong> la fonction Ec m, v2<br />

c2 <br />

. . . . . . . . . . . . . . . . . . . . . . . 166<br />

Bibliographie sommaire 168<br />

3


Chapitre 1<br />

Notions préliminaires<br />

Nous présentons dans ce chapitre un certain nombre <strong>de</strong> notions ou d’hypothèses fondamentales<br />

que l’on croit souvent spécifiques <strong>de</strong>s théories relativistes, alors qu’elles sont en réalité<br />

parfaitement applicables aux conceptions galiléennes ou newtoniennes. Il en est ainsi <strong>de</strong> notions<br />

comme celle <strong>de</strong> variété <strong>de</strong>s événements ou <strong>de</strong> temps propre 1 , par exemple.<br />

1.1 Observateurs. Objets. Particules<br />

Observateurs.— Toute science <strong>de</strong> la nature suppose l’existence d’observateurs. De prime<br />

abord, la notion d’observateur est anthropomorphique : elle correspond bien entendu à l’existence<br />

d’êtres humains capables <strong>de</strong> percevoir le mon<strong>de</strong> et <strong>de</strong> communiquer entre eux. Mais pour<br />

les besoins <strong>de</strong> la physique, on doit élargir cette notion et lui donner une assise plus objective en<br />

considérant comme observateur tout système physique très localisé dans l’espace susceptible <strong>de</strong><br />

détecter, <strong>de</strong> mesurer, d’enregistrer tel ou tel type <strong>de</strong> phénomènes ou encore d’émettre ou recevoir<br />

<strong>de</strong>s signaux. Un appareil photo, un spectroscope, un détecteur <strong>de</strong> particules, une antenne radio,<br />

etc. peuvent être regardés comme <strong>de</strong>s observateurs.<br />

Objets.— Les objets sont les entités qui servent <strong>de</strong> sources communes aux mesures ou aux<br />

observations <strong>de</strong> plusieurs observateurs. La réunion <strong>de</strong> tous les objets constitue l’univers objectif.<br />

Particules.— Un grand nombre d’objets étudiés en physique peuvent être considérés comme<br />

composés d’objets plus simples. Tel est le cas d’un noyau atomique, d’une planète, d’une étoile,<br />

etc. Il existe cependant <strong>de</strong>s situations dans lesquelles, au moins pour une certaine classe d’observateurs,<br />

les objets d’étu<strong>de</strong> n’ont pas besoin d’être analysés (ou ne sont pas analysables) en<br />

termes <strong>de</strong> composants. On dit que <strong>de</strong> tels objets sont <strong>de</strong>s particules pour cette classe d’observateurs.<br />

On notera qu’un même objet peut être perçu soit comme une particule soit comme un<br />

ensemble <strong>de</strong> constituants selon la catégorie d’observateurs à laquelle on se réfère dans les<br />

modélisations. Un cosmologiste, par exemple, considère une galaxie comme une particule du<br />

gaz cosmique, alors qu’un astrophysicien voit cette galaxie comme un ensemble constitué <strong>de</strong><br />

1 Ce qui ne signifie pas que la définition du temps propre soit la même en relativité et en théorie newtonienne.<br />

4


milliards d’étoiles. Cette absence d’objectivité <strong>de</strong> la notion <strong>de</strong> particule nous rappelle que la notion<br />

d’échelle d’observation et <strong>de</strong> <strong>de</strong>scription est un présupposé indispensable <strong>de</strong> toute démarche<br />

scientifique et que toute théorie est un schématisation dont la validité est limitée 2 .<br />

1.2 Événements<br />

Événements.— Nos perceptions nous montrent que <strong>de</strong>s changements se produisent dans<br />

l’univers objectif. Lorsque ces changements sont soudains et affectent <strong>de</strong>s objets d’extension spatiale<br />

négligeable, on parle d’événements. Là encore, l’échelle d’observation joue un rôle crucial.<br />

Un cosmologiste peut considérer l’explosion d’une supernova comme un événement, alors qu’un<br />

astrophysicien cherchant à modéliser la vie <strong>de</strong>s étoiles massives voit dans un tel phénomène un<br />

ensemble prodigieusement complexe d’événements nucléaires...<br />

Les changements affectant <strong>de</strong>s particules perçus comme parfaitement soudains peuvent<br />

être regardés comme <strong>de</strong>s événements ponctuels ou points-événements. Cette notion <strong>de</strong> pointévénement<br />

(ou événement en abrégé) est <strong>de</strong>venue centrale en physique avec l’avènement <strong>de</strong>s<br />

théories relativistes, et nous y ferons constamment appel dans ce cours.<br />

Selon notre intuition la plus banale, tout événement x peut se voir attribué une coordonnée<br />

“temporelle” ou date t et une localisation au moyen <strong>de</strong> trois coordonnées “spatiales”. Il est<br />

donc naturel <strong>de</strong> représenter tout événement par un point d’un espace mathématique à quatre<br />

dimensions que l’on désignera par V4.<br />

La modélisation la plus simple consisterait à poser que cet espace V4 est le produit cartésien<br />

d’une copie <strong>de</strong> IR représentant un axe <strong>de</strong> temps absolu par une copie d’un espace euclidien réel à<br />

trois dimensions E3 considéré comme l’espace physique universel, indépendant <strong>de</strong>s observateurs :<br />

V4 = IR×E3. Cependant, cette conception s’est avérée incompatible avec l’expérience et l’observation,<br />

et il a fallu l’abandonner. Aujourd’hui, on formule la physique relativiste sur <strong>de</strong>s espaces<br />

V4 qui ressemblent <strong>de</strong> manière seulement locale à l’espace ponctuel IR 4 . On bénéficie ainsi d’une<br />

généralité suffisante dans la construction tout en sauvegardant toutes les possibilités <strong>de</strong> l’analyse<br />

mathématique usuelle (dérivation, intégration, résolution <strong>de</strong> systèmes d’équations différentielles,<br />

champs <strong>de</strong> vecteurs, etc.). De tels espaces V4 sont appelés <strong>de</strong>s variétés différentielles réelles <strong>de</strong><br />

dimension 4.<br />

1.3 Notion <strong>de</strong> variété. Variété <strong>de</strong>s événements<br />

Nous ne chercherons pas ici à définir rigoureusement la notion <strong>de</strong> variété différentielle. Nous<br />

nous contenterons d’énoncer les propriétés d’une variété qu’il est indispensable <strong>de</strong> connaître<br />

pour comprendre la suite.<br />

La première propriété fondamentale est qu’à chaque point x0 ∈ V4 on peut associer un<br />

voisinage U <strong>de</strong> x0 qu’on peut “cartographier” sur l’espace IR 4 . On entend par là qu’il existe<br />

une bijection ϕ <strong>de</strong> U sur IR 4 . Ainsi, on peut attribuer à tout x <strong>de</strong> U un quadruplet et un<br />

seul <strong>de</strong> nombres réels ϕ(x) = (x 0 ,x 1 ,x 2 ,x 3 ) et réciproquement, à tout quadruplet <strong>de</strong> nombres<br />

2 Soulignons que les particules considérées ici comme <strong>de</strong>s objets sans structure discernable par une classe<br />

d’observateurs sont traités comme <strong>de</strong>s objets macroscopiques, et non comme <strong>de</strong>s objets <strong>de</strong> la microphysique.<br />

5


éels (x 0 ,x 1 ,x 2 ,x 3 ) correspond un et un seul point x <strong>de</strong> U, <strong>de</strong> sorte qu’on peut poser x =<br />

ϕ −1 (x 0 ,x 1 ,x 2 ,x 3 ). Le doublet (U,ϕ) constitué par le voisinage U et la bijection ϕ s’appelle une<br />

carte locale ou encore un système <strong>de</strong> coordonnées locales. U est appelé le domaine <strong>de</strong> la carte<br />

locale et les quatre nombres réels (x 0 ,x 1 ,x 2 ,x 3 ) sont les coordonnées locales du point x ∈ U.<br />

Pour abréger, on désignera désormais le quadruplet (x 0 ,x 1 ,x 2 ,x 3 ) par (x α ) (ou (x β ), ..., (x µ ),<br />

...), les indices grecs α, β, ..., µ, ... pouvant prendre les valeurs 0, 1, 2, 3.<br />

Voyons maintenant la secon<strong>de</strong> propriété fondamentale. Supposons que le point x considéré<br />

ci-<strong>de</strong>ssus appartienne également au domaine U ′ d’une autre carte locale (U ′ ,ϕ ′ ). Dans cette<br />

autre carte locale, x admet <strong>de</strong>s coordonnées locale ϕ ′ (x) = (x0′ ,x1′ ,x2′ ,x3′ ) = (xρ′ ) . Puisqu’il<br />

y a correspondance biunivoque entre un point et ses coordonnées locales dans une cartographie<br />

donnée, les coordonnées xρ′ sont <strong>de</strong>s fonctions <strong>de</strong>s coordonnées x µ et réciproquement les<br />

coordonnées x µ sont <strong>de</strong>s fonctions <strong>de</strong>s coordonnées xρ′ . On peut donc écrire<br />

et<br />

x ρ′<br />

= F ρ′<br />

(x 0 ,x 1 ,x 2 ,x 3 ) = F ρ′<br />

(x α ) (1.1)<br />

x µ = F µ (x 0′<br />

,x 1′<br />

,x 2′<br />

,x 3′<br />

) = F µ (x β′<br />

). (1.2)<br />

Les fonctions F ρ′ et F µ définissent ce qu’on appelle <strong>de</strong>s formules <strong>de</strong> transformation <strong>de</strong>s<br />

coordonnées locales.<br />

L’espace V4 est muni d’une structure <strong>de</strong> variété différentielle lorsque les fonctions F ρ′ (xα ) et<br />

F µ (xβ′ ) admettent <strong>de</strong>s dérivées partielles continues <strong>de</strong> n’importe quel ordre3 quelles que soient<br />

les cartes locales dont les domaines U et U ′ ont une intersection non vi<strong>de</strong>.<br />

Il faut noter que le caractère inversible <strong>de</strong>s fonctions F ρ′ et F µ nécessite en outre que<br />

les déterminants <strong>de</strong>s matrices jacobiennes ∂F ρ′ /∂x µ et ∂F µ /∂xρ′ soient = 0 en tout point <strong>de</strong><br />

l’intersection U ∩ U ′ . On supposera donc qu’en chaque point x ∈ U ∩ U ′<br />

ce qui équivaut à supposer<br />

dét<br />

dét<br />

<br />

ρ ∂F ′ <br />

∂x µ<br />

<br />

µ ∂F<br />

∂x σ′<br />

x<br />

x<br />

= 0, (1.3)<br />

= 0. (1.4)<br />

Désormais, nous supprimerons systématiquement le recours aux fonctions F µ et F ρ′ et nous<br />

écrirons les formules <strong>de</strong> transformation (1.1) et (1.2) sous la forme<br />

et<br />

Nous poserons en outre<br />

x ρ′<br />

∂xρ′ ρ′ ∂F<br />

= ,<br />

∂x µ ∂x µ<br />

= x ρ′<br />

(x µ ) (1.5)<br />

x µ = x µ (x ρ′<br />

). (1.6)<br />

∂x µ<br />

∂x σ′ =<br />

∂F µ<br />

∂x σ′ , (1.7)<br />

3 On dit que ces fonctions sont indéfiniment différentiables ou encore <strong>de</strong> classe C ∞ ). C’est pourquoi les<br />

variétés différentielles introduites ici <strong>de</strong>vraient être dites <strong>de</strong> classe C ∞ , mais nous omettrons systématiquement<br />

cette précision pour abréger.<br />

6


<strong>de</strong> sorte que les conditions (1.3) et (1.4) s’écrivent respectivement<br />

et<br />

dét<br />

dét<br />

<br />

ρ ∂x ′ <br />

∂x µ<br />

<br />

µ ∂x<br />

∂x σ′<br />

x<br />

x<br />

= 0 (1.8)<br />

= 0. (1.9)<br />

Les transformations <strong>de</strong> coordonnées indéfiniment différentiables vérifiant les conditions (1.3)-<br />

(1.4) ou (1.8)-(1.9) sont dites admissibles.<br />

La variété <strong>de</strong> dimension 4 la plus simple est évi<strong>de</strong>mment l’espace IR 4 muni <strong>de</strong> la carte<br />

locale (U,ϕ) dont le domaine U est IR 4 lui-même et ϕ est l’i<strong>de</strong>ntité. On parle toujours <strong>de</strong> cette<br />

structure lorsqu’on mentionne la variété IR 4 sans autre précision.<br />

Lorsque nous parlerons d’une variété V4 pour représenter l’espace <strong>de</strong>s points-événements,<br />

nous appellerons V4 une variété <strong>de</strong>s événements ou encore une variété fondamentale. L’espacetemps<br />

d’une théorie sera constitué par une telle variété munie d’une structure mathématique<br />

spécifique <strong>de</strong> la théorie considérée. Par exemple, l’espace-temps <strong>de</strong> la relativité restreinte est<br />

la variété IR 4 munie <strong>de</strong> la métrique <strong>de</strong> Minkowski. L’espace-temps générique <strong>de</strong> la relativité<br />

générale sera une variété V4 munie d’une métrique g dynamiquement liée au contenu énergétique<br />

<strong>de</strong> l’univers par les équations d’Einstein.<br />

1.4 Fonctions scalaires. Hypersurfaces<br />

En physique, il est indispensable <strong>de</strong> pouvoir utiliser <strong>de</strong>s fonctions. La définition et la manipulation<br />

<strong>de</strong>s fonctions sur une variété différentielle ne sont pas plus compliquées que sur l’espace<br />

géométrique usuel. Il faut simplement se souvenir que l’on procè<strong>de</strong> maintenant sur <strong>de</strong>s domaines<br />

<strong>de</strong> cartes locales, au lieu <strong>de</strong> l’espace tout entier. Cette remarque vaut pour toutes les notions<br />

que nous allons être amenés à définir ci-<strong>de</strong>ssous.<br />

Fonction scalaire.— Une fonction scalaire à valeurs réelles sur une variété différentielle<br />

V4 est une application f : V4 → IR. Très souvent, on se contentera d’appeler f une fonction<br />

(sur V4).<br />

Nous avons vu dans la section précé<strong>de</strong>nte qu’étant donné un point x arbitraire dans V4, il<br />

existe au moins une carte locale (U,ϕ) telle que x ∈ U. Soient (x 0 ,x 1 ,x 2 ,x 3 ) les coordonnées<br />

locales <strong>de</strong> x dans cette carte. Du fait que x = ϕ −1 (x 0 ,x 1 ,x 2 ,x 3 ), nous pouvons poser<br />

f(x) = f(ϕ −1 (x 0 ,x 1 ,x 2 ,x 3 )) = ¯ f(x α ). (1.10)<br />

L’étu<strong>de</strong> <strong>de</strong>s propriétés locales <strong>de</strong> la fonction f se ramène donc à l’étu<strong>de</strong> <strong>de</strong>s propriétés <strong>de</strong> la<br />

fonction <strong>de</strong> quatre variables réelles ¯ f(x α ). La fonction ¯ f est l’expression <strong>de</strong> f en coordonnées<br />

locales (x α ) 4 .<br />

4 Dans le langage <strong>de</strong> la théorie <strong>de</strong>s applications, on a ¯ f = f ◦ ϕ −1 .<br />

7


Bien entendu, si x appartient également au domaine U ′ d’une autre carte locale (U ′ ,ϕ ′ ), on<br />

pourra écrire aussi<br />

les x β′<br />

f(x) = ˆ f(x β′<br />

), (1.11)<br />

étant les coordonnées locales <strong>de</strong> x dans la carte locale (U ′ ,ϕ ′ ), et on aura bien entendu<br />

¯f(x α ) = ˆ f(x β′<br />

).<br />

Fonction différentiable.— Une fonction scalaire f est dite différentiable au point x <strong>de</strong><br />

coordonnées locales xα si son expression ¯ f(xα ) admet en x <strong>de</strong>s dérivées partielles par rapport<br />

à chacune <strong>de</strong>s variables xα .<br />

La fonction f est dite différentiable sur la variété V4 si elle est différentiable en chaque point<br />

x <strong>de</strong> V4. La règle <strong>de</strong> dérivation <strong>de</strong>s fonctions composées montre immédiatement que le caractère<br />

différentiable <strong>de</strong> f en chaque point x ne dépend pas du choix <strong>de</strong> carte locale.<br />

Pour ne pas nous encombrer <strong>de</strong> lettres surlignées ou surmontées d’un chapeau, nous poserons<br />

désormais <br />

∂f<br />

∂xα <br />

=<br />

x<br />

¯ f,xα(xµ ) (1.12)<br />

où ¯ f,x α est la dérivée partielle <strong>de</strong> ¯ f par rapport à x α . Bien entendu, on écrira aussi bien<br />

∂f<br />

∂x β′<br />

<br />

x<br />

= ˆ f ,xβ ′(xν′ ) (1.13)<br />

Le théorème <strong>de</strong> dérivation <strong>de</strong>s fonctions composées fournit immédiatement les relations<br />

∂f<br />

∂x β′<br />

qui peuvent bien entendu s’inverser :<br />

∂f<br />

∂x α<br />

<br />

<br />

x<br />

x<br />

=<br />

=<br />

3<br />

<br />

α ∂x<br />

α=0<br />

∂x β′<br />

3<br />

<br />

β ∂x ′ <br />

β ′ =0<br />

∂x α<br />

x<br />

x<br />

∂f<br />

∂x α<br />

∂f<br />

∂x β′<br />

<br />

<br />

x<br />

(1.14)<br />

. (1.15)<br />

x<br />

Hypersurface <strong>de</strong> V4.— Dans l’espace tridimensionnel usuel, on définit une surface par une<br />

équation du type<br />

f(x,y,z) = K,<br />

où K est une constante réelle. La généralisation <strong>de</strong> cette notion s’effectue sans difficulté.<br />

On appellera hypersurface <strong>de</strong> V4 l’ensemble <strong>de</strong>s points x tels que f(x) = K, f étant une<br />

fonction scalaire sur V4 et K une constante. En coordonnées locales x α , l’équation implicite <strong>de</strong><br />

l’hypersurface s’écrit<br />

¯f(x α ) = K. (1.16)<br />

L’hypersurface sera dite différentiable si f est différentiable.<br />

Le préfixe hyper traduit simplement le fait que l’ensemble <strong>de</strong>s points <strong>de</strong> V4 vérifiant la<br />

relation (1.16) est un espace <strong>de</strong> points tridimensionnel, au lieu d’être un espace bidimensionnel<br />

comme l’est une surface <strong>de</strong> l’espace usuel.<br />

8


1.5 Courbe différentiable sur une variété<br />

On appelle courbe paramétrée sur la variété V4 une application C : λ → C(λ) <strong>de</strong> IR dans V4.<br />

En coordonnées locales x µ , un point C(λ) est représenté par quatre nombres (C µ (λ)). On dit<br />

que les quatre équations<br />

x µ = C µ (λ) (1.17)<br />

constituent les équations paramétriques locales <strong>de</strong> la courbe C.<br />

La courbe C est dite différentiable si les fonctions C µ (λ) sont <strong>de</strong>s fonctions différentiables<br />

<strong>de</strong> λ.<br />

1.6 Coïnci<strong>de</strong>nce d’événements. Ordre temporel<br />

Après cet intermè<strong>de</strong> mathématique, revenons à la physique.<br />

Coïnci<strong>de</strong>nce d’événements.— Nous considérons comme primitive la notion <strong>de</strong> coïnci<strong>de</strong>nce<br />

<strong>de</strong> <strong>de</strong>ux événements : <strong>de</strong>ux événements a et b seront dits coïnci<strong>de</strong>r s’ils surviennent à la<br />

même place et au même moment. La notion <strong>de</strong> simultanéité impliquée dans cette définition est<br />

objective parce que a et b surviennent au même endroit. En revanche, il est impossible d’affirmer<br />

que <strong>de</strong>ux événements a et b se produisant en <strong>de</strong>ux lieux différents sont simultanés sans<br />

convention préalable.<br />

Ordre temporel.— Les notions <strong>de</strong> particules et <strong>de</strong> coïnci<strong>de</strong>nce d’événements permettent<br />

<strong>de</strong> définir indépendamment d’une convention ce que l’on doit entendre par l’affirmation “a<br />

précè<strong>de</strong> b 5 . Pour cela, adoptons comme axiome que les seuls événements susceptibles d’affecter<br />

une particule sont soit l’apparition <strong>de</strong> cette particule, soit sa disparition 6 . Cet axiome s’accor<strong>de</strong><br />

bien avec la notion <strong>de</strong> particule considérée comme une entité sans structure par une certaine<br />

classe d’observateurs.<br />

Nous pouvons maintenant définir la relation “a précè<strong>de</strong> b” comme signifiant qu’il existe une<br />

séquence <strong>de</strong> particules P1, P2, ..., Pn telle que a coïnci<strong>de</strong> avec l’apparition <strong>de</strong> P1, la disparition<br />

<strong>de</strong> P1 coïnci<strong>de</strong> avec l’apparition <strong>de</strong> P2, ..., la disparition <strong>de</strong> Pn coïnci<strong>de</strong> avec b. Autrement dit, a<br />

précè<strong>de</strong> b si et seulement si b est la disparition d’une chaîne ininterrompue <strong>de</strong> particules apparaissant<br />

en a (fig. 1.1). Cette définition implique évi<strong>de</strong>mment que l’apparition d’une particule<br />

précè<strong>de</strong> toujours sa disparition. Elle entraîne également <strong>de</strong> manière immédiate que la relation<br />

a précè<strong>de</strong> b est transitive : si a précè<strong>de</strong> b et b précè<strong>de</strong> c, alors a précè<strong>de</strong> c. La relation a précè<strong>de</strong><br />

b est donc une relation d’ordre, que nous noterons :<br />

a b ⇐⇒ a précè<strong>de</strong> b. (1.18)<br />

On peut bien entendu définir la relation “a précè<strong>de</strong> b au sens strict”, soit a ≺ b, par<br />

a ≺ b ⇐⇒ a b et a = b. (1.19)<br />

5 Voir par ex. S. A. Basri, A Deductive Theory of Space and Time (North-Holland, Amsterdam, 1966).<br />

6 Nous préférons les termes d’apparition et disparition plutôt que création et annihilation pour rester cohérents<br />

avec la vision essentiellement macroscopique adoptée ici.<br />

9


a<br />

P<br />

2<br />

P 1<br />

P<br />

3<br />

Fig. 1.1 – L’événement a précè<strong>de</strong> l’événement b.<br />

En nous inspirant d’une terminologie couramment employée en relativité, nous dirons qu’il<br />

existe une séparation du genre temps (ou encore temporelle) entre <strong>de</strong>ux points-événements a et b<br />

si a précè<strong>de</strong> b ou si b précè<strong>de</strong> a. Plus généralement, nous dirons qu’une courbe <strong>de</strong> l’espace-temps<br />

est du genre temps si quels que soient les points x et y <strong>de</strong> cette courbe infiniment voisins, x et<br />

y ont une séparation du genre temps.<br />

1.7 Horloges standard. Temps propre. Ligne d’univers<br />

d’une particule<br />

Horloges standard.— Du point <strong>de</strong> vue intuitif, une horloge est un système physique<br />

susceptible <strong>de</strong> délivrer localement un signal regardé comme rigoureusement périodique et <strong>de</strong><br />

compter les pério<strong>de</strong>s. Une horloge permet donc non seulement <strong>de</strong> déterminer <strong>de</strong>s intervalles<br />

<strong>de</strong> temps, mais aussi d’assigner <strong>de</strong>s dates à <strong>de</strong>s événements survenant à l’horloge elle-même, à<br />

condition bien entendu <strong>de</strong> prendre un événement <strong>de</strong> l’histoire <strong>de</strong> l’horloge comme origine du<br />

comptage <strong>de</strong>s pério<strong>de</strong>s.<br />

Pour être plus précis et faire le lien avec ce qui a été exposé plus haut, nous posons qu’une<br />

horloge H est un système physique très localisé qui génère et compte une séquence d’événements<br />

a1, a2, ..., an, ... ordonnés par la relation d’ordre ≺ : a1 ≺ a2 ≺ ... ≺ an ≺ .... Les horloges<br />

considérées ici sont <strong>de</strong>s idéalisations d’horloges réelles, dont l’exactitu<strong>de</strong> et la stabilité seraient<br />

tenues pour parfaites. De plus, nous supposons qu’elles sont toutes rigoureusement <strong>de</strong> même<br />

construction, et fondées sur le même type d’atomes s’il s’agit d’horloges atomiques, par exemple.<br />

Nous dirons que ces horloges sont <strong>de</strong>s horloges standards, dont l’ensemble sera noté Hs.<br />

Les intervalles <strong>de</strong> temps séparant <strong>de</strong>ux événements consécutifs ai, ai+1 sont alors regardés<br />

comme égaux par définition. On appelle pério<strong>de</strong> propre <strong>de</strong> l’horloge H la durée <strong>de</strong> ces intervalles<br />

<strong>de</strong> temps égaux. On définit une unité <strong>de</strong> temps propre comme la durée d’un nombre entier N<br />

10<br />

b<br />

P<br />

4<br />

P<br />

5


fixé <strong>de</strong> pério<strong>de</strong>s consécutives. L’entier N est appelé la fréquence propre <strong>de</strong> l’horloge. Mesurée<br />

avec l’unité <strong>de</strong> temps choisie, la valeur commune <strong>de</strong> toutes les pério<strong>de</strong>s est le nombre T donné<br />

par<br />

T = 1<br />

. (1.20)<br />

N<br />

Temps propre.— On admet comme un axiome qu’à toute particule P on peut associer une<br />

horloge standard HP ∈ H coïncidant avec P à tout instant : on dit que P et HP sont comouvantes.<br />

Nous dirons que le temps τ généré par HP <strong>de</strong>puis un événement origine a0 constitue<br />

par définition le temps propre <strong>de</strong> la particule P écoulé <strong>de</strong>puis l’événement a0 appartenant à<br />

l’histoire <strong>de</strong> la particule (fig. 3). En principe, il faudrait préciser que le temps propre ainsi<br />

défini est relatif à la classe d’horloges standards Hs, mais on admettra ici que toutes les classes<br />

d’horloges standards réalisent le même temps propre, à un changement d’unité près bien entendu.<br />

Il faut toutefois noter que cette unicité <strong>de</strong> la réalisation du temps propre ne va pas <strong>de</strong><br />

soi et fait actuellement l’objet <strong>de</strong> nombreuses recherches tant théoriques qu’expérimentales.<br />

Lignes d’univers.— Les notions <strong>de</strong> variété <strong>de</strong>s événements et <strong>de</strong> temps propre introduites<br />

ci-<strong>de</strong>ssus permettent <strong>de</strong> définir ce qu’on appelle la ligne d’univers d’une particule.<br />

Définition 1.7.1 Soit P une particule. On appelle ligne d’univers <strong>de</strong> cette particule la courbe<br />

CP <strong>de</strong> la variété fondamentale V4 qui au temps propre τ <strong>de</strong> la particule fait correspondre le<br />

point-événement occupé par la particule à l’instant τ.<br />

La ligne d’univers d’une particule est donc une courbe paramétrée par le temps propre <strong>de</strong><br />

la particule 7 . Il résulte <strong>de</strong> ce qui a été dit plus haut que la ligne d’univers d’une particule<br />

quelconque est toujours une courbe du genre temps. On appelle aussi cette ligne l’histoire <strong>de</strong><br />

la particule.<br />

Il est évi<strong>de</strong>nt que quels que soient les points-événements a et b sur CP on a soit (i) a coïnci<strong>de</strong><br />

avec b, soit (ii) a précè<strong>de</strong> b, soit (iii) b précè<strong>de</strong> a. Il est dès lors clair que la relation a précè<strong>de</strong> b<br />

est une relation d’ordre sur la ligne d’univers <strong>de</strong> chaque particule.<br />

Bien entendu, la notion <strong>de</strong> ligne d’univers s’étend sans difficulté aux observateurs, dans<br />

la mesure où on peut les assimiler à <strong>de</strong>s objets d’extension spatiale négligeable, donc à <strong>de</strong>s<br />

particules.<br />

7 En fait, on prend souvent comme paramètre le temps propre multiplié par une constante bien choisie.<br />

En relativité, par exemple, on prend généralement comme paramètre la quantité s = cτ, où c est la vitesse<br />

invariante.<br />

11


Chapitre 2<br />

Champs <strong>de</strong> vecteurs. Champs <strong>de</strong><br />

tenseurs<br />

La <strong>de</strong>scription <strong>de</strong>s interactions physiques nécessite l’emploi <strong>de</strong> champs <strong>de</strong> vecteurs et <strong>de</strong><br />

champs <strong>de</strong> tenseurs sur la variété <strong>de</strong>s événements. Le but <strong>de</strong> ce chapitre est <strong>de</strong> dégager les<br />

définitions et les règles <strong>de</strong> calcul algébrique <strong>de</strong> ces champs. Ici encore, nous nous contenterons<br />

<strong>de</strong> développer une approche intuitive.<br />

2.1 Champs <strong>de</strong> vecteurs<br />

Considérons <strong>de</strong>ux points-événements infiniment voisins situés dans un même domaine <strong>de</strong><br />

carte locale U. Pour faire court, nous désignerons ces points respectivement par x et x + dx.<br />

Ces points ont pour coordonnées locales respectives x µ et x µ +dx µ . Admettons comme point <strong>de</strong><br />

départ intuitif que les accroissements infiniment petits dx µ peuvent être considérés comme les<br />

composantes d’un vecteur infinitésimal. Effectuons une transformation <strong>de</strong> coordonnées locales<br />

admissibles telle que (1.5). En différenciant, on obtient les relations<br />

dx ρ′<br />

3<br />

<br />

ρ ∂x<br />

=<br />

µ=0<br />

′<br />

∂x µ<br />

<br />

dx<br />

x<br />

µ , (2.1)<br />

qui peuvent être lues comme une loi <strong>de</strong> transformation <strong>de</strong>s composantes d’un vecteur.<br />

Dans ce qui suit, toutes les opérations sont effectuées en un point x donné. C’est pourquoi<br />

nous omettrons désormais l’indice x dans les formules <strong>de</strong> transformation. En outre, nous<br />

utiliserons systématiquement la convention suivante pour alléger l’écriture :<br />

Convention d’Einstein.— Toute expression dans laquelle figure un même indice une fois<br />

en position haute et une fois en position basse doit être comprise comme une somme effectuée<br />

sur l’indice répété. Ainsi :<br />

AµB µ 3<br />

= AµB<br />

µ=0<br />

µ , AµνB µν 3 3<br />

= AµνB<br />

µ=0 ν=0<br />

µν , etc. (2.2)<br />

12


Nous écrirons donc les relations (2.1) sous la forme<br />

dx ρ′<br />

= ∂xρ′<br />

∂x µ dxµ . (2.3)<br />

La transformation inverse <strong>de</strong> (2.3) est obtenue en échangeant les rôles <strong>de</strong>s x µ et <strong>de</strong>s xρ′ encore en différenciant (1.6) :<br />

ou<br />

dx µ = ∂xµ<br />

. (2.4)<br />

∂xσ′ dx σ′<br />

En substituant (2.3) dans (2.4) après avoir changé l’indice ρ ′ en σ ′ , il vient<br />

ce qui entraîne les relations<br />

dx µ = ∂xµ<br />

∂x σ′<br />

∂x µ<br />

∂xσ′ où δ µ ν est le système <strong>de</strong> quantités défini par<br />

∂xσ′ dxν<br />

∂xν ∂x σ′<br />

∂x ν = δµ ν , (2.5)<br />

δ µ ν = 1 si µ = ν, δ µ ν = 0 si µ = ν. (2.6)<br />

Lorsqu’on échange les rôles <strong>de</strong>s coordonnées x µ et xρ′ , il vient :<br />

∂x ρ′<br />

∂x ν<br />

∂x ν<br />

∂x σ′ = δ σ′<br />

ρ ′ , (2.7)<br />

où δσ′ ρ ′ est défini par la même convention que δµ ν.<br />

Les relations (2.5) et (2.7) sont fondamentales en analyse tensorielle, comme on aura l’occasion<br />

<strong>de</strong> le voir dans la suite. On notera qu’elles expriment simplement que les matrices<br />

jacobiennes (∂x µ /∂xσ′ ) et (∂xρ′ /∂xν ) sont inverses l’une <strong>de</strong> l’autre.<br />

Ce qui précè<strong>de</strong> nous conduit à proposer la définition suivante.<br />

Définition 2.1.1 On appelle champ <strong>de</strong> vecteurs sur un domaine <strong>de</strong> V4 tout objet représenté<br />

en coordonnées locales x α par un système <strong>de</strong> fonctions V µ (x) qui se transforment selon la loi<br />

V ρ′<br />

(x) = ∂xρ′<br />

∂x µ V µ (x) (2.8)<br />

lorsqu’on effectue le changement <strong>de</strong> coordonnées locales admissibles défini par (1.5).<br />

En échangeant le rôle <strong>de</strong> coordonnées x µ et xρ′ , on obtient la loi <strong>de</strong> transformation :<br />

V µ (x) = ∂xµ<br />

∂x ρ′ V ρ′<br />

(x). (2.9)<br />

Les fonctions V µ (x) sont par définition les composantes du champ <strong>de</strong> vecteurs V dans le<br />

système <strong>de</strong> coordonnées locales x α .<br />

13


Vecteur tangent à une courbe.— Revenons à la courbe C définie par les équations<br />

paramétriques (1.17) dans le domaine U d’ un système <strong>de</strong> coordonnées locales x µ , les fonctions<br />

C µ (λ) étant supposées différentiables. Considérons un point x0 <strong>de</strong> la courbe C correspondant à<br />

une valeur λ0 du paramètre et examinons comment se transforment les quatre quantités<br />

v µ x0 =<br />

<br />

µ dC (λ)<br />

dλ<br />

λ0<br />

(2.10)<br />

lors d’un changement <strong>de</strong> coordonnées locales défini par (1.5). Les équations paramétriques <strong>de</strong><br />

la courbe C sont dans le nouveau système <strong>de</strong> coordonnées<br />

où les fonctions Cρ′ (λ) sont définies par<br />

x ρ′<br />

= C ρ′<br />

(λ),<br />

C ρ′<br />

(λ) = x ρ′<br />

(C α (λ)).<br />

D’après le théorème <strong>de</strong> dérivation <strong>de</strong>s fonctions composées, les quantités<br />

sont données par<br />

v ρ′<br />

x0 =<br />

v ρ′<br />

x0 =<br />

dC ρ ′<br />

(λ)<br />

dλ<br />

<br />

ρ ∂x ′ <br />

∂x µ<br />

x0<br />

<br />

λ0<br />

v µ x0 . (2.11)<br />

La comparaison <strong>de</strong> cette loi <strong>de</strong> transformation avec la formule (2.8) montre que les quantités<br />

v α x0 définies par (2.10) sont les composantes d’un vecteur en x0. Ce vecteur est appelé le vecteur<br />

tangent en x0 à la courbe paramétrée C.<br />

2.2 Champs <strong>de</strong> vecteurs covariants<br />

Il existe cependant un autre type d’objets que l’on considère aussi comme “vectoriels” bien<br />

qu’ils obéissent à une loi <strong>de</strong> transformation différente <strong>de</strong> (2.8). Pour le voir, donnons-nous une<br />

fonction Φ définie sur V4. Les composantes du gradient <strong>de</strong> Φ sont définies en coordonnées locales<br />

x µ par<br />

(gradΦ) µ = ∂Φ<br />

. (2.12)<br />

∂x µ<br />

Examinons comment se transforment ces composantes lorsqu’on effectue le changement<br />

<strong>de</strong> coordonnées locales défini par (1.5). En utilisant le théorème <strong>de</strong> dérivation <strong>de</strong>s fonctions<br />

composées, il vient :<br />

∂Φ<br />

∂xρ′ = ∂<br />

∂xρ′ Φ(x µ (x σ′<br />

)) = ∂xµ<br />

∂xρ′ ∂Φ<br />

∂x µ<br />

d’où on déduit la loi <strong>de</strong> transformation<br />

(gradΦ) ρ ′ = ∂xµ<br />

∂x ρ′ (gradΦ) µ . (2.13)<br />

14


En échangeant les rôles <strong>de</strong>s coordonnées x µ et xρ′ , on obtient :<br />

(gradΦ) µ = ∂xρ′<br />

∂x µ (gradΦ) ρ ′ . (2.14)<br />

Ces lois <strong>de</strong> transformation sont différentes <strong>de</strong>s lois (2.3 et (2.4). Nous sommes ainsi conduits<br />

à définir un nouveau type <strong>de</strong> champs vectoriels.<br />

Définition 2.2.1 On appelle champ <strong>de</strong> vecteurs covariants sur un domaine <strong>de</strong> V4 un objet φ<br />

représenté en coordonnées locales xα par un système <strong>de</strong> fonctions φµ(x) qui se transforment<br />

selon la loi<br />

∂xµ<br />

φρ ′(x) =<br />

∂xρ′ φµ(x) (2.15)<br />

lorsqu’on effectue le changement <strong>de</strong> coordonnées locales admissibles défini par (1.6).<br />

En échangeant le rôle <strong>de</strong> coordonnées x µ et xρ′ , on obtient évi<strong>de</strong>mment :<br />

φµ(x) = ∂xρ′<br />

φρ ′(x). (2.16)<br />

∂x µ<br />

Les fonctions φµ sont les composantes du champ <strong>de</strong> vecteurs covariants 1 φ dans le système<br />

<strong>de</strong> coordonnées locales x α .<br />

2.3 Définition générale <strong>de</strong>s champs <strong>de</strong> tenseurs<br />

Donnons-nous <strong>de</strong>ux champs <strong>de</strong> vecteurs X µ et Y ν et examinons comment se transforment<br />

les 4 2 = 16 produits U λµ = X λ Y µ lorsqu’on effectue un changement <strong>de</strong> coordonnées locales. Il<br />

vient d’après (2.8) :<br />

X ρ′<br />

Y σ′<br />

= ∂xρ′ ∂xσ′<br />

Xλ<br />

∂xλ ∂x µ Y µ = ∂xρ′<br />

∂xλ ∂xσ′ ∂x µ XλY µ . (2.17)<br />

Remplaçons XλY µ par Uλµ dans le troisième membre <strong>de</strong> (2.17) et posons Uρ′ σ ′<br />

On voit que les quantités Uλµ se transforment selon la loi<br />

U ρ′ σ ′<br />

= Xρ′ Y σ′ .<br />

= ∂xρ′<br />

∂xλ ∂xσ′ ∂x µ Uλµ . (2.18)<br />

Donnons-nous en outre un champ <strong>de</strong> vecteurs covariants φν. En utilisant (2.15) et (2.17),<br />

on voit immédiatement que les 4 3 = 64 quantités W λµ ν = X λ Y µ φν se transforment selon la loi<br />

W ρ′ σ ′ ∂xρ′<br />

τ ′ =<br />

∂xλ ∂xσ′ ∂x µ<br />

∂x ν<br />

∂x τ ′ W λµ ν. (2.19)<br />

Nous sommes ainsi conduits à considérer une classe d’objets mathématiques bien plus<br />

générale que la classe <strong>de</strong>s champs <strong>de</strong> vecteurs contravariants ou covariants. Ces objets nouveaux<br />

sont les champs <strong>de</strong> tenseurs, que l’on peut définir comme suit.<br />

1 Un vecteur covariant est aussi appelé un covecteur.<br />

15


Définition 2.3.1 On appelle champ <strong>de</strong> tenseurs k fois covariants et l fois contravariants sur<br />

un domaine <strong>de</strong> V4 tout objet T représenté en coordonnées locales xα par un système <strong>de</strong> 4k+l ν1...νl<br />

fonctions T (x) qui se transforment selon la loi<br />

µ1...µk<br />

T<br />

ρ ′ 1 ...ρ′ k<br />

σ ′ 1 ...σ′ l<br />

(x) = ∂xµ1<br />

∂x ρ′ 1<br />

· · · ∂xµk<br />

∂x ρ′ k<br />

∂xσ′ 1<br />

∂xν1 · · · ∂xσ′ l<br />

∂xνl ν1...νl Tµ1...µk<br />

(x) (2.20)<br />

lorsqu’on effectue le changement <strong>de</strong> coordonnées locales admissibles défini par (1.5) et (1.6).<br />

On dit encore que le champ <strong>de</strong> tenseurs T considéré est <strong>de</strong> type (k,l). La somme k + l est<br />

appelée l’ordre du tenseur T.<br />

ν1...νl<br />

Les quantités Tµ1...µk<br />

(x) sont appelées les composantes en x du champ <strong>de</strong> tenseurs T<br />

dans les coordonnées locales xα .<br />

On obtient en échangeant les rôles <strong>de</strong>s coordonnées x µ et xρ′ :<br />

ν1...νl<br />

µ1...µk (x) = ∂xρ′ 1<br />

∂x µ1 · · · ∂xρ′ k<br />

∂x µk<br />

∂xν1 ∂xσ′ · · ·<br />

1<br />

∂xνl<br />

∂xσ′ l<br />

T<br />

T<br />

ρ ′ 1 ...ρ′ k<br />

σ ′ 1 ...σ′ l<br />

(x). (2.21)<br />

Selon la définition 2.3.1, un champ <strong>de</strong> tenseurs 0 fois covariants et une fois contravariants<br />

peut être considéré comme un champ <strong>de</strong> vecteurs. C’est pourquoi, par abus <strong>de</strong> langage, on<br />

appelle souvent champs <strong>de</strong> vecteurs contravariants les champs <strong>de</strong> vecteurs introduits dans<br />

la définition 1. Cette terminologie a l’avantage <strong>de</strong> bien distinguer les champs <strong>de</strong> vecteurs<br />

proprement dits <strong>de</strong>s champs <strong>de</strong> vecteurs covariants et, pour cette raison, nous l’utiliserons<br />

fréquemment.<br />

Il résulte également <strong>de</strong> la définition 2.3.1 qu’un champ <strong>de</strong> tenseurs une fois covariants et 0<br />

fois contravariants peut être considéré comme un champ <strong>de</strong> vecteurs covariants.<br />

Enfin, pour la généralité <strong>de</strong>s théorèmes, les fonctions scalaires seront regardées comme <strong>de</strong>s<br />

champs <strong>de</strong> tenseurs <strong>de</strong> type (0, 0).<br />

Par souci <strong>de</strong> concision, nous appellerons souvent les champs <strong>de</strong> vecteurs ou <strong>de</strong> tenseurs<br />

simplement “vecteurs” ou “tenseurs”.<br />

2.4 Exemples <strong>de</strong> champs <strong>de</strong> tenseurs<br />

Les quantités U λµ et W λµ ν définies dans la section précé<strong>de</strong>nte sont <strong>de</strong>s exemples <strong>de</strong> champs<br />

<strong>de</strong> tenseurs engendrés par <strong>de</strong>s produits <strong>de</strong> composantes <strong>de</strong> vecteurs contravariants ou covariants.<br />

Il existe toutefois une infinité d’autres champs <strong>de</strong> tenseurs qui ne résultent pas <strong>de</strong> multiplications<br />

<strong>de</strong> composantes <strong>de</strong> champs <strong>de</strong> vecteurs ou <strong>de</strong> covecteurs. Nous donnons ci-<strong>de</strong>ssous <strong>de</strong>ux exemples<br />

qui nous seront particulièrement utiles.<br />

Tenseur <strong>de</strong> Kronecker.— Considérons le système <strong>de</strong> fonctions K β α(x) définies par<br />

K β α(x) = δ β α. (2.22)<br />

On vérifiera facilement que le système <strong>de</strong>s K β α(x) est un champ <strong>de</strong> tenseurs, qu’on appelle<br />

le champ <strong>de</strong> tenseurs <strong>de</strong> Kronecker d’ordre 2. Par abus <strong>de</strong> langage, on désigne le champ <strong>de</strong><br />

tenseurs K β α(x) par δ β α.<br />

16


Tenseur métrique sur V4.— On définit une métrique sur V4 par la donnée en chaque<br />

point x d’une forme quadratique <strong>de</strong> différentielles<br />

ds 2 = gµν(x α )dx µ dx ν<br />

(2.23)<br />

dont la valeur est invariante par les transformations <strong>de</strong> coordonnées admissibles. On suppose<br />

que les quantités gµν sont symétriques par rapport aux indices µ et ν et que la matrice carrée<br />

(gµν) est inversible :<br />

(2.24)<br />

et<br />

gµν = gνµ<br />

dét(gµν) = 0. (2.25)<br />

En substituant (2.4) dans (2.23), on obtient en chaque point x :<br />

ds 2 = gµν(x α )dx µ dx ν = gµν(x α ) ∂xµ<br />

∂x ρ′<br />

∂x ν<br />

∂x σ′ dx ρ′<br />

dx σ′<br />

. (2.26)<br />

Cette équation montre que l’expression <strong>de</strong> ds2 dans les coordonnées locales xρ′ par la forme quadratique<br />

est donnée<br />

ds 2 = gρ ′ σ ′(x)dxρ′ dx σ′<br />

, (2.27)<br />

où les quantités gρ ′ σ ′ sont reliées aux gµν par la loi <strong>de</strong> transformation<br />

gρ ′ ∂xµ<br />

σ ′ =<br />

∂xρ′ ∂x ν<br />

∂x σ′ gµν . (2.28)<br />

En comparant (2.28) avec (2.20), on voit que les quantités gµν se transforment comme<br />

les composantes d’un tenseur g <strong>de</strong>ux fois covariant. On notera que les quantités gρ ′ σ ′ sont<br />

symétriques en ρ ′ et σ ′2 .<br />

Une variété V4 munie d’une métrique g est appelée une variété riemannienne. On désigne<br />

une telle variété par le doublet (V4,g). Lorsque la forme quadratique (2.23) est définie positive,<br />

la variété (V4,g) est dite proprement riemannienne 3 .<br />

Produit scalaire.— On voit aisément à partir <strong>de</strong> la loi <strong>de</strong> transformation (2.28) qu’à tout<br />

couple <strong>de</strong> vecteurs X et Y on peut faire correspondre une quantité réelle g(X,Y ) invariante<br />

par les changements <strong>de</strong> coordonnées en posant :<br />

g(X,Y ) = gµνX µ Y ν . (2.29)<br />

L’application définie par (2.29) est bilinéaire, puisqu’elle est linéaire par rapport à chacun<br />

<strong>de</strong> ses arguments. Il résulte en effet <strong>de</strong> la définition même <strong>de</strong> g(X,Y ) que<br />

g(X + Z,Y ) = g(X,Y ) + g(Z,Y ), g(X,Y + Z) = g(X,Y ) + g(X,Z)<br />

2 On dit que le tenseur g est symétrique (voir Sect. 8).<br />

3 Lorsque la forme quadratique (2.23) n’est pas définie positive, on dit parfois que (V4,g) est pseudoriemannienne.<br />

Nous verrons que les métriques utilisées en relativité appartiennent à cette catégorie.<br />

17


pour tout vecteur Z et que<br />

g(λX,Y ) = g(X,λY ) = λg(X,Y ).<br />

quelque soit le nombre réel λ.<br />

En outre, l’application g est symétrique, puisqu’on a<br />

g(X,Y ) = g(Y,X)<br />

en raison <strong>de</strong> la symétrie <strong>de</strong>s gµν par rapport aux indices µ et ν. Enfin, l’application g est dite<br />

non dégénérée car la matrice <strong>de</strong>s gµν est inversible par hypothèse.<br />

L’ensemble <strong>de</strong> ces quatre propriétés caractérise un produit scalaire 4 en chaque point x ∈ V4.<br />

Il en résulte que la donnée d’une métrique induit la donnée d’un produit scalaire en chaque<br />

point <strong>de</strong> V4. Réciproquement, la donnée d’un produit scalaire en chaque point <strong>de</strong> V4 définit une<br />

métrique sur V4.<br />

2.5 Addition et multiplication <strong>de</strong>s tenseurs<br />

On peut définir l’addition <strong>de</strong> <strong>de</strong>ux tenseurs du même type et la multiplication tensorielle<br />

<strong>de</strong> <strong>de</strong>ux tenseurs <strong>de</strong> types quelconques.<br />

Addition tensorielle.— Donnons-nous par exemple <strong>de</strong>ux tenseurs <strong>de</strong>ux fois covariants Sµν<br />

et Tµν. On vérifie facilement que la somme <strong>de</strong>s composantes Sµν +Tµν se transforme comme un<br />

tenseur <strong>de</strong>ux fois covariant. En appliquant (2.20), il vient en effet<br />

Sρ ′ σ ′ + Tρ ′ ∂xµ<br />

σ ′ =<br />

∂xρ′ relation dont on déduit immédiatement<br />

∂x ν<br />

∂x σ′ Sµν + ∂xµ<br />

∂x ρ′<br />

∂x ν<br />

∂x σ′ Tµν,<br />

Sρ ′ σ ′ + Tρ ′ ∂xµ<br />

σ ′ =<br />

∂xρ′ ∂xν ∂xσ′ (Sµν + Tµν).<br />

Plus généralement, on peut formuler le théorème suivant.<br />

ν1...νl<br />

ν1...νl<br />

Théorème 2.5.1 Soient Sµ1...µk<br />

et Tµ1...µk <strong>de</strong>ux tenseurs <strong>de</strong> type (k,l). Les quantités<br />

ν1...νl U définies par<br />

µ1...µk<br />

U<br />

ν1...νl<br />

µ1...µk<br />

= S<br />

ν1...νl<br />

µ1...µk<br />

sont les composantes d’un tenseur <strong>de</strong> type (k,l).<br />

Le tenseur U <strong>de</strong> composantes U<br />

ν1...νl<br />

µ1...µk<br />

+ T<br />

ν1...νl<br />

µ1...µk<br />

est appelé la somme <strong>de</strong>s tenseurs S et T.<br />

Multiplication tensorielle.— Donnons-nous maintenant un tenseur <strong>de</strong>ux fois covariant<br />

Sαβ et un vecteur contravariant V µ qui peut être considéré, on l’a vu, comme un tenseur 0 fois<br />

covariant et une fois contravariant. Il est facile <strong>de</strong> voir que les produits <strong>de</strong>s composantes SαβV µ<br />

4 Soulignons que le produit scalaire associé à une métrique g arbitraire n’est pas nécessairement défini positif.<br />

18


constituent les composantes d’un tenseur mixte <strong>de</strong> type (2, 1). On peut en effet écrire d’après<br />

(2.20)<br />

Sγ ′ <br />

α ∂x ρ′<br />

δ ′V =<br />

∂xγ′ ∂xβ ∂xδ′ <br />

ρ ∂x<br />

Sαβ<br />

′ <br />

µ<br />

V =<br />

∂x µ ∂xα<br />

∂xγ′ ∂xβ ∂xδ′ ∂xρ′ ∂x µ SαβV µ .<br />

Ce théorème se généralise aisément.<br />

ν1...νl<br />

σ1...σs<br />

Théorème 2.5.2 Soient Sµ1...µk<br />

et Tρ1...ρr <strong>de</strong>ux tenseurs <strong>de</strong> types respectifs (k,l) et<br />

ν1...νlνl+1...νl+s<br />

(r,s). Les quantités W<br />

définies par<br />

W<br />

µ1...µkµk+1...µk+r<br />

ν1...νlνl+1...νl+s<br />

µ1...µkµk+1...µk+r<br />

= S<br />

ν1...νl<br />

µ1...µk<br />

constituent les composantes d’un tenseur <strong>de</strong> type (k + r,l + s).<br />

T<br />

µk+1...µk+r<br />

νl+1...νl+s<br />

(2.30)<br />

Le tenseur W défini par (2.30) est appelé le produit tensoriel <strong>de</strong>s tenseurs S et T. On désigne<br />

W par le symbole S ⊗ T, ce qui revient à poser<br />

(S ⊗ T)<br />

ν1...νlνl+1...νl+s<br />

µ1...µkµk+1...µk+r<br />

= S<br />

ν1...νl<br />

µ1...µk<br />

νl+1...νl+s<br />

Tµk+1...µk+r<br />

. (2.31)<br />

On notera qu’à la différence <strong>de</strong> la multiplication usuelle, T ⊗ S n’est en général pas égal à<br />

S ⊗ T. On a en effet d’après (2.31)<br />

(T ⊗ S)<br />

ν1...νsνs+1...νs+l<br />

µ1...µrµr+1...µr+k<br />

= T<br />

ν1...νs<br />

µ1...µr<br />

expression manifestement différente du second membre <strong>de</strong> (2.31).<br />

2.6 Contraction<br />

S<br />

νs+1...νs+l<br />

µr+1...µr+k<br />

Il existe encore une autre opération sur les tenseurs, la contraction <strong>de</strong>s indices, qui permet<br />

<strong>de</strong> définir un tenseur mixte <strong>de</strong> type (k − 1,l − 1) à partir d’un tenseur mixte <strong>de</strong> type (k,l)<br />

lorsque k ≥ 1 et l ≥ 1. Etant donné par exemple un tenseur T <strong>de</strong> type (2, 2), <strong>de</strong> composantes<br />

T γδ<br />

αβ , considérons les quantités T γ<br />

α obtenues en donnant <strong>de</strong>s valeurs égales aux indices β et δ<br />

et en sommant par rapport à l’indice répété :<br />

T γ<br />

α = T γβ<br />

αβ . (2.32)<br />

Examinons comment se transforment les quantités T γ<br />

α lors d’un changement <strong>de</strong> coordonnées<br />

locales x µ → xρ′ . On pose par définition<br />

T ρ′<br />

µ ′<br />

= T<br />

ρ ′ ν ′<br />

µ ′ ν ′<br />

Il vient donc en appliquant (2.20) pour transformer T<br />

T ρ′<br />

µ ′<br />

∂xα<br />

=<br />

∂x µ′<br />

∂xβ ∂xν′ ∂xρ′ ∂xγ .<br />

ρ ′ ν ′<br />

µ ′ ν ′<br />

∂xν′ γδ ∂xα<br />

T<br />

∂xδ αβ =<br />

∂x µ′<br />

∂xρ′ ∂xγ ∂xβ ∂xν′ 19<br />

:<br />

∂xν′ γδ<br />

T<br />

∂xδ αβ .<br />

,


D’où, compte tenu <strong>de</strong> (2.5) :<br />

T ρ′<br />

µ ′<br />

∂xα<br />

=<br />

∂x µ′<br />

∂x ρ′<br />

∂x<br />

δβ<br />

γ δ<br />

T γδ<br />

αβ<br />

= ∂xα<br />

∂x µ′<br />

∂xρ′ γβ ∂xα<br />

T<br />

∂xγ αβ =<br />

∂x µ′<br />

∂xρ′ γ<br />

T<br />

∂xγ α . (2.33)<br />

Ce calcul montre que les quantités T γ<br />

α constituent les composantes d’un tenseur mixte <strong>de</strong><br />

type (1, 1).<br />

La généralisation <strong>de</strong> cette propriété est immédiate et conduit au théorème qui suit.<br />

Théorème 2.6.1 Soit T un tenseur <strong>de</strong> type (k,l) <strong>de</strong> composantes<br />

avec k ≥ 1,l ≥ 1. Les quantités<br />

T<br />

ν1...νj−1νj+1...νl<br />

µ1...µi−1µi+1...µk<br />

T<br />

ν1...νj−1νjνj+1...νl<br />

µ1...µi−1µiµi+1...µk<br />

= T<br />

µ1...µi−1ρ µi+1...µk<br />

,<br />

ν1...νj−1ρ νj+1...νl<br />

(2.34)<br />

obtenues en posant µi = νj = ρ et en sommant sur l’indice répété ρ constituent les composantes<br />

d’un tenseur <strong>de</strong> type (k − 1,l − 1).<br />

L’opération définie par (2.34) s’appelle une contraction <strong>de</strong> <strong>de</strong>ux indices. Bien entendu, cette<br />

opération peut être effectuée autant <strong>de</strong> fois qu’il y a <strong>de</strong> couples d’indices libres, l’un covariant,<br />

l’autre contravariant.<br />

Remarque importante.— Il faut être très attentif à la position <strong>de</strong>s indices que l’on<br />

contracte. Si nous reprenons le tenseur T γβ<br />

αβ examiné ci-<strong>de</strong>ssus, il est clair qu’on peut obtenir<br />

par contraction quatre tenseurs <strong>de</strong> type (1, 1) qui sont en général différents, à savoir :<br />

T<br />

γ<br />

(1)α<br />

λγ<br />

= Tλα , T<br />

γ<br />

(2)α<br />

γλ<br />

= Tλα , T<br />

γ<br />

(3)α<br />

λγ<br />

= Tαλ , T<br />

γ<br />

(4)α<br />

= T γλ<br />

αλ . (2.35)<br />

Les quatre tenseurs ainsi définis sont parfois appelés premières traces du tenseur mixte<br />

T γβ<br />

αβ .<br />

Une nouvelle contraction <strong>de</strong>s indices libres restants donne maintenant <strong>de</strong>s tenseurs <strong>de</strong> type<br />

(0, 0), i.e. <strong>de</strong>s fonctions scalaires<br />

T<br />

µ<br />

(1)µ<br />

λµ<br />

= Tλµ , T<br />

µ<br />

(2)µ<br />

µλ<br />

= T λµ , T<br />

µ<br />

(3)µ<br />

λµ<br />

= Tµλ , T<br />

µ<br />

(4)µ<br />

= T µλ<br />

µλ<br />

mais cette opération donne seulement <strong>de</strong>ux fonctions scalaires distinctes, puisqu’on a manifestement<br />

On pourra poser<br />

T λµ<br />

λµ<br />

T(1) = T<br />

µ<br />

(1)µ<br />

µλ<br />

= T µλ et T µλ λµ<br />

λµ = Tµλ .<br />

µ<br />

= T(4)µ<br />

, T(2) = T<br />

µ<br />

(2)µ<br />

= T<br />

µ<br />

(3)µ<br />

. (2.36)<br />

On peut appeler les quantités T(1) et T(2) les secon<strong>de</strong>s traces du tenseur T γδ<br />

αβ . On notera<br />

qu’étant <strong>de</strong>s fonctions scalaires, les traces T(1) et T(2) <strong>de</strong>meurent invariantes par changement <strong>de</strong><br />

coordonnées locales. Nous verrons que leur rôle en physique est capital, notamment en relativité.<br />

Dans le cas d’un tenseur T β<br />

α , il existe une seule première trace définie par<br />

Tr(T) = T α<br />

α . (2.37)<br />

20


On appelle cet invariant simplement la trace du tenseur mixte T β<br />

α . Le plus souvent, on désigne<br />

cette trace par T. Il faut donc veiller à ne pas la confondre avec le tenseur T lui-même.<br />

Multiplication contractée.— En pratique, on est souvent amené à combiner la multiplication<br />

tensorielle et la contraction d’indices appartenant à <strong>de</strong>ux tenseurs différents en facteurs.<br />

Soient par exemple Sαβ et T γδ les composantes <strong>de</strong> <strong>de</strong>ux tenseurs S et T. Leur produit tensoriel<br />

U = S ⊗ T a pour composantes<br />

U γδ<br />

αβ = SαβT γδ .<br />

Une contraction <strong>de</strong> U sur un indice appartenant à S et un indice appartenant à T permet<br />

<strong>de</strong> former les quatre tenseurs mixtes U(1), U(2),, U(3) et U(4) d’ordre 2 suivants :<br />

U γ<br />

(1)α = SλαT λγ , U γ<br />

(2)α = SλαT γλ ,<br />

U γ<br />

(3)α = SαλT λγ , U γ<br />

(4)α = SαλT γλ ,<br />

qui sont en général distincts.<br />

Les produits contractés sur <strong>de</strong>ux couples d’indices donnent seulement <strong>de</strong>ux invariants :<br />

U (1) = U µ<br />

(1)µ = SλµT λµ , U (2) = U µ<br />

(2)µ = SλµT µλ .<br />

On remarquera que la contraction d’un tenseur par rapport à <strong>de</strong>ux (ou 2p) indices peut<br />

toujours être considérée comme une multiplication contractée <strong>de</strong> T par le tenseur mixte <strong>de</strong><br />

Kronecker <strong>de</strong>fini par (2.22). Reprenons par exemple le tenseur T γδ<br />

αβ déjà utilisé ci-<strong>de</strong>ssus. On<br />

peut écrire en effet<br />

etc.<br />

T γλ<br />

αλ<br />

T λγ<br />

αλ<br />

2.7 Critères <strong>de</strong> tensorialité<br />

γλ<br />

= δβ λTαβ = δλ νT γν<br />

αλ ,<br />

λγ<br />

= δβ λTαβ = δλ νT νγ<br />

αλ ,<br />

La multiplication contractée permet <strong>de</strong> former un critère général <strong>de</strong> tensorialité très pratique<br />

pour s’assurer qu’un système <strong>de</strong> quantités que l’on introduit dans un calcul est un tenseur.<br />

Commençons par un exemple en montrant qu’un système <strong>de</strong> quantités T α βγε constitue les<br />

composantes d’un tenseur <strong>de</strong> type (3, 1) si et seulement si quel que soit le tenseur <strong>de</strong>ux fois<br />

contravariant U µν , les quantités T α βγεU βγ sont les composantes d’un tenseur une fois covariant<br />

et une fois covariant.<br />

Le caractère nécessaire <strong>de</strong> la condition énoncée résulte <strong>de</strong> ce qui a été dit plus haut <strong>de</strong> la<br />

multiplication contractée. Pour montrer son caractère suffisant, effectuons une transformation<br />

<strong>de</strong> coordonnées x µ → xρ′ . Par hypothèse, les quantités T α βγεU βγ se transforment comme les<br />

composantes d’un tenseur une fois covariant et une fois covariant. On a donc d’après (2.20)<br />

T λ′<br />

µ ′ ν ′ ρ ′Uµ′ ν ′<br />

= ∂xλ′<br />

∂xα ∂xε ∂xρ′ T α βγεU βγ . (2.38)<br />

21


Or, U étant un tenseur <strong>de</strong>ux fois contravariant, on peut remplacer les quantités U µ′ ν ′<br />

figurant<br />

dans le premier membre <strong>de</strong> (2.38) par<br />

Il vient :<br />

U µ′ ν ′<br />

= ∂xµ′<br />

∂x β<br />

∂x ν′<br />

∂x γ Uβγ .<br />

T λ′<br />

µ ′ ν ′ ρ ′<br />

∂x µ′<br />

∂xβ ∂xν′ ∂xγ Uβγ = ∂xλ′<br />

∂xα ∂xε ∂xρ′ T α βγεU βγ . (2.39)<br />

Les équations (2.39) <strong>de</strong>vant être satisfaites quels que soient les tenseurs U βγ , on doit avoir<br />

T λ′<br />

µ ′ ν ′ ρ ′<br />

∂x µ′<br />

∂xβ ∂xν′ ∂xλ′<br />

=<br />

∂xγ ∂xα ∂x ε<br />

∂x ρ′ T α βγε. (2.40)<br />

Opérons la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (2.40) par ∂xβ<br />

∂x<br />

un réarrangement <strong>de</strong> l’ordre <strong>de</strong>s termes<br />

T λ′<br />

µ ′ ν ′ ρ ′<br />

∂x µ′<br />

∂xβ ∂xβ ∂xσ′ ∂xν′ ∂xγ ∂xγ ∂xτ ′ = ∂xλ′<br />

∂xα ∂x β<br />

∂x σ′<br />

∂xγ ∂xτ ′<br />

En tenant compte <strong>de</strong>s relations (2.7), les équations (2.41) s’écrivent<br />

T λ′<br />

µ ′ ν ′ ρ ′δµ′ σ ′δν′<br />

λ′<br />

τ ′ = T σ ′ τ ′ ρ<br />

∂xλ′<br />

′ =<br />

∂xα ∂xβ ∂xσ′ ∂xγ ∂xτ ′<br />

∂xγ<br />

σ′ ∂x<br />

τ′ . Il vient avec<br />

∂x ε<br />

∂x ρ′ T α βγε. (2.41)<br />

∂x ε<br />

∂x ρ′ T α βγε. (2.42)<br />

Les équations (2.42) montrent que les quantités T α βγε se transforment comme les composantes<br />

d’un tenseur <strong>de</strong> type (3, 1). CQFD.<br />

Le théorème que nous venons <strong>de</strong> montrer admet la généralisation suivante.<br />

Théorème 2.7.1 Pour qu’un système <strong>de</strong> 4r+s ν1...νs<br />

quantités Tµ1...µr<br />

constitue les composantes<br />

d’un tenseur <strong>de</strong> type (r,s) dans un système <strong>de</strong> coordonnées locales xα , il faut et il suffit que<br />

quel que soit le tenseur U β1...βl <strong>de</strong> type (k,l) avec k ≤ r et l ≤ s, le système <strong>de</strong> quantités<br />

α1...αk<br />

T<br />

µ1...µr<br />

ν1...νs<br />

U<br />

µ1...µl<br />

ν1...νk<br />

soit le système <strong>de</strong> composantes d’un tenseur r − k fois covariant et s − l fois contravariant.<br />

(2.43)<br />

Ce théorème a pour corollaire la proposition suivante, très souvent utilisée comme critère.<br />

Théorème 2.7.2 Pour qu’un système <strong>de</strong> 4r+s ν1...νs<br />

quantités Tµ1...µr<br />

constitue les composantes<br />

d’un tenseur <strong>de</strong> type (r,s) dans un système <strong>de</strong> coordonnés locales xα , il faut et il suffit que quels<br />

que soient les r vecteurs contravariants X(k) <strong>de</strong> composantes X αk<br />

(k) et quels que soient les s<br />

vecteurs covariants φ (l) <strong>de</strong> composantes φ (l)<br />

, la quantité<br />

βl<br />

I = T<br />

µ1...µr<br />

ν1...νs<br />

X µ1<br />

(1) ...Xµr<br />

(r) φ(1)<br />

ν1 ...φ(s)<br />

νs<br />

soit invariante lorsqu’on effectue un changement <strong>de</strong> base.<br />

22<br />

(2.44)


2.8 Tenseurs symétriques et tenseurs antisymétriques<br />

Tenseurs symétriques.— Soit T un tenseur <strong>de</strong>ux fois covariant. Supposons que les composantes<br />

Tµν <strong>de</strong> T dans un système <strong>de</strong> coordonnées locales x α soient telles que l’égalité<br />

Tνµ = Tµν<br />

(2.45)<br />

soit satisfaite pour tous les couples d’indices (µ,ν). On déduit aisément <strong>de</strong> la loi <strong>de</strong> transformation<br />

(2.20) que les composantes <strong>de</strong> T dans un autre système <strong>de</strong> coordonnées locales xβ′ vérifient<br />

aussi la propriété Tσ ′ ρ ′ = Tρ ′ σ ′. Les relations <strong>de</strong> symétrie (2.45) traduisent donc une propriété<br />

intrinsèque. C’est pourquoi on dit que T est un tenseur symétrique.<br />

Un tenseur métrique est un exemple <strong>de</strong> tenseur <strong>de</strong>ux fois covariant symétrique.<br />

Tenseurs antisymétriques.— Considérons maintenant un tenseur <strong>de</strong>ux fois covariant F<br />

dont les composantes Fµν dans les coordonnées locales x α vérifient les relations<br />

Fµν = −Fνµ<br />

(2.46)<br />

pour tous les couples d’indices (µ,ν). Alors <strong>de</strong>s relations analogues sont satisfaites par les<br />

composantes <strong>de</strong> F dans n’importe quel autre système <strong>de</strong> coordonnées locales. On dit que F est<br />

un tenseur antisymétrique.<br />

Ces considérations s’appliquent également aux tenseurs <strong>de</strong>ux fois contravariants.<br />

Parties symétrique et antisymétrique d’un tenseur.— On peut toujours exprimer<br />

un tenseur T <strong>de</strong>ux fois covariant (ou <strong>de</strong>ux fois contravariant) arbitraire comme une somme<br />

d’un tenseur symétrique et d’un tenseur antisymétrique. En effet, n’importe quel système <strong>de</strong><br />

16 quantités Tµν peut s’écrire sous la forme<br />

où T(µν) et T[µν] sont respectivement définis par<br />

Tµν = T(µν) + T[µν], (2.47)<br />

T(µν) = 1<br />

2 (Tµν + Tνµ) = T(νµ), (2.48)<br />

T[µν] = 1<br />

2 (Tµν − Tνµ) = −T[νµ], (2.49)<br />

et il est aisé <strong>de</strong> montrer que T(µν) et T[µν] sont <strong>de</strong>s composantes <strong>de</strong> tenseurs <strong>de</strong> type (2, 0). Du<br />

fait que la décomposition (2.47) est unique, on appelle T(µν) et T[µν] respectivement la partie<br />

symétrique <strong>de</strong> T et la partie antisymétrique du tenseur T.<br />

Les notions qui précè<strong>de</strong>nt peuvent être étendues aux tenseurs d’ordre supérieur à 2.<br />

2.9 Composantes covariantes et contravariantes<br />

23


Donnons-nous une variété différentielle V4 munie d’une métrique g, et considérons un champ<br />

<strong>de</strong> vecteurs contravariants V µ . Du fait que g est un tenseur <strong>de</strong>ux fois covariant <strong>de</strong> composantes<br />

gµν, les quantités<br />

Vν = gνρV ρ<br />

(2.50)<br />

sont les composantes d’un tenseur <strong>de</strong> type (1, 0), i.e. d’un vecteur covariant V ∗ (voir multiplication<br />

contractée, sect. 2.6). On convient <strong>de</strong> regar<strong>de</strong>r le vecteur contravariant V et le vecteur<br />

covariant V ∗ qui lui est associé comme étant un seul et même vecteur dont les quantités V µ<br />

sont les composantes contravariantes et les quantités Vν définies par (2.50) sont les composantes<br />

covariantes.<br />

On peut aisément déterminer les composantes contravariantes V µ en fonction <strong>de</strong>s composantes<br />

covariantes Vν. On a supposé en effet que la condition (2.25) est satisfaite dans n’importe<br />

quel système <strong>de</strong> coordonnées locales admissibles. Les équations (2.50) forment donc un système<br />

régulier <strong>de</strong> quatre équations linéaires à quatre inconnues V µ lorsque les composantes covariantes<br />

Vν sont données (système <strong>de</strong> Kramer). La théorie élémentaire <strong>de</strong>s systèmes <strong>de</strong> Kramer montre<br />

que ce système admet une solution unique qui peut s’écrire sous la forme<br />

V µ = g µν Vν, (2.51)<br />

les quantités g µν étant <strong>de</strong>s fonctions <strong>de</strong>s coordonnées indépendantes <strong>de</strong>s quantités Vν. En substituant<br />

(2.50) dans (2.51), on voit que<br />

V µ = g µν gνρV ρ . (2.52)<br />

Comme les équations (2.52) doivent être satisfaites quelles que soint le vecteur V , on en<br />

déduit que les quantités g µν doivent satisfaire les seize relations<br />

g µν gνρ = δ µ ρ. (2.53)<br />

Les relations (2.53) montrent que la matrice (g µν ) est l’inverse <strong>de</strong> la matrice (gµν).<br />

On a le théorème important suivant, dont la démonstration est donnée dans l’appendice 1.<br />

Théorème 2.9.1 Les quantités g µν sont les composantes d’un tenseur symétrique <strong>de</strong>ux fois<br />

contravariant, i.e. obéissent à la loi <strong>de</strong> transformation :<br />

g ρ′ σ ′<br />

= ∂xρ′<br />

∂x µ<br />

∂xσ′ ∂xν gµν . (2.54)<br />

Ce théorème permet d’associer à tout vecteur covariant φ <strong>de</strong> composantes φρ un vecteur<br />

contravariant φ∗ dont les composantes φ µ sont définies par<br />

φ σ = g ρσ φρ. (2.55)<br />

De nouveau, on convient <strong>de</strong> regar<strong>de</strong>r les vecteurs φ et φ∗ comme un seul et même vecteur<br />

dont les quantités φρ sont les composantes covariantes et les quantités φ σ sont les composantes<br />

contravariantes.<br />

24


Sur une variété riemannienne, on parlera donc dsormais <strong>de</strong> vecteurs tout court, mais on<br />

distinguera soigneusement les composantes contravariantes et les composantes covariantes <strong>de</strong><br />

ces vecteurs.<br />

Les considérations qui précè<strong>de</strong>nt s’éten<strong>de</strong>nt sans difficulté aux tenseurs d’ordre ≥ 2. Étant<br />

donné par exemple un tenseur S <strong>de</strong>ux fois contravariant <strong>de</strong> composantes S µν , on regar<strong>de</strong>ra<br />

comme i<strong>de</strong>ntifiable à S le tenseur <strong>de</strong>ux fois covariant <strong>de</strong> composantes<br />

ainsi que les tenseurs mixtes <strong>de</strong> composantes<br />

Les quantités S µν µ .<br />

, Sαβ, S β<br />

riantes, covariantes et mixtes du tenseur S.<br />

Sαβ = gαµgβνS µν<br />

(2.56)<br />

µ .<br />

S β = gβνS µν . ν<br />

, S α = gαµS µν . (2.57)<br />

et S . ν<br />

α seront respectivement appelées composantes contrava-<br />

De même, étant donné un tenseur <strong>de</strong>ux fois covariant T <strong>de</strong> composantes Tµν, on dira que<br />

les quantités Tµν sont les composantes covariantes <strong>de</strong> T, et on définira les composantes contravariantes<br />

et mixtes <strong>de</strong> T respectivement par les équations<br />

et<br />

T ρσ = g ρµ g σν Tµν<br />

(2.58)<br />

T ρ<br />

. ν = g ρµ Tµν, T σ<br />

µ . = g σν Tµν . (2.59)<br />

L’extension aux tenseurs d’ordre supérieur à 2 s’ensuit naturellement.<br />

Remarque importante.— Il faudra faire très attention à la disposition <strong>de</strong>s indices quand<br />

on évalue <strong>de</strong>s composantes covariantes ou mixtes à partir <strong>de</strong> composantes contravariantes par<br />

exemple. Pour les composantes mixtes d’un tenseur <strong>de</strong>ux fois covariant Tµν, par exemple, on<br />

n’a pas T µ<br />

. ν = T µ<br />

ν . , sauf si Tµν est symétrique.<br />

D’après les relations (2.58), les composantes contravariantes du tenseur métrique g sont les<br />

quantités g ρµ g σν gµν. Or, d’après (2.53), on a g σν gµν = δ σ µ. En conséquence :<br />

g ρµ g σν gµν = g ρµ δ σ µ = g ρσ . (2.60)<br />

Les relations (2.60) montrent que les quantités g µν sont les composantes contravariantes du<br />

tenseur métrique g, les quantités gµν étant elles-même les composantes covariantes du même<br />

tenseur.<br />

Calculons maintenant les composantes mixtes du tenseur métrique. Compte tenu <strong>de</strong> la<br />

symétrie du tenseur métrique, les composantes mixtes g ρ . ν et g ρ<br />

ν . sont confondues et peuvent<br />

être désignées par g ρ ν. On a d’après (2.59)<br />

D’où en appliquant (2.53) :<br />

g ρ ν = g ρµ gµν .<br />

g ρ ν = δ ρ ν. (2.61)<br />

25


Cette <strong>de</strong>rnière équation montre que les composantes mixtes du tenseur métrique s’i<strong>de</strong>ntifient<br />

aux composantes du tenseur <strong>de</strong> Kronecker d’ordre 2 défini dans la sect. 2.4.<br />

On notera que l’utilisation <strong>de</strong>s composantes contravariantes, covariantes ou mixtes <strong>de</strong>s vecteurs<br />

et <strong>de</strong>s tenseurs permet d’obtenir <strong>de</strong>s expressions particulièrement concises <strong>de</strong> la plupart<br />

<strong>de</strong>s expressions utilisées en analyse tensorielle. Ainsi, le produit scalaire <strong>de</strong> <strong>de</strong>ux vecteurs <strong>de</strong><br />

composantes contravariantes X µ et Y ν s’écrit comme nous l’avons vu<br />

g(X,Y ) = gµνX µ Y ν .<br />

Développée, cette expression est une double somme, l’une sur l’indice µ, l’autre sur l’indice<br />

ν, contenant 16 termes. Or, la même expression s’écrit en tenant compte <strong>de</strong> la formule (2.50)<br />

définissant les composantes covariantes d’un vecteur :<br />

g(X,Y ) = XνY ν = g(X,Y ) = X µ Yµ. (2.62)<br />

Les second et troisième membres <strong>de</strong> (2.62) sont <strong>de</strong>s sommes simples, comportant 4 termes.<br />

Enfin, en utilisant les relations (2.51) et (2.53), on voit facilement que le produit scalaire<br />

g(X,Y ) peut s’exprimer en fonction <strong>de</strong>s composantes covariantes <strong>de</strong>s vecteurs X et Y selon la<br />

formule<br />

g(X,Y ) = g µν XµYν. (2.63)<br />

Appendice 1 : démonstration du théorème 2.9.1<br />

L’inverse d’une matrice symétrique étant elle-même symétrique, les quantités g µν impliquées<br />

dans les équations (2.51) sont symétriques par rapport aux indices µ et ν :<br />

g νµ = g µν . (2.64)<br />

La loi <strong>de</strong> transformation <strong>de</strong>s g µν est nécessairement telle que les relations<br />

gτ ′ λ ′gλ′ σ ′<br />

= δ σ′<br />

τ ′<br />

soient satisfaites dans le système <strong>de</strong> coordonnées locales xρ′ . On a<br />

et<br />

gτ ′ λ<br />

∂xα<br />

′ =<br />

∂xτ ′<br />

∂x β<br />

∂x λ′ gαβ<br />

(2.65)<br />

(2.66)<br />

δ σ′ ∂xσ′<br />

τ ′ =<br />

∂xα ∂xβ ∂xτ ′ δ α β. (2.67)<br />

du fait que les quantités gτ ′ λ ′ et δσ′ τ ′ sont respectivement les composantes d’un tenseur <strong>de</strong>ux fois<br />

covariant et d’un tenseur mixte d’ordre 2. Substituons (2.66) et (2.67) dans (2.65) et effectuons<br />

la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> l’équation obtenue par ∂xρ′<br />

∂x µ<br />

∂xτ′ ∂xν g µν . On obtient<br />

∂x ρ′<br />

∂x µ<br />

τ ′<br />

∂x<br />

∂xν ∂xα ∂xτ ′<br />

∂xβ ∂xλ′ g µν gαβg λ′ σ ′<br />

= ∂xρ′<br />

∂x µ<br />

26<br />

τ ′<br />

∂x<br />

∂xν ∂xσ′ ∂xα ∂xβ ∂xτ ′ g µν δ α β<br />

(2.68)


En modifiant l’ordre <strong>de</strong>s facteurs et en utilisant <strong>de</strong> façon répétée les relations (2.5), (2.7) et<br />

(2.53), on voit que le premier membre <strong>de</strong> (2.68) s’écrit<br />

∂x ρ′<br />

∂x µ<br />

τ ′<br />

∂x<br />

∂xν ∂xα ∂xτ ′<br />

∂xβ ∂xλ′ g µν gαβg λ′ σ ′<br />

= ∂xρ′<br />

∂x µ<br />

soit encore<br />

∂xρ′ ∂x µ<br />

τ ′<br />

∂x<br />

∂xν ∂xα ∂x<br />

∂xτ ′<br />

β<br />

Le second membre <strong>de</strong> (2.68) <strong>de</strong>vient<br />

∂x ρ′<br />

∂x µ<br />

τ ′<br />

∂x<br />

∂xν ∂x λ′ g µν gαβg λ′ σ ′<br />

∂xβ ∂xλ′ δ α ν g µν gαβg λ′ σ ′<br />

= ∂xρ′<br />

∂x µ<br />

∂x µ<br />

∂x λ′ g λ′ σ ′<br />

,<br />

= δ ρ′<br />

λ ′gλ′ σ ′<br />

= g ρ′ σ ′<br />

. (2.69)<br />

∂xβ ∂x<br />

∂xτ ′<br />

σ′<br />

∂xα gµνδ α β = ∂xρ′<br />

∂x µ<br />

∂xσ′ ∂xα δβ νδ α βg µν = ∂xρ′<br />

∂x µ<br />

∂xσ′ ∂xν gµν . (2.70)<br />

La comparaison <strong>de</strong> (2.69) et <strong>de</strong> (2.70) montre que les quantités g µν se transforment selon la<br />

formule (2.54), ce qui démontre le théorème 2.9.1.<br />

27


Chapitre 3<br />

Espace-temps <strong>de</strong> Minkowski<br />

Dans ce chapitre, nous montrons que le principe d’inertie, l’hypothèse que l’espace est<br />

euclidien, <strong>de</strong> dimension 3 et isotrope, et le postulat qu’il existe une vitesse finie invariante par<br />

les changements <strong>de</strong> référentiels galiléens conduisent directement à l’espace-temps <strong>de</strong> Minkowski<br />

comme scène universelle.<br />

3.1 Principes fondamentaux<br />

Définition 3.1.1 (Référentiels galiléens) On appelle référentiel galiléen tout référentiel S<br />

auquel on peut associer un espace proprement euclidien 1 à trois dimensions E3[S] et une échelle<br />

<strong>de</strong> temps T [S] <strong>de</strong> telle sorte qu’une particule isolée (i.e. soustraite à toute action extérieure)<br />

soit au repos par rapport à S ou décrive une droite <strong>de</strong> E3[S] avec un mouvement uniforme.<br />

E3[S] est appelé l’espace physique du référentiel S. On désignera les points <strong>de</strong> cet espace<br />

par <strong>de</strong>s lettres majuscules (O,A,B,C,...) pour les différencier <strong>de</strong>s points-événements qui seront<br />

toujours représentés par <strong>de</strong>s lettres minuscules (x,y,...). L’hypothèse que E3[S] est un espace<br />

proprement euclidien permet d’associer à un point O arbitraire <strong>de</strong> E3[S] un repère orthonormé<br />

(O,e1,e2,e3) par rapport auquel on définit les notions usuelles <strong>de</strong> la cinématique telles que le<br />

vecteur position x et le vecteur vitesse v d’une particule à chaque instant t <strong>de</strong> l’échelle <strong>de</strong> temps<br />

T [S]. Dans ce chapitre, nous supposerons toujours que E3[S] est rapporté à un tel repère, les<br />

coordonnées spatiales étant désignées par x i , avec i = 1, 2, 3.<br />

Bien entendu, cette définition ne vaut que parce qu’on admet la validité du postulat fondamental<br />

suivant.<br />

Postulat 3.1.1 (Principe d’inertie restreint) Des référentiels galiléens sont en principe<br />

réalisables dans toute région <strong>de</strong> l’univers dépourvue <strong>de</strong> champ <strong>de</strong> gravitation.<br />

Nous proposons 2 d’appeler le postulat 3.1.1 principe d’inertie restreint pour bien le distinguer<br />

du principe d’inertie usuel (i.e. galiléo-newtonien). Selon ce <strong>de</strong>rnier en effet, la loi <strong>de</strong><br />

1La notion d’espace proprement euclidien est un cas particulier <strong>de</strong> la notion d’espace (ponctuel) affine : voir<br />

l’annexe A.<br />

2La terminologie adoptée ici nous est propre, en effet.<br />

28


gravitation newtonienne peut être formulée dans un référentiel galiléen arbitraire (voir sect.<br />

7.1). A contrario, le postulat 3.1.1 n’affirme pas qu’on puisse maintenir la notion <strong>de</strong> référentiel<br />

galiléen lorsque l’interaction gravitationnelle n’est pas négligeable.<br />

Il résulte <strong>de</strong> ce qui précè<strong>de</strong> que la physique considérée dans les chapitres 3 à 6 doit être<br />

regardée comme une physique vali<strong>de</strong> dans un univers (ou une région <strong>de</strong> l’univers) sans gravitation,<br />

sans qu’on puisse pour l’instant se prononcer sur sa validité ou sa non-validité dans un<br />

champ <strong>de</strong> gravitation. Nous verrons dans le chapitre 7 pourquoi et comment cette physique<br />

doit être modifiée quand la gravitation est prise en compte.<br />

Les énoncés ci-<strong>de</strong>ssus doivent être complétés par un postulat qui précise le lien entre les<br />

variables mathématiques que sont les dates t et les coordonnées cartésiennes orthonormées x i<br />

et les mesures que l’on peut effectuer avec <strong>de</strong>s horloges standard et <strong>de</strong>s étalons <strong>de</strong> longueur au<br />

repos par rapport au référentiel galiléen considéré.<br />

Postulat 3.1.2 Soit S un référentiel galiléen arbitraire muni d’un repère orthonormé (O,e1,e2,e3)<br />

et d’une échelle <strong>de</strong> temps t tels que le postulat 3.1.1 soit vali<strong>de</strong>. Alors<br />

a) si <strong>de</strong>ux événements xA et xB se produisent au même point x <strong>de</strong> E3[S] (i.e. si x i A = x i B),<br />

la différence <strong>de</strong> dates tB − tA est égale au temps propre mesuré entre xA et xB par une horloge<br />

standard au repos au point x;<br />

b) si A et B sont <strong>de</strong>ux points arbitraires <strong>de</strong> l’espace E3[S] <strong>de</strong> coordonnées respectives x i A<br />

et x i B, la distance entre ces <strong>de</strong>ux points mesurée au moyen d’étalons standards <strong>de</strong> longueur au<br />

repos par rapport au référentiel S est égale à la quantité<br />

lAB =<br />

<br />

(x 1 B − x 1 A) 2 + (x 2 B − x 2 A) 2 + (x 3 B − x 3 A) 2 . (3.1)<br />

Ces <strong>de</strong>ux postulats sont admis aussi bien par la physique préeinsteinienne que par la relativité.<br />

Toutefois la physique préeinsteinienne postulait également que pour <strong>de</strong>ux événements<br />

quelconques xA et xB observés dans <strong>de</strong>ux systèmes <strong>de</strong> référence galiléens S et S ′ en mouvement<br />

l’un par rapport à l’autre, on pouvait poser<br />

t ′ B − t ′ A = tB − tA , (3.2)<br />

hypothèse qui revenait à supposer l’existence d’un temps absolu. Or, nous le verrons dans la<br />

section suivante, la relation (3.2) n’est absolument pas impliquée par les postulats 3.1.1 et 3.1.2,<br />

et s’est en outre avérée incompatible avec le postulat d’existence d’une vitesse invariante énoncé<br />

ci-<strong>de</strong>ssous.<br />

Postulat 3.1.3 (Isotropie <strong>de</strong> l’espace) L’espace physique associé à un référentiel galiléen<br />

arbitraire est isotrope en chacun <strong>de</strong> ses points.<br />

Rappelons qu’un milieu est dit isotrope en un point lorsque ses propriétés sont les mêmes<br />

dans toutes les directions issues <strong>de</strong> ce point. Le postulat 3.1.3 revient à énoncer que <strong>de</strong>ux<br />

référentiels déduits l’un <strong>de</strong> l’autre par une rotation <strong>de</strong>s axes spatiaux sont équivalents pour<br />

formuler les lois <strong>de</strong> la physique.<br />

Voici maintenant le postulat qui implique une rupture radicale avec la physique préeinsteinienne.<br />

29


Postulat 3.1.4 (Existence d’une vitesse invariante) Il existe une vitesse invariante par<br />

les changements <strong>de</strong> référentiels galiléens. Cette vitesse est notée c.<br />

Ce postulat signifie qu’une particule ou une interaction se propageant avec la vitesse c par<br />

rapport à un référentiel galiléen donné se propage également avec la vitesse c par rapport à<br />

n’importe quel autre référentiel galiléen. Bien entendu, conformément au postulat d’isotropie<br />

<strong>de</strong> l’espace, la vitesse c est indépendante <strong>de</strong> la direction et du sens <strong>de</strong> la propagation. On notera<br />

que l’énoncé n’affirme nullement que la vitesse c soit effectivement réalisable par une particule<br />

ou par un signal. Le postulat 3.1.4 n’affirme pas non plus que la constante c est une vitesse<br />

limite ni qu’elle constitue la borne supérieure <strong>de</strong> toutes les vitesses possibles.<br />

La vitesse invariante c est une constante universelle. Historiquement, ce sont les problèmes<br />

posés par l’électrodynamique et l’optique à la fin du XIX e siècle qui ont conduit Einstein à<br />

postuler en 1905 que la vitesse <strong>de</strong> la lumière dans le vi<strong>de</strong> était une constante indépendante<br />

du référentiel galiléen et <strong>de</strong> l’état <strong>de</strong> mouvement <strong>de</strong> la source 3 . C’est pourquoi on appelle<br />

généralement c vitesse <strong>de</strong> la lumière dans le vi<strong>de</strong>, mais cette terminologie doit impérativement<br />

être abandonnée. Nous allons voir en effet que l’existence d’une vitesse invariante c dicte en<br />

quelque sorte la structure <strong>de</strong> l’espace-temps, c’est-à-dire le cadre fondamental dans lequel<br />

nous décrivons toutes les interactions, et pas seulement les phénomènes électromagnétiques.<br />

La constante c n’est donc pas liée à une interaction particulière.<br />

Bien entendu, il est en pratique légitime <strong>de</strong> poser que la vitesse <strong>de</strong> propagation <strong>de</strong> la<br />

lumière dans le vi<strong>de</strong> est numériquement égale à c. Cette affirmation est en effet conforme<br />

à l’expérience. En outre, cette égalité numérique est une conséquence directe <strong>de</strong> la théorie<br />

électromagnétique <strong>de</strong> Maxwell formulée dans le cadre relativiste que nous sommes en train <strong>de</strong><br />

construire. Mais ces arguments ne sont pas du tout équivalents à l’affirmation d’une i<strong>de</strong>ntité<br />

essentielle <strong>de</strong> c avec la vitesse <strong>de</strong> la lumière puisqu’on peut concevoir <strong>de</strong>s théories relativistes<br />

<strong>de</strong> l’électromagnétisme prédisant une vitesse <strong>de</strong> propagation différentes <strong>de</strong> c. C’est pourquoi<br />

nous éviterons systématiquement la terminologie courante, en appelant la constante c vitesse<br />

invariante ou encore vitesse fondamentale 4 .<br />

3.2 Lois <strong>de</strong> transformation <strong>de</strong>s coordonnées galiléennes<br />

Selon ce qui précè<strong>de</strong>, un événement peut être repéré dans un référentiel galiléen arbitraire<br />

par une date t et trois coordonnées cartésiennes orthogonales x i . Du fait que la constante<br />

universelle c a la dimension d’une vitesse, on remplacera la date t par une coordonnée x 0 ayant<br />

la dimension d’une longueur en posant<br />

x 0 = ct. (3.3)<br />

3 A. Einstein, Zur Electrodynamik bewegter Körper [Sur l’électrodynamique <strong>de</strong>s corps en mouvement], Annalen<br />

d. Physik, t. XVII, pp. 891-921, 1905. Trad. De M. Solovine : Sur l’électrodynamique <strong>de</strong>s corps en mouvement,<br />

Gauthier-Villars, <strong>Paris</strong>, 1955.<br />

4 On a proposé d’autres dénominations pour c, comme par ex. “constante <strong>de</strong> structure spatio-temporelle” ou<br />

encore “constante <strong>de</strong> structure <strong>de</strong> l’espace-temps”, voire “constante <strong>de</strong> Lorentz”. L’important est d’éviter une<br />

terminologie trompeuse.<br />

30


On repérera donc désormais un événement dans un reférentiel galiléen donné au moyen <strong>de</strong><br />

quatre coordonnées (x0 ,x1 ,x2 ,x3 ) qu’on appellera <strong>de</strong>s coordonnées galiléennes homogènes (ou<br />

simplement coordonnées galiléennes5 ). Pour abréger, le système (x0 ,x1 ,x2 ,x3 ) sera représenté<br />

par (xα ), l’indice α prenant l’une quelconque <strong>de</strong>s valeurs 0, 1, 2, 3. D’une façon générale, on<br />

représentera les indices variant <strong>de</strong> 0 à 3 par <strong>de</strong>s lettres grecques α,β,...,λ,µ,ν,..., réservant les<br />

lettres latines i,j,k,l,... pour les indices variant <strong>de</strong> 1 à 3.<br />

On admet qu’à un événement donné correspond un quadruplet <strong>de</strong> coordonnées galiléennes<br />

(xα ) et un seul, chacune <strong>de</strong>s variables xα pouvant prendre n’importe quelle valeur entre −∞<br />

en ∞.<br />

Considérons maintenant <strong>de</strong>ux référentiels galiléens S et S ′ en mouvement l’un par rapport<br />

à l’autre. Un point-événement x admet <strong>de</strong>s coordonnées galiléennes (xα ) par rapport à S et<br />

(xβ′ ) par rapport à S ′ . Chaque coordonnée xβ′ est évi<strong>de</strong>mment une fonctions <strong>de</strong>s coordonnées<br />

(xα ), <strong>de</strong> sorte qu’on peut poser<br />

x β′<br />

= F β′<br />

(x 0 ,x 1 ,x 2 ,x 3 ) = F β′<br />

(x α ). (3.4)<br />

Ces transformations <strong>de</strong> coordonnées galiléennes ne peuvent être arbitraires car elles doivent<br />

faire correspondre un mouvement rectiligne uniforme (ou le repos) dans S ′ à un mouvement<br />

rectiligne uniforme (ou le repos) dans S d’après la définition 3.1.1 et le postulat 3.1.1. On peut<br />

montrer 6 que les transformations les plus générales ayant cette propriété sont nécessairement<br />

<strong>de</strong> la forme<br />

α x α + b β′<br />

x β′<br />

= Aβ′<br />

Bλxλ , (3.5)<br />

+ K<br />

où les quantités A β′<br />

α ,b β′<br />

,Bλ et K sont <strong>de</strong>s constantes 7 .<br />

On admet qu’à <strong>de</strong>s coordonnées galiléennes finies dans un référentiel doivent toujours correspondre<br />

<strong>de</strong>s coordonnées galiléennes finies dans n’importe quel autre référentiel 8 . Il faut donc<br />

prendre les quatre constantes Bλ du dénominateur égales à 0 et supposer K = 0. Il est clair<br />

qu’on ne diminue pas la généralité en posant K = 1. En conséquence, nous poserons désormais<br />

que les formules <strong>de</strong> transformation <strong>de</strong>s coordonnées galilénnes sont <strong>de</strong> la forme<br />

x β′<br />

= A β′<br />

α x α + b β′<br />

, (3.6)<br />

où les quantités Aβ′ α et bβ′ sont <strong>de</strong>s constantes. Bien entendu, nous exigerons que les relations<br />

(3.6) soient inversibles, <strong>de</strong> sorte qu’on puisse écrire<br />

où A α β ′ et bα sont également <strong>de</strong>s constantes.<br />

x α = A α β ′xβ′ + b α , (3.7)<br />

5 On a aussi proposé d’appeler ces coordonnées <strong>de</strong>s coordonnées galiléennes réduites. Voir A. Lichnerowicz,<br />

Éléments <strong>de</strong> calcul tensoriel, Armand Colin.<br />

6 Ce théorème a été démontré par V. Fock dans son ouvrage The Theory of Space Time and Gravitation,<br />

Pergamon Press, 1959.<br />

7 On notera que le dénominateur figurant dans le second membre <strong>de</strong> (3.5) est le même pour chacune <strong>de</strong>s<br />

quatre coordonnées.<br />

8 Ne pas exiger cette condition et maintenir la généralité <strong>de</strong>s transformations homographiques (3.5) conduirait<br />

à une “relativité étendue” dont la discussion sortirait du cadre <strong>de</strong> ce cours. On notera que la présence d’un<br />

dénominateur non constant impliquerait l’abandon du postulat d’homogénéité et d’isotropie <strong>de</strong> l’espace associé<br />

à un référentiel galiléen arbitraire<br />

31


On note que ces transformations sont <strong>de</strong>s transformations affines. C’est pourquoi nous<br />

poserons que la variété <strong>de</strong>s événements compatible avec le principe d’inertie et les principes<br />

d’homogénéité <strong>de</strong> l’espace et du temps est un espace affine 9 A4 associé à l’espace vectoriel IR 4 .<br />

Par abus <strong>de</strong> langage, nous i<strong>de</strong>ntifierons A4 et IR 4 .<br />

Les constantes bβ′ et bα sont arbitraires et peuvent être prises égales à 0 par un choix<br />

judicieux <strong>de</strong> l’origine <strong>de</strong>s temps et <strong>de</strong> l’origine <strong>de</strong>s axes spatiaux dans chacun <strong>de</strong>s référentiels<br />

considérés. Par contre, les constantes Aβ′ α et Aα β ′ doivent évi<strong>de</strong>mment dépendre du mouvement<br />

relatif <strong>de</strong>s référentiels galiléens S et S ′ l’un par rapport à l’autre.<br />

3.3 Mouvement relatif <strong>de</strong> <strong>de</strong>ux référentiels galiléens<br />

Il est remarquable que les lois <strong>de</strong> transformation (3.6) et (3.7) permettent <strong>de</strong> spécifier sans<br />

nouvelle hypothèse le mouvement d’un référentiel galiléen par rapport à un autre référentiel<br />

galiléen. Écrivons les relations (3.7) sous la forme plus explicite<br />

x 0 = A 0 0 ′x0′ + A 0 j ′xj′ + b 0 , (3.8)<br />

x i = A i 0 ′x0′ + A i j ′xj′ + b i , (3.9)<br />

et considérons une particule P ′ au repos par rapport au référentiel S ′ . Les coordonnées x j′<br />

<strong>de</strong> P ′ par rapport à S ′ étant <strong>de</strong>s constantes, la différentiation <strong>de</strong>s éqs. (3.8) et (3.9) montre<br />

immédiatement que le vecteur vitesse w <strong>de</strong> P ′ par rapport au référentiel S est un vecteur<br />

constant dont les composantes w i sont données par<br />

w i = dxi<br />

dt<br />

≡ cdxi<br />

dx0 = cAi 0 ′dx0′<br />

A0 0 ′dx0′ = c Ai0 ′<br />

A0 0 ′<br />

. (3.10)<br />

Les composantes constantes w i sont indépendantes <strong>de</strong> la particule au repos par rapport à<br />

S ′ choisie. Par définition, le vecteur constant w est le vecteur vitesse <strong>de</strong> S ′ par rapport à S. Les<br />

formules <strong>de</strong> transformations (3.7) entraînent donc que <strong>de</strong>ux référentiels galiléens S et S ′ sont<br />

en mouvement rectiligne uniforme l’un par rapport à l’autre.<br />

3.4 Intervalle entre <strong>de</strong>ux points-événements<br />

Nous allons voir que l’existence d’une vitesse invariante c entraîne une profon<strong>de</strong> nouveauté<br />

par rapport à l’ancienne physique : l’existence d’un intervalle spatio-temporel entre <strong>de</strong>ux pointsévénements<br />

arbitraires dont la valeur est indépendante du référentiel.<br />

Pour l’établir, donnons-nous <strong>de</strong>ux référentiels galiléens arbitraires S et S ′ et considérons<br />

<strong>de</strong>ux points-événements infiniment voisins x et x + dx. Les coordonnées galiléennes <strong>de</strong> x et<br />

9 On trouvera la définition générale d’un espace affine <strong>de</strong> dimension n dans l’annexe A. Le choix d’un espace<br />

affine comme cadre <strong>de</strong> la physique relativiste fut proposé par le mathématicien Hermann Weyl dès les années<br />

20. Cet auteur affirme en effet “ ... l’univers [en l’absence <strong>de</strong> champ gravitationnel, N.d.A.] est un espace<br />

quadridimensionnel euclidien affine” dans le Chap. III <strong>de</strong> son ouvrage Temps, Espace, Matière : leçons sur la<br />

théorie <strong>de</strong> la relativité générale, trad. franç. <strong>de</strong> la 4 ème édition all. <strong>de</strong> Raum-Zeit-Materie, 1921.<br />

32


x + dx sont respectivement (xα ) et (xα + dxα ) dans S et (xβ′ ) et (xβ′ + dxβ′ ) dans S ′ . Dans<br />

ce paragraphe, nous appelons (L) la transformation du type défini par (3.6) exprimant les<br />

coordonnées (xβ′ ) en fonction <strong>de</strong>s (xα ). On se souviendra que les coefficients Aβ′ α et bβ′ étant<br />

<strong>de</strong>s constantes, on a par différenciation<br />

dx β′<br />

= A β′<br />

α dx α . (3.11)<br />

Supposons d’abord que les points-événements x et x + dx soient reliés par une particule ou<br />

une interaction se propageant avec la vitesse c par rapport à S. Dans ce référentiel, la distance<br />

entre x et x + dx est<br />

dist(x,x + dx) =<br />

<br />

(dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 .<br />

Une propagation avec la vitesse c entre x et x + dx est donc caractérisée par la relation<br />

<br />

(dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 = c|dt| = |dx 0 |,<br />

qui peut encore s’écrire en élevant les <strong>de</strong>ux membres au carré :<br />

(dx 0 ) 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 = 0. (3.12)<br />

D’après le postulat 3.1.4, la propagation considérée s’effectue également avec la vitesse c<br />

par rapport au référentiel galiléen S ′ . La relation<br />

doit donc être satisfaite par les dx β′<br />

(dx 0′<br />

) 2 − (dx 1′<br />

) 2 − (dx 2′<br />

) 2 − (dx 3′<br />

) 2 = 0. (3.13)<br />

définis par (3.11) lorsque les dx α vérifient la condition<br />

(3.12).<br />

Supposons maintenant que x et x + dx soient <strong>de</strong>ux points-événements infiniment proches<br />

arbitraires. Dans S, nous pouvons leur associer l’intervalle ds 2 défini par 10<br />

ds 2 = (dx 0 ) 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 . (3.14)<br />

De même, dans le référentiel galiléen S ′ , nous pouvons leur associer l’intervalle<br />

ds ′2 = (dx 0′<br />

) 2 − (dx 1′<br />

) 2 − (dx 2′<br />

) 2 − (dx 3′<br />

) 2 . (3.15)<br />

D’après ce que nous venons <strong>de</strong> voir, la transformation (L) doit être telle que<br />

ds 2 = 0 =⇒ ds ′2 = 0. (3.16)<br />

Comment (L) transforme-t-elle l’intervalle ds 2 lorsque ds 2 = 0 ? La réponse vient du<br />

théorème suivant, que nous énoncerons sans démonstration.<br />

Théorème 3.4.1 Soit (L) une transformation affine telle que la condition (3.16) soit satisfaite.<br />

Il existe une constante réelle Φ[L] telle que l’égalité<br />

ds ′2 = Φ[L]ds 2 , (3.17)<br />

est réalisée pour n’importe quelle paire <strong>de</strong> points-événements x et x + dx.<br />

10 Nous appelons ds 2 l’intervalle par abus <strong>de</strong> langage. En fait, la notion courante d’intervalle correspondrait à<br />

la racine carrée <strong>de</strong> ds 2 , mais ds 2 n’est pas défini positif, comme on le verra dans la suite...<br />

33


Du point <strong>de</strong> vue mathématique, il est clair que la constante Φ[L] peut recevoir une valeur<br />

arbitraire. Si en effet une transformation (L) satisfait la condition (3.16), la transformation<br />

affine (Lk) définie par<br />

x β′<br />

(k) = k(Aβ′ α x α + b β′<br />

), k = constante = 0<br />

satisfait également cette condition et transforme l’intervalle ds 2 en ds 2 k = Φ[Lk]ds 2 , avec Φ[Lk] =<br />

k 2 Φ[L]. Pour lever cet arbitraire sur Φ[L], il faut maintenant faire intervenir <strong>de</strong>s considérations<br />

physiques.<br />

Tout d’abord Φ[L] ne peut dépendre que <strong>de</strong>s coefficients A β′<br />

α , puisque l’équation (3.17) est<br />

une relation entre les différentielles dx α et dx β′<br />

= A β′<br />

α dx α . Or, les coefficients A β′<br />

α figurant dans<br />

l’expression (3.6) doivent dépendre <strong>de</strong> la vitesse w <strong>de</strong> S par rapport à S ′ . Nous pouvons donc<br />

considérer que le facteur Φ[L] est lui-même une fonction <strong>de</strong> w, ce qui nous conduit à écrire<br />

(3.17) sous la forme<br />

ds ′2 = Φ(w)ds 2 . (3.18)<br />

Mais le postulat d’isotropie <strong>de</strong> l’espace entraîne que le facteur <strong>de</strong> proportionnalité Φ(w)<br />

dépend uniquement <strong>de</strong> la valeur absolue <strong>de</strong> la vitesse w. On peut donc écrire<br />

Bien entendu, on a <strong>de</strong> même<br />

ds ′2 = F(|w|)ds 2 . (3.19)<br />

ds 2 = F(|w ′ |)ds ′2 , (3.20)<br />

où w ′ est la vitesse <strong>de</strong> S par rapport à S ′ . Les équations (3.19) et (3.20) entraînent que<br />

Or, il est manifeste que<br />

F(|w|)F(|w ′ |) = 1. (3.21)<br />

|w ′ | = |w|. (3.22)<br />

En effet, il existe certainement un référentiel galiléen S0 dans lequel les origines O et O ′ se<br />

déplacent sur une droite commune avec <strong>de</strong>s vitesses opposées u0 et −u0. Pour les observateurs<br />

au repos par rapport à S0, les observateurs liés à S et à S ′ sont dans <strong>de</strong>s situations symétriques<br />

et doivent en conséquence s’attribuer <strong>de</strong>s vitesses relatives égales en valeur absolue, sinon le<br />

postulat d’isotropie ne serait pas respecté.<br />

Il résulte <strong>de</strong> (3.21) et (3.22) que [F(|w|)] 2 = 1. Comme on doit poser F = 1 lorsque w = 0,<br />

on prendra<br />

F(|w|) = 1. (3.23)<br />

Par conséquent, les transformations <strong>de</strong> coordonnées galiléennes (3.6) doivent être telles que<br />

l’égalité<br />

ds 2 = ds ′2<br />

(3.24)<br />

soit satisfaite pour n’importe quel couple <strong>de</strong> points-événements infiniment voisins. L’égalité<br />

(3.24) signifie que le ds 2 entre <strong>de</strong>ux points-événements infiniment voisins est une quantité<br />

absolue, i.e. invariante par les changements <strong>de</strong> référentiels et indépendante <strong>de</strong> tout choix d’observateurs.<br />

D’où la proposition suivante, qui constitue la proposition fondamentale sur laquelle<br />

est bâtie toute la théorie.<br />

34


Proposition 3.4.1 (Invariance <strong>de</strong> l’intervalle) Soient S et S ′ <strong>de</strong>ux référentiels galiléens.<br />

Toute transformation (L) exprimant les coordonnées galiléennes d’un point-événement arbitraire<br />

par rapport à S ′ en fonction <strong>de</strong>s coordonnées galiléennes <strong>de</strong> ce point-événement par rapport<br />

à S est une transformation affine (3.6) qui laisse invariantes la valeur et la forme <strong>de</strong><br />

l’intervalle ds 2 défini par (3.14) ou <strong>de</strong> manière équivalente par (3.25)-(3.26) .<br />

Les transformations (3.6) laissant invariant l’intervalle entre <strong>de</strong>ux points-événements sont<br />

appelées transformations <strong>de</strong> Lorentz inhomogènes lorsque les constantes b µ′ ne sont pas toutes<br />

nulles et transformations <strong>de</strong> Lorentz homogènes lorsque b µ′ = 0. Ces transformations forment<br />

un groupe, qu’on appelle le groupe <strong>de</strong> Lorentz. Nous verrons dans le chapitre suivant comment<br />

déterminer ces transformations.<br />

Du fait que l’intervalle ds 2 entre <strong>de</strong>ux points-événements x et x + dx possè<strong>de</strong> une valeur<br />

indépendante du référentiel galiléen choisi, on peut munir la variété fondamentale V4 <strong>de</strong> la<br />

métrique définie par la forme quadratique <strong>de</strong> différentielles (3.14), à laquelle on donne le nom<br />

<strong>de</strong> métrique <strong>de</strong> Minkowski. La variété fondamentale que nous avons i<strong>de</strong>ntifée avec l’espace affine<br />

IR 4 munie <strong>de</strong> cette métrique est appelée l’espace-temps <strong>de</strong> Minkowski. La théorie <strong>de</strong> la relativité<br />

restreinte a pour objet <strong>de</strong> construire la physique dans cet espace-temps.<br />

La métrique (3.14) diffère d’une métrique proprement euclidienne par la présence du signe<br />

- <strong>de</strong>vant chaque terme spatial (dx i ) 2 . D’une manière générale, la différence σ entre le nombre<br />

<strong>de</strong> signes + et le nombre <strong>de</strong> signes - dans la forme diagonale d’une métrique constitue ce qu’on<br />

appelle la signature <strong>de</strong> cette métrique. La signature <strong>de</strong> la métrique <strong>de</strong> Minkowski écrite sous la<br />

forme (3.14) est donc σ = −2.<br />

Nous utiliserons la signature σ = −2 dans ce cours, mais il faut noter qu’on pourrait tout<br />

aussi bien écrire la métrique <strong>de</strong> Minkowski sous la forme<br />

ds 2 = (dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 − (dx 0 ) 2 ,<br />

auquel cas la signature serait égale à 2. L’écriture conventionnelle avec σ = 2 est d’usage<br />

recommandé par l’Union Astronomique Internationale.<br />

Dans un système <strong>de</strong> coordonnées galiléennes (x α ) arbitraire, la métrique <strong>de</strong> l’espace-temps<br />

<strong>de</strong> Minkowski peut s’écrire sous la forme plus con<strong>de</strong>nsée<br />

les quantités ηαβ étant définies par<br />

ds 2 = ηαβ dx α dx β , (3.25)<br />

η00 = 1, η11 = η22 = η33 = −1, ηαβ = 0 si α = β. (3.26)<br />

Dans n’importe quel autre système <strong>de</strong> coordonnées galiléennes (xβ′ ), la métrique s’écrira<br />

bien entendu<br />

avec<br />

ds 2 = ηγ ′ δ ′ dxγ′ dx δ′<br />

, (3.27)<br />

η0 ′ 0 ′ = 1, η1 ′ 1 ′ = η2 ′ 2 ′ = η3 ′ 3 ′ = −1, ηγ ′ δ ′ = 0 si γ′ = δ ′ .<br />

35


3.5 Classification <strong>de</strong>s intervalles. Cône isotrope<br />

Il résulte immédiatement du caractère affine <strong>de</strong>s transformations <strong>de</strong> Lorentz que l’on peut<br />

parler <strong>de</strong> l’invariance <strong>de</strong> l’intervalle entre <strong>de</strong>ux points-événements x et y dont les coordonnées<br />

diffèrent par <strong>de</strong>s quantités finies. Si (x α ) et (y α ) sont les coordonnées galiléennes respectives <strong>de</strong><br />

x et <strong>de</strong> y par rapport à un référentiel galiléen arbitraire, l’intervalle entre x et y est défini par<br />

la relation<br />

s 2 xy = (y 0 − x 0 ) 2 − (y 1 − x 1 ) 2 − (y 2 − x 2 ) 2 − (y 3 − x 3 ) 2 , (3.28)<br />

qui s’écrit encore<br />

s 2 xy = ηαβ(y α − x α )(y β − x β ), (3.29)<br />

Soient <strong>de</strong>ux points-événements x et y distincts. Cherchons sous quelle condition il existe<br />

un référentiel galiléen S0 dans lequel ces <strong>de</strong>ux points-événements ont les mêmes coordonnées<br />

spatiales. Dans un tel référentiel, l’intervalle s 2 xy aura pour expression<br />

s 2 xy = (y 0 0 − x 0 0) 2<br />

puisque par hypothèse x i 0 = y i 0 pour i = 1, 2, 3. L’équation (3.30) montre qu’on doit avoir<br />

(3.30)<br />

s 2 xy > 0. (3.31)<br />

On dit qu’un intervalle satisfaisant à la condition (3.31) est du genre temps.<br />

Par définition, x et y sont simultanés dans un référentiel S si y 0 = x 0 dans ce référentiel.<br />

Pour qu’un tel référentiel existe, il faut que la condition<br />

s 2 xy < 0 (3.32)<br />

soit satisfaite. Si en effet on a y 0 = x 0 dans S, l’intervalle s 2 xy a pour expression<br />

s 2 xy = −(y 1 − x 1 ) 2 − (y 2 − x 2 ) 2 − (y 3 − x 3 ) 2<br />

Un intervalle satisfaisant à la condition (3.32) est dit du genre espace.<br />

Enfin, l’intervalle entre x et y est dit isotrope si<br />

(3.33)<br />

s 2 xy = 0. (3.34)<br />

L’équation (3.34) est la condition nécessaire et suffisante pour qu’une particule se mouvant<br />

(ou une interaction se propageant) avec la vitesse c puisse relier x et y.<br />

Les conditions (3.31), (3.32) et (3.34) sont complètement indépendantes du référentiel<br />

puisque l’intervalle est un invariant. La classification qui en résulte a donc une signification absolue.<br />

Cette classification conduit à introduire en chaque point-événement x l’objet géométrique<br />

intrinsèque (i.e. indépendant du référentiel) qu’on appelle le cône isotrope 11 <strong>de</strong> sommet x.<br />

11 On dit aussi cône <strong>de</strong> lumière <strong>de</strong> sommet x, mais nous éviterons cette terminologie pour les raisons invoquées<br />

à la fin <strong>de</strong> la sect. 3.1.<br />

36


Γ<br />

+<br />

x<br />

Ailleurs <strong>de</strong> x<br />

Γ<br />

−<br />

x<br />

Futur <strong>de</strong> x<br />

x<br />

Passé <strong>de</strong> x<br />

Ailleurs <strong>de</strong> x<br />

Fig. 3.1 – Passé, futur, et ailleurs d’un point x.<br />

Définition 3.5.1 (Cône isotrope <strong>de</strong> sommet x) Étant donné un point-événement x quelconque,<br />

on appelle cône isotrope <strong>de</strong> sommet x et on note Γx l’ensemble <strong>de</strong>s points-événements<br />

y tels que l’intervalle entre x et y soit nul. Dans un référentiel galiléen arbitraire, l’équation du<br />

cône Γx est :<br />

s 2 xy ≡ ηαβ(y α − x α )(y β − x β ) = 0. (3.35)<br />

Le cône Γx est composé du point x, d’une nappe Γ + x correspondant à y 0 −x 0 > 0, dite nappe<br />

future, et d’une nappe Γ − x correspondant à y 0 − x 0 < 0, dite nappe passée. Le cône isotrope <strong>de</strong><br />

sommet x divise donc l’espace-temps <strong>de</strong> Minkowski en trois régions attachées à x (voir fig. 3.1).<br />

1. Le futur <strong>de</strong> x, défini comme l’ensemble Fx <strong>de</strong>s points-événements y tels que s 2 xy ≥ 0 et<br />

y 0 − x 0 > 0 :<br />

Fx = {y | s 2 xy ≥ 0 et y 0 − x 0 > 0}. (3.36)<br />

2. Le passé <strong>de</strong> x, défini comme l’ensemble Px <strong>de</strong>s points-événements y tels que s 2 xy ≥ 0 et<br />

y 0 − x 0 < 0 :<br />

Px = {y | s 2 xy ≥ 0 et y 0 − x 0 < 0}. (3.37)<br />

3. L’ailleurs <strong>de</strong> x, défini comme l’ensemble Ax <strong>de</strong>s points-événements y tels que s 2 xy < 0 :<br />

Ces dénominations se comprennent par elles-mêmes.<br />

3.6 Lignes d’univers du genre temps<br />

Ax = {y | s 2 xy < 0}. (3.38)<br />

On dira qu’un point-événement x appartient à l’histoire d’une particule si la particule<br />

coïnci<strong>de</strong> avec l’événement x au moment où il se produit. D’après ce qui a été expliqué dans le<br />

premier chapitre, cette notion est totalement indépendante du choix d’un système <strong>de</strong> référence.<br />

37


Donnons-nous un référentiel galiléen arbitraire S rapporté à un système <strong>de</strong> coordonnées<br />

galilénnes (x 0 ,x i ) et considérons une particule P <strong>de</strong> vecteur vitesse v par rapport à S, ce vecteur<br />

pouvant varier au cours du temps. Soient x et x+dx <strong>de</strong>ux points-événements infiniment voisins<br />

appartenant à l’histoire <strong>de</strong> P. Compte tenu <strong>de</strong> la relation dx = vdt, l’élément d’intervalle ds 2<br />

entre ces <strong>de</strong>ux points-événements est d’après (3.14) :<br />

x<br />

0<br />

O<br />

ds 2 = c 2 dt 2 − dx 2 = (c 2 − |v| 2 )dt 2 . (3.39)<br />

x<br />

2<br />

x (s)<br />

Fig. 3.2 – Ligne d’univers d’une particule.<br />

On voit que ds2 > 0 si et seulement si |v| < c. Or, ds2 est un invariant. On peut donc écrire<br />

ds2 = (c2 − |v ′ | 2 )dt ′2 dans tout référentiel galiléen S ′ rapporté à <strong>de</strong>s coordonnées galiléennes<br />

(x0′ ,xj′ ), v ′ étant la vitesse <strong>de</strong> P par rapport à S ′ . D’où la proposition qui suit.<br />

Proposition 3.6.1 Si une particule est <strong>de</strong> vitesse |v| < c en x dans un référentiel galiléen,<br />

alors cette particule est <strong>de</strong> vitesse inférieure à c en x dans tous les référentiels galiléens.<br />

Un corollaire immédiat <strong>de</strong> ce qui précè<strong>de</strong> est que si une particule avait une vitesse |v| > c<br />

dans un référentiel galiléen donné, elle aurait une vitesse supérieure à c dans n’importe quel<br />

autre référentiel galiléen. Enfin, on retrouve évi<strong>de</strong>mment à partir <strong>de</strong> (3.39) qu’une particule <strong>de</strong><br />

vitesse |v| égale à c dans S sera également <strong>de</strong> vitesse c dans n’importe quel autre référentiel,<br />

ce qui est naturel puisque c est par hypothèse une vitesse invariante.<br />

On dira qu’un référentiel galiléen S0 est instantanément comouvant avec la particule en x<br />

lorsque x et x + dx ont les mêmes coordonnées spatiales dans S0, i.e. lorsque (dx i )S0 = 0.<br />

Cette définition signifie simplement que la particule P est au repos instantané par rapport à<br />

S0 au moment où se produit l’événement x. Or, d’après ce que nous avons vu dans la section<br />

précé<strong>de</strong>nte, cette occurrence se réalise uniquement si ds 2 > 0. Il faut donc que la condition<br />

|v| < c soit satisfaite dans un référentiel galiléen arbitraire. Un référentiel galiléen <strong>de</strong>vant<br />

évi<strong>de</strong>mment être comouvant avec chacun <strong>de</strong> ses points (i.e. avec chacune <strong>de</strong>s particules qui lui<br />

sont liées), on est conduit à formuler la proposition qui suit.<br />

38<br />

x<br />

1


Proposition 3.6.2 La valeur absolue <strong>de</strong> la vitesse relative <strong>de</strong> <strong>de</strong>ux référentiels galiléens arbitraires<br />

est toujours inférieure à la vitesse fondamentale c.<br />

Il est dès lors naturel <strong>de</strong> supposer que les observateurs sont constitués <strong>de</strong> particules dont<br />

la vitesse est toujours inférieure à c. Il est en effet difficile <strong>de</strong> concevoir un observateur (i.e. un<br />

instrument <strong>de</strong> physique) qui ne pourrait être au repos par rapport à aucun référentiel galiléen.<br />

C’est pourquoi nous poserons le postulat qui suit.<br />

Postulat 3.6.1 Soit P un observateur considéré comme ponctuel, décrit dans un référentiel<br />

galiléen arbitraire muni d’un système <strong>de</strong> coordonnées galiléennes (x 0 ,x 1 ,x 2 ,x 3 ), avec x 0 = ct.<br />

Pour tout couple d’événements infiniment voisins appartenant à l’histoire <strong>de</strong> cet observateur,<br />

l’inégalité<br />

ds 2 = c 2 dt 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 > 0 (3.40)<br />

est satisfaite.<br />

La condition (3.40) traduit simplement le postulat qu’un observateur a toujours une vitesse<br />

inférieure à c dans n’importe quel référentiel galiléen. En fait, on admet <strong>de</strong> façon plus générale<br />

qu’il n’existe pas <strong>de</strong> particules ayant une vitesse > c. On peut montrer en effet que l’existence<br />

<strong>de</strong> telles particules (tachyons) entraînerait <strong>de</strong>s violations <strong>de</strong> la causalité.<br />

Il découle <strong>de</strong> ce qui précè<strong>de</strong> que les courbes <strong>de</strong> l’espace-temps le long <strong>de</strong>squelles l’inégalité<br />

(3.40) est satisfaite jouent un rôle fondamental dans la théorie puisqu’elles peuvent être considérées<br />

comme <strong>de</strong>s histoires d’observateurs possibles. On les appelle lignes d’univers du genre temps<br />

(fig. 3.2).<br />

3.7 Temps propre<br />

Par hypothèse, la particule considérée dans ce qui suit possè<strong>de</strong> une ligne d’univers du genre<br />

temps. On désigne par x et x + dx <strong>de</strong>ux points-événements infiniment voisins appartenant à<br />

l’histoire <strong>de</strong> cette particule : x + dx est supposé situé dans le futur <strong>de</strong> x, et on adopte dès lors<br />

la convention ds > 0 pour l’intervalle entre x et x + dx.<br />

Par rapport au référentiel S0 instantanément comouvant en x avec cette particule (cf. section<br />

précé<strong>de</strong>nte), l’intervalle ds 2 entre x et x + dx a pour expression d’après (3.30) :<br />

ce qui entraîne avec notre convention <strong>de</strong> signe sur ds :<br />

ds 2 = c 2 dt 2 0 , (3.41)<br />

ds = cdt0 . (3.42)<br />

D’après la partie a) du postulat 3.1.2, dt0 est la durée mesurée entre x et x + dx par une<br />

horloge standard au repos par rapport à S0. La quantité dt0 représente donc ce qu’on peut<br />

appeler le laps <strong>de</strong> temps propre dτ mesuré entre x et x + dx par une horloge standard H0 en<br />

mouvement inertiel instantanément comouvante avec la particule P. Si la particule P est ellemême<br />

en mouvement inertiel (particule isolée), il est naturel <strong>de</strong> regar<strong>de</strong>r la quantité dτ donnée<br />

par<br />

dτ = ds<br />

(3.43)<br />

c<br />

39


comme le laps <strong>de</strong> temps propre <strong>de</strong> la particule écoulé entre les points-événements x et x + dx.<br />

Cette i<strong>de</strong>ntification <strong>de</strong> dt0 avec un laps <strong>de</strong> temps propre infinitésimal <strong>de</strong> la particule s’impose<br />

d’elle-même.<br />

Lorsque la particule P est animée d’un mouvement quelconque (mouvement non inertiel ou<br />

accéléré), la relation (3.42) et l’interprêtation <strong>de</strong> dt0 comme temps propre <strong>de</strong> H0 restent vraies<br />

mais il ne va plus <strong>de</strong> soi qu’on peut i<strong>de</strong>ntifier dt0 avec un laps <strong>de</strong> temps propre <strong>de</strong> la particule<br />

accélérée. On admet néanmoins cette i<strong>de</strong>ntification en la posant comme une définition.<br />

Définition 3.7.1 Soit P une particule dont la ligne d’univers est du genre temps. On appelle<br />

temps propre <strong>de</strong> cette particule entre <strong>de</strong>ux événements x et x + dx <strong>de</strong> son histoire la quantité<br />

dτ définie par<br />

dτ = ds<br />

. (3.44)<br />

c<br />

Il faut souligner que la relation (3.44) est complètement indépendante du référentiel choisi,<br />

ainsi que du système <strong>de</strong> coordonnées adopté. Nous avons vu en effet que ds est une quantité<br />

invariante attachée à <strong>de</strong>ux points-événements x et x + dx : une telle quantité est absolue.<br />

Dans la pratique, il sera souvent indispensable d’expliciter dτ en fonction <strong>de</strong>s coordonnées.<br />

Lorsqu’on choisit un référentiel galiléen arbitraire S rapporté à un système <strong>de</strong> coordonnés<br />

galiléennes x 0 = ct,x i , on a évi<strong>de</strong>mment<br />

dτ = 1<br />

c<br />

c<br />

2dt2 − (dx1 ) 2 − (dx2 ) 2 − (dx3 ) 2 . (3.45)<br />

La définition 3.7.1 est adoptée parce que l’expérience montre que le temps propre délivré<br />

par une horloge atomique idéale satisfait la relation (3.44), au moins tant que l’accélération <strong>de</strong><br />

cette horloge n’est pas trop gran<strong>de</strong>... C’est pourquoi on adopte en pratique le postulat suivant.<br />

Postulat 3.7.1 (Hypothèse <strong>de</strong>s horloges atomiques) Le laps <strong>de</strong> temps dτ mesuré entre<br />

<strong>de</strong>ux événements x et x + dx <strong>de</strong> l’histoire d’une horloge atomique idéale ne dépend pas <strong>de</strong><br />

l’accélération <strong>de</strong> cette <strong>de</strong>rnière et satisfait la relation dτ = ds/c.<br />

Le postulat 3.7.1 équivaut à l’hypothèse que <strong>de</strong>ux atomes i<strong>de</strong>ntiques situés au même pointévénement<br />

et instantanément comouvants présentent le même spectre <strong>de</strong> raies à un observateur<br />

donné, indépendamment <strong>de</strong> leurs accélérations respectives 12 . Il faut souligner le caractère approché<br />

<strong>de</strong> ce postulat, qui contraste avec les postulats précé<strong>de</strong>nts que l’on pouvait tenir pour<br />

rigoureux. On ne voit en effet pas pourquoi les raies spectrales d’un atome seraient totalement<br />

insensibles à l’accélération <strong>de</strong> ce <strong>de</strong>rnier. Néanmoins, on peut noter que l’accélération <strong>de</strong>s atomes<br />

utilisés dans les horloges atomiques dans les conditions expérimentales usuelles est bien plus<br />

faible que l’accélération d’un électron autour du noyau. Le postulat 3.7.1 paraît donc légitime<br />

et n’est contredit par aucune expérience.<br />

12 En toute rigueur, il faut restreindre cet énoncé aux raies <strong>de</strong> très hautes fréquences telles que celles qui sont<br />

utilisées dans les horloges actuelles (approximation <strong>de</strong> l’optique géométrique). Pour les basses fréquences, l’effet<br />

Doppler est affecté par l’accélération <strong>de</strong> la source (ainsi que par l’accélération <strong>de</strong> l’observateur).<br />

40


Compte tenu <strong>de</strong> (3.39), l’équation (3.44) donne la relation suivante entre la différentielle <strong>de</strong><br />

temps propre et la différentielle <strong>de</strong> temps coordonnée :<br />

<br />

<br />

v 2<br />

dτ = dt 1 −<br />

c<br />

. (3.46)<br />

On écrit souvent (3.46) sous la forme<br />

où Γ est défini par<br />

Γ =<br />

dt<br />

dτ<br />

<br />

= Γ, (3.47)<br />

1<br />

1 − v<br />

c<br />

Γ est appelé le facteur <strong>de</strong> Lorentz 13 .<br />

Il résulte immédiatement <strong>de</strong> (3.48) que Γ = 1 si v = 0 et<br />

2 . (3.48)<br />

Γ > 1 si v = 0. (3.49)<br />

L’inégalité (3.49) est équivalente à dt > dτ si v = 0. C’est pourquoi on appelle (3.47)<br />

la formule <strong>de</strong> dilatation <strong>de</strong>s durées. Il faut toutefois faire très attention à la signification <strong>de</strong>s<br />

quantités qui interviennent dans cette formule. La quantité dτ est indépendante du référentiel<br />

dans lequel on décrit le mouvement (on a souligné ci-<strong>de</strong>ssus que dτ est une quantité intrinsèque).<br />

Par contre, dt et v sont <strong>de</strong>s quantités qui dépen<strong>de</strong>nt du référentiel dans lequel on décrit le<br />

mouvement.<br />

Bien entendu, les relations (3.44) et (3.45) peuvent être intégrées le long <strong>de</strong> la ligne d’univers<br />

d’une particule. On obtient alors la proposition fondamentale suivante.<br />

Proposition 3.7.1 Soit P une particule dont la ligne d’univers C est <strong>de</strong> genre temps. On<br />

appelle x1 et x2 <strong>de</strong>ux points-événements <strong>de</strong> l’histoire <strong>de</strong> cette particule, numérotés <strong>de</strong> telle sorte<br />

que x2 soit dans le futur <strong>de</strong> x1. Le temps propre τ12[C] mesuré entre x1 et x2 par une horloge<br />

standard comouvante avec la particule P est alors donné par<br />

x2<br />

τ12[C] =<br />

x1<br />

dτ = 1<br />

c<br />

x2<br />

ds, (3.50)<br />

où les intégrales sont <strong>de</strong>s intégrales curvilignes prises le long <strong>de</strong> C.<br />

Soit<br />

x α = x α (ℓ) (3.51)<br />

un système d’équations paramétriques <strong>de</strong> la ligne d’univers <strong>de</strong> P dans un système <strong>de</strong> coordonnées<br />

galiléennes xα arbitrairement choisi, les xα (ℓ) désignant <strong>de</strong>s fonctions continûment<br />

différentiables d’un paramètre réel ℓ lui-même arbitrairement choisi. Si on appelle ℓ1 et ℓ2 les<br />

valeurs <strong>de</strong> ℓ correspondant respectivement à x1 et à x2, τ12[C] est alors donné par<br />

ℓ2<br />

τ12[C] =<br />

l’intégrale étant prise le long <strong>de</strong> C.<br />

ℓ1<br />

dx 0<br />

dℓ<br />

2 − dx 1<br />

dℓ<br />

x1<br />

2 − dx 2<br />

dℓ<br />

2 <br />

dx3 2<br />

− dℓ<br />

dℓ, (3.52)<br />

13 Ce facteur est très souvent représenté par la lettre γ, mais nous évitons cette notation pour éviter tout<br />

risque <strong>de</strong> confusion avec le paramètre postnewtonien γ dans les théories <strong>de</strong> la gravitation.<br />

41


Le paramétre ℓ intervenant dans l’éq. (3.52) étant arbitraire, nous pouvons prendre le tempscoordonnée<br />

t comme paramètre, et la formule (3.52) s’écrit alors<br />

De l’inégalité<br />

t2<br />

τ12[C] =<br />

t1<br />

<br />

1 − 1<br />

c2 <br />

dxdt 2dt t2<br />

=<br />

t1<br />

<br />

1 − 1<br />

c2 2 dxdt ≤ 1, on déduit qu’on a toujours<br />

dt<br />

. (3.53)<br />

Γ<br />

τ12[C] ≤ t2 − t1 . (3.54)<br />

L’égalité τ12[C] = t2 − t1 est réalisée si et seulement si la vitesse <strong>de</strong> P par rapport à S est<br />

constamment nulle. Dans tous les autres cas, on a l’inégalité au sens strict<br />

τ12[C] < t2 − t1 . (3.55)<br />

L’inégalité (3.55) s’applique en particulier lorsque x1 et x2 sont <strong>de</strong>s événements se produisant<br />

au même point A <strong>de</strong> l’espace du référentiel S, alors que la particule P n’est pas au repos par<br />

rapport à S entre x1 et x2 (fig. 3.3). L’inégalité (3.55) constitue alors ce qu’on a appelé le<br />

“paradoxe <strong>de</strong>s jumeaux” ou encore le “paradoxe du voyageur <strong>de</strong> Langevin”. La différence t2 −t1<br />

est en effet le temps propre vécu entre x1 et x2 par un observateur au repos en A, tandis que<br />

τ12[C] est le temps propre vécu par un observateur OC comouvant avec la particule P. Si on<br />

appelle C0 la ligne d’univers d’un observateur au repos en A, la formule (3.53) donne<br />

et l’inégalité (3.55) <strong>de</strong>vient<br />

t2 − t1 = τ12[C0]<br />

τ12[C] < τ12[C0],<br />

ce qui montre qu’entre les événements x1 et x2, l’observateur au repos en A a vieilli davantage<br />

que l’observateur qui a voyagé.<br />

Cette conséquence remarquable <strong>de</strong> la relativité restreinte a été vérifiée expérimentalement<br />

avec <strong>de</strong>s horloges atomique embarquées à bord d’un avion effectuant le tour <strong>de</strong> la Terre 14 , ainsi<br />

qu’avec <strong>de</strong>s muons du rayonnement cosmique 15 .<br />

On remarque qu’un observateur au repos en A par rapport à S est en mouvement rectiligne<br />

uniforme dans n’importe quel autre référentiel galiléen. Comme l’inégalité τ[C0] ≤ τ[C] est<br />

invariante par les changements <strong>de</strong> référentiels, nous pouvons énoncer la proposition suivante.<br />

Proposition 3.7.2 Soient x1 et x2 <strong>de</strong>ux points-événements distincts reliés par la ligne d’univers<br />

C d’une particule P dont la vitesse est constamment inférieure à c. Si C0 désigne la droite<br />

<strong>de</strong> l’espace-temps <strong>de</strong> Minkowski passant par x1 et x2, l’inégalité<br />

τ12[C] ≤ τ12[C0] (3.56)<br />

est satisfaite, l’égalité étant réalisée si et seulement si C est confondue avec C0.<br />

14 Expérience <strong>de</strong> Hafele et Keating. Voir par ex. J. C. Hafele, American Journal of Physics, vol. 40, p. 81<br />

(1972).<br />

15 Expérience <strong>de</strong> D. H. Frisch et J. H. Smith, American Journal of Physics, vol. 31, p. 342 (1963). Une analyse<br />

très claire est donnée par Y. Simon, Relativité restreinte, Cours et applications, Vuibert, 2004.<br />

42


ct<br />

ct<br />

x<br />

0<br />

2 2<br />

x<br />

x<br />

1 1<br />

i i x = x = x<br />

1<br />

C C<br />

0<br />

2<br />

i<br />

A<br />

Fig. 3.3 – “Paradoxe <strong>de</strong>s jumeaux” : on a τ12[C] < t2 − t1, alors que τ12[C0] = t2 − t1.<br />

Il résulte <strong>de</strong> cette proposition que la droite <strong>de</strong> genre temps C0 reliant x1 et x2 réalise la<br />

ligne d’univers <strong>de</strong> plus long temps propre entre x1 et x2. Étant donné que ds et dτ diffèrent par<br />

un facteur constant, on peut énoncer que C0 réalise un extremum (ici un maximum) <strong>de</strong> ds.<br />

Cette propriété fondamentale signifie que la ligne d’univers d’une particule libre (mouvement<br />

inertiel) est une géodésique16 du genre temps <strong>de</strong> l’espace-temps <strong>de</strong> Minkowski.<br />

On notera que la propriété <strong>de</strong> C0 <strong>de</strong> réaliser le plus long temps propre est en contraste<br />

total avec la propriété bien connue <strong>de</strong> la droite euclidienne usuelle <strong>de</strong> réaliser comme on le<br />

sait le plus court chemin spatial entre <strong>de</strong>ux points donnés. En fait, la propriété <strong>de</strong> longueur<br />

temporelle maximale <strong>de</strong> C0 est due à la présence du signe - <strong>de</strong>vant chacun <strong>de</strong>s termes (dxi ) 2<br />

dans la métrique <strong>de</strong> Minkowski.<br />

Exercice : mouvement uniformément accéléré au sens relativiste.— On considère<br />

un observateur P dont la ligne d’univers C est définie dans un référentiel galiléen S par les<br />

équations paramétriques 17 :<br />

x 0 = c2 aτ<br />

sinh ,<br />

a c<br />

x<br />

(3.57)<br />

1 = c2<br />

<br />

cosh<br />

a<br />

aτ<br />

<br />

− 1 ,<br />

c<br />

(3.58)<br />

x 2 = 0, (3.59)<br />

x 3 = 0, (3.60)<br />

où τ varie entre 0 et ∞ et a est une constante ayant la dimension d’une accélération (m.s −2 ).<br />

On suppose a > 0.<br />

1. Déterminer x 1 en fonction du temps t = x 0 /c. En déduire l’expression <strong>de</strong> la vitesse<br />

v 1 = dx 1 /dt et <strong>de</strong> la dérivée dv 1 /dt en fonction <strong>de</strong> t. Montrer que le mouvement défini par<br />

(3.57)-(3.60) se confond pratiquement avec un mouvement uniformément accéléré au sens usuel<br />

le long <strong>de</strong> l’axe <strong>de</strong>s x 1 lorsque t


une expression approchée <strong>de</strong> x 1 (t),v 1 (t) et dv 1 (t)/dt lorsque t >> c/a. Comment interprêter<br />

ces résultats ?<br />

2. Calculer (x 0 ) 2 −(x 1 +c 2 /a) 2 en tout point <strong>de</strong> C. En déduire la nature géométrique <strong>de</strong> C.<br />

Donner une représentation graphique <strong>de</strong> C dans le plan Ox 1 x 0 . Cette représentation graphique<br />

permet-elle <strong>de</strong> comprendre les réponses apportées à la première question ?<br />

3. Déterminer le temps propre <strong>de</strong> la particule entre le point-événement correspondant à τ0<br />

et le point-événement correspondant à τ. Comment peut-on interprêter le paramètre τ figurant<br />

dans (3.57) et (3.58) ?<br />

4. Exprimer ce temps propre en fonction <strong>de</strong> la coordonnée t. Appliquer la formule obtenue<br />

en posant a = g = 9, 81 m.s −1 dans les cas suivants : a) t = 1 jour ; b) t = 10 6 années. On<br />

prendra c = 3×10 8 m.s −1 , 1 jour = 86400 s, 1 année = 3, 15569×10 7 s. Commenter les résultats<br />

obtenus.<br />

Solution.<br />

1. Les équations (3.59) et (3.60) montrent que le mouvement <strong>de</strong> P s’effectue sur l’axe <strong>de</strong>s<br />

x 1 . Il est facile d’éliminer le paramètre τ entre les éqs. (3.57) et (3.58). En utilisant l’i<strong>de</strong>ntité<br />

cosh 2 x − sinh 2 x = 1 l’équation (3.57) peut s’écrire<br />

x 1 = c2<br />

a<br />

<br />

1 + sinh 2 aτ<br />

c<br />

<br />

− 1<br />

(3.61)<br />

Or, d’après (3.57)<br />

sinh aτ at<br />

= . (3.62)<br />

c c<br />

Substituons dans (3.61). On obtient l’équation horaire cherchée :<br />

x 1 = c2<br />

⎡<br />

⎣ 1 +<br />

a<br />

a2t2 ⎤<br />

− 1⎦<br />

. (3.63)<br />

c2 On déduit <strong>de</strong> (3.63) l’expression <strong>de</strong> la vitesse<br />

qui s’écrit encore<br />

v 1 = dx1<br />

dt =<br />

v 1 =<br />

at<br />

<br />

1 + a2 t 2<br />

c 2<br />

c<br />

<br />

1 + c2<br />

a 2 t 2<br />

La dérivée <strong>de</strong> v 1 par rapport à t est donnée par<br />

dv 1<br />

dt =<br />

<br />

a<br />

1 + a2 t 2<br />

c 2<br />

L’équation (3.66) montre immédiatement que<br />

dv 1<br />

dt<br />

(3.64)<br />

. (3.65)<br />

3/2 . (3.66)<br />

≈ a (3.67)<br />

lorsque t


préeinsteinienne. On notera que pour a = g = 9, 81 m.s −2 , on a c/a = 3, 06 × 10 7 s ≈ 1 an.<br />

Cette durée permet <strong>de</strong> comprendre pourquoi la différence entre les <strong>de</strong>ux mouvements n’est pas<br />

facilement décelable dans les conditions d’expérimentations usuelles.<br />

La formule (3.64) montre que lorsque t s’accroît, la vitesse <strong>de</strong> P s’approche indéfiniment <strong>de</strong><br />

la vitesse constante c. Lorsque t >> c/a, on peut négliger 1 dans le radical<br />

écrire<br />

x 1 (t) ≈ ct, v 1 dv<br />

(t) ≈ c,<br />

1<br />

≈ 0. (3.68)<br />

dt<br />

<br />

1 + a2 t 2<br />

c 2 et on peut<br />

Vu dans le référentiel S, le mouvement <strong>de</strong> P tend à se confondre avec un mouvement<br />

uniforme s’effectuant avec la vitesse c, sans jamais toutefois atteindre cette limite !<br />

2. L’i<strong>de</strong>ntité cosh 2 x − sinh 2 x = 1 entraîne que<br />

(x 0 ) 2 −<br />

<br />

x 1 + c2<br />

a<br />

2<br />

= − c4<br />

a 2.<br />

(3.69)<br />

Cette équation montre que la ligne d’univers <strong>de</strong> P est un arc d’hyperbole admettant la<br />

droite isotrope x0 = x1 + c2 comme asymptote lorsque τ → ∞.<br />

a<br />

3. Considérons <strong>de</strong>ux points-événements infiniment voisins x et x+dx appartenant à la ligne<br />

d’univers <strong>de</strong> P. En différentiant les équations par rapport au paramètre τ, on voit que<br />

dx 0 = c cosh aτ<br />

c dτ, dx1 = c sinh aτ<br />

c dτ, dx2 = 0, dx 3 = 0. (3.70)<br />

L’élément ds 2 le long <strong>de</strong> C est donc donné par<br />

ds 2 = (dx 0 ) 2 − (dx 1 ) 2 = c 2<br />

<br />

cosh 2 aτ<br />

c − sinh2 <br />

aτ<br />

dτ<br />

c<br />

2 = c 2 dτ 2 . (3.71)<br />

On en conclut que le paramètre τ figurant dans les équations (3.57)-(3.60) est le laps <strong>de</strong> temps<br />

propre <strong>de</strong> l’observateur qui s’écoule entre le point-événement (0, 0, 0, 0) et le point-événement<br />

x(τ) dont les coordonnées sont données par les équations (3.57)-(3.60).<br />

4. On peut écrire (3.57) sous la forme<br />

at<br />

c<br />

= sinh aτ<br />

c<br />

. (3.72)<br />

On sait que l’inverse <strong>de</strong> la fonction sinus hyperbolique est la fonction sinh −1 x = ln(x+ √ 1 + x 2 ).<br />

On tire donc immédiatement <strong>de</strong> (3.72)<br />

τ = c<br />

a ln<br />

⎡<br />

⎣ at<br />

c +<br />

<br />

Si at/c > 1, (3.72) donne<br />

1 + a2 t 2<br />

c 2<br />

⎤<br />

⎦. (3.73)<br />

τ = t − 1 a<br />

6<br />

2<br />

c2 t3 + ... (3.74)<br />

τ ≈ c 2at<br />

ln . (3.75)<br />

a c<br />

45


Exemples numériques.— Afin <strong>de</strong> pouvoir appliquer ces calculs à <strong>de</strong>s astronautes, on a pris<br />

une accélération a égale à l’accélération g <strong>de</strong> la pesanteur terrestre. On doit donc remplacer<br />

a/c par g/c = 3, 27 × 10 −8 .<br />

a) Si t = 1 jour = 86400 s, on a gt/c = 2, 825×10 −3 . La formule (3.74) peut donc s’appliquer.<br />

Il vient<br />

τ = 1 jour − 0, 115 s. (3.76)<br />

Cette différence serait évi<strong>de</strong>mment mesurable avec une bonne montre à quartz. On peut alors<br />

se <strong>de</strong>man<strong>de</strong>r pourquoi on ne met pas facilement en évi<strong>de</strong>nce l’effet voyageur <strong>de</strong> Langevin. Pour<br />

le comprendre, calculons la distance x 1 parcourue par l’observateur P pendant cette journée.<br />

D’après (3.63), x 1 = 36, 6 millions <strong>de</strong> km, soit approximativement la moitié <strong>de</strong> la distance<br />

Terre-Mars lors d’une conjonction <strong>de</strong>s <strong>de</strong>ux planètes ! Noter qu’on trouverait pratiquement la<br />

même distance parcourue en utilisant la loi horaire usuelle x 1 ≈ 1<br />

2 gt2 . C’est naturel puisqu’on<br />

est ici dans le cas où t est nettement inférieur à c/g. En effet c/g ≈ 3 × 10 7 s ≈ 1 an.<br />

b) Si t = 10 6 ans = 3, 15569 × 10 7 s, on obtient avec (3.75)<br />

τ = 14, 1 ans. (3.77)<br />

La différence avec la valeur <strong>de</strong> t = 10 6 ans est ici énorme. La distance x 1 parcourue est alors<br />

<strong>de</strong> l’ordre <strong>de</strong> 10 6 années-lumière puisque la majeure partie du parcours s’effectue à une vitesse<br />

très voisine <strong>de</strong> celle <strong>de</strong> la lumière (on le voit aisément avec l’éq. (3.65)). On en conclut qu’un<br />

voyage aller-retour entre la Terre et un objet situé à <strong>de</strong>ux millions d’années-lumière 18 avec un<br />

accélération <strong>de</strong> 1 g ne durerait que 4 × 14, 1 = 56, 4 ans pour l’astronaute, alors qu’il se serait<br />

écoulé quatre millions d’années sur Terre <strong>de</strong>puis son départ... L’aventure vous tenterait-elle ?<br />

18 Tel est l’ordre <strong>de</strong> gran<strong>de</strong>ur <strong>de</strong> la distance entre notre Galaxie et la galaxie d’Andromè<strong>de</strong>.<br />

46


Chapitre 4<br />

Cinématique relativiste<br />

Ce chapitre est consacré à la formulation “tridimensionnelle” <strong>de</strong> la cinématique <strong>de</strong> la relativité<br />

restreinte.<br />

4.1 Notations<br />

Dans le chapitre précé<strong>de</strong>nt, nous avons postulé qu’on peut associer à tout référentiel galiléen<br />

S un espace affine proprement euclidien E3[S]. Un repère (O,ei) (i = 1, 2, 3) étant choisie dans<br />

E3[S], on représentera un 3-vecteur <strong>de</strong> composantes a i par rapport à ce repère indifféremment<br />

par le triplet (a 1 ,a 2 ,a 3 ) ou par la lettre grasse a définie par a = a i ei. Le repère (O,ei) sera<br />

toujours supposé orthonormé. En conséquence, le produit scalaire <strong>de</strong> <strong>de</strong>ux 3-vecteurs a =<br />

(a 1 ,a 2 ,a 3 ) et b = (b 1 ,b 2 ,b 3 ) aura pour expression<br />

a.b = a 1 b 1 + a 2 b 2 + a 3 b 3 . (4.1)<br />

4.2 Transformations spéciales <strong>de</strong> Lorentz<br />

Donnons-nous <strong>de</strong>ux référentiels galiléens S et S ′ en mouvement l’un par rapport à l’autre.<br />

Nous avons vu dans le chapitre précé<strong>de</strong>nt que les coordonnées galiléennes (xα ) d’un pointévénement<br />

x par rapport à S s’expriment en fonction <strong>de</strong>s coordonnées galiléennes (xβ′ ) <strong>de</strong> ce<br />

point-événement par rapport à S ′ par <strong>de</strong>s relations affines<br />

x α = A α β ′xβ′ + b α<br />

(A α β ′ = const., bα = const.) (4.2)<br />

ayant la propriété <strong>de</strong> laisser invariantes la valeur et la forme <strong>de</strong> l’intervalle élémentaire ds 2 , i.e.<br />

d’être telles que<br />

(dx 0 ) 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 = (dx 0′<br />

) 2 − (dx 1′<br />

) 2 − (dx 2′<br />

) 2 − (dx 3′<br />

) 2 . (4.3)<br />

Les constantes bα sont arbitraires, alors que les constantes Aα β ′ dépen<strong>de</strong>nt <strong>de</strong> la vitesse w<br />

<strong>de</strong> S ′ par rapport à S. Les équations (3.10) du chap. 3 peuvent s’écrire<br />

A i 0 ′ = βiA 0 0 ′ , (4.4)<br />

47


à condition <strong>de</strong> poser comme nous le ferons désormais<br />

β i = dxi<br />

dx<br />

c<br />

0 = wi<br />

. (4.5)<br />

Choisissons comme origine O ′ le point <strong>de</strong> S ′ qui coïnci<strong>de</strong> avec O à l’instant t = 0. De plus,<br />

choisissons l’origine <strong>de</strong>s dates t ′ dans S ′ <strong>de</strong> telle sorte que la coïnci<strong>de</strong>nce <strong>de</strong> O et O ′ ait lieu à<br />

l’instant t ′ = 0. Alors l’événement <strong>de</strong> coordonnées galiléennes (0, 0, 0, 0) par rapport à S ′ doit<br />

avoir les coordonnées galiléennes (0, 0, 0, 0) par rapport à S, ce qui entraîne<br />

b α = 0 (4.6)<br />

pour α = 0, 1, 2, 3. Réciproquement, les conditions (4.6) entraînent que les origines O et O ′<br />

coïnci<strong>de</strong>nt lorsque t = 0 et t ′ = 0.<br />

Dans ce qui suit, nous supposerons toujours satisfaites les relations (4.6). Rappelons qu’on<br />

appelle transformations homogènes <strong>de</strong> Lorentz les transformations correspondantes. 1<br />

x<br />

3<br />

x<br />

2<br />

x 3'<br />

x<br />

2'<br />

O O' x1<br />

Fig. 4.1 – Repères Ox1x2x3 et O ′ x1′ x2′ x3′ .<br />

Pour une horloge standard comouvante avec l’origine O ′ , on a d’après (4.2) :<br />

w<br />

x 0 = A 0 0 ′x0′ . (4.7)<br />

Cette relation montre qu’on a nécessairement A0 0 ′ = 0. De plus, la quantité A00 ′ étant<br />

une constante, nous pouvons toujours choisir les échelles <strong>de</strong> temps <strong>de</strong> telle sorte que <strong>de</strong>s x0′ croissants correspon<strong>de</strong>nt à <strong>de</strong>s x0 croissants. C’est pourquoi nous supposerons dans ce qui suit<br />

que<br />

A 0 0 ′ > 0. (4.8)<br />

Les transformations <strong>de</strong> Lorentz qui satisfont la condition (4.8) sont dites orthochrones.<br />

Supposons pour l’instant qu’il existe <strong>de</strong>s transformations <strong>de</strong> Lorentz homogènes orthochrones<br />

prenant la forme simple<br />

1 On omet souvent l’épithète homogène.<br />

x 0 = A 0 0 ′x0′<br />

48<br />

+ A 0 1 ′x1′ , (4.9)<br />

x<br />

1'


x 1 = A 1 0 ′x0′ + A 1 1 ′x1′ , (4.10)<br />

x 2 = A 2 2 ′x2′ , (4.11)<br />

x 3 = A 3 3 ′x3′ . (4.12)<br />

Du fait que A 2 0 ′ = A3 0 ′ = 0, les équations (4.4) entraînent que β2 = 0 et β 3 = 0, ce qui<br />

équivaut à<br />

w 2 = 0, w 3 = 0. (4.13)<br />

On posera pour simplifier l’écriture<br />

w 1 = w (4.14)<br />

et<br />

β 1 = β, avec β = w<br />

.<br />

c<br />

(4.15)<br />

Une transformation définie par les équations (4.9)-(4.11) correspond donc à un repère<br />

O ′ x1′ x2′ x3′ dont chaque point se déplace parallèlement à l’axe Ox1 w = cβ.<br />

avec une vitesse constante<br />

Soit P ′ un point lié à l’axe O ′ x1′ . On a x2′ P ′ = 0 et x3′ P ′ = 0. Il résulte alors <strong>de</strong> (4.11) que<br />

x 2 P ′ = 0 et x3 P ′ = 0 : le mouvement <strong>de</strong> P ′ dans S s’effectue donc sur l’axe Ox 1 . Nous avons<br />

vu ci-<strong>de</strong>ssus que ce mouvement s’effectue avec la vitesse w. On peut donc énoncer que chaque<br />

point lié à l’axe O ′ x1′ glisse avec la vitesse w sur l’axe Ox1 . En particulier, le point O ′ décrit<br />

la droite Ox 1 selon l’équation horaire x 1 = wt (rappelons que d’après notre choix <strong>de</strong>s origines<br />

spatiales et temporelles, O ′ coïnci<strong>de</strong> avec O à l’instant t = 0).<br />

Un raisonnement analogue montre que chaque point lié au plan O ′ x1′ x2′ glisse sur le plan<br />

Ox1x2 , et que chaque point lié au plan O ′ x1′ x3′ glisse sur le plan Ox1x3 . Enfin, il découle<br />

immédiatement <strong>de</strong> la forme <strong>de</strong> la transformation qu’à chaque instant t, l’ensemble <strong>de</strong>s points<br />

liés à O ′ x2′ (resp. O ′ x3′ ) est situé dans S sur un axe issu <strong>de</strong> O ′ et parallèle à Ox2 (resp. Ox3 ).<br />

Le repère O ′ x1′ x2′ x3′ <strong>de</strong>ssiné dans Ox1x2x3 à un instant t donné est donc parallèle au repère<br />

Ox 1 x 2 x 3 , comme on l’a représenté sur la figure 4.1.<br />

Il découle <strong>de</strong> (4.10) qu’on a pour chaque événement se produisant sur O ′ x1′ à l’instant<br />

t ′ = 0 :<br />

x 1 = A 1 1 ′x1′ .<br />

Cette relation montre que le signe <strong>de</strong> la constante A1 1 ′ dépend <strong>de</strong> l’orientation relative <strong>de</strong>s<br />

. Nous supposerons désormais que cette orientation est choisie <strong>de</strong> telle sorte<br />

axes Ox 1 et O ′ x 1′<br />

que l’inégalité<br />

A 1 1 ′ > 0 (4.16)<br />

soit satisfaite (“Ox1 et Ox1′ sont <strong>de</strong> même sens”). De même, les relations (4.11) et (4.12)<br />

entraînent qu’on peut toujours choisir l’orientation relative <strong>de</strong>s axes Ox2 et O ′ x2′ d’une part,<br />

Ox3 et O ′ x3′ d’autre part <strong>de</strong> telle façon que les inégalités<br />

A 2 2 ′ > 0, A33 ′ > 0 (4.17)<br />

soient satisfaites.<br />

Explicitons maintenant les transformations <strong>de</strong> Lorentz orthochrones du type (4.9)-(4.11).<br />

Les équations (4.4) se réduisant à<br />

A 1 0 ′ = βA00 ′, (4.18)<br />

49


la relation d’invariance (3.14) se traduit par l’équation<br />

(A 0 0 ′dx0′<br />

+ A 0 1 ′dx1′ ) 2 − (βA 0 0 ′dx0′ + A 1 1 ′dx1′ ) 2 − (A 2 2 ′)2 (dx 2′<br />

) 2 − (A 3 3 ′)2 (dx 3′<br />

) 2<br />

= (dx 0′<br />

) 2 − (dx 1′<br />

) 2 − (dx 2′<br />

) 2 − (dx 3′<br />

) 2<br />

(4.19)<br />

qui doit être vérifiée quels que soient dx 0 ,dx 1 ,dx 2 ,dx 3 . En développant le membre <strong>de</strong> gauche <strong>de</strong><br />

(4.19) et en i<strong>de</strong>ntifiant <strong>de</strong>s <strong>de</strong>ux membres terme à terme, on obtient compte tenu <strong>de</strong>s conditions<br />

(4.8), (4.16) et (4.17) :<br />

A 0 0 ′ = A11 ′ =<br />

1<br />

√<br />

1 − β2 , A01 ′ = A10 ′ =<br />

En conséquence, la transformation cherchée s’écrit :<br />

x 0 = x0′ + βx1′ √<br />

1 − β2 , x1 = x1′ + βx0′ √<br />

1 − β2 , x2 = x 2′<br />

β<br />

√<br />

1 − β2 , A22 ′ = A33 ′ = 1. (4.20)<br />

, x 3 = x 3′<br />

. (4.21)<br />

On appelle transformation spéciale <strong>de</strong> Lorentz une telle transformation. On peut montrer<br />

que les transformations <strong>de</strong> Lorentz homogènes orthochrones les plus générales s’obtiennent par<br />

composition d’une transformation spéciale et <strong>de</strong> rotations <strong>de</strong>s axes spatiaux <strong>de</strong>s référentiels<br />

galiléens S et S ′ .<br />

En résolvant le système d’équations (4.21) en x 0′<br />

, x 1′<br />

, x 2′<br />

x 0′<br />

= x0 − βx 1<br />

√ 1 − β 2<br />

, x1′<br />

= x1 − βx 0<br />

√ 1 − β 2<br />

, x2′<br />

et x3′ , on obtient :<br />

= x 2 , x 3′<br />

= x 3 . (4.22)<br />

La transformation (4.22) inverse <strong>de</strong> (4.21) est clairement une transformation spéciale <strong>de</strong><br />

Lorentz obtenue en échangeant les rôles joués par xα et xβ′ et en changeant β en −β. Il<br />

s’ensuit que le vecteur vitesse w ′ du référentiel S par rapport au référentiel S ′ est le vecteur<br />

w ′ admettant les composantes w1′ = −w, w2′ = 0,w3′ = 0 par rapport au système d’axes<br />

orthonormés O ′ x1′ x2′ x3′ .<br />

La transformation <strong>de</strong> Lorentz (4.21) est à comparer avec la transformation admise par la<br />

physique préeinsteinienne, qui s’écrirait ici<br />

t = t ′ , x 1 = x 1′<br />

+ wt ′ , x 2 = x 2′<br />

, x 3 = x 3′<br />

. (4.23)<br />

La transformation (4.23) s’appelle une transformation spéciale <strong>de</strong> Galilée. Il est immédiat<br />

<strong>de</strong> former son inverse :<br />

t ′ = t, x 1′<br />

= x 1 − wt, x 2′<br />

= x 2 , x 3′<br />

= x 3 . (4.24)<br />

On note en particulier que les transformations <strong>de</strong> Galilée n’impliquaient aucune limitation<br />

sur la vitesse w alors que les formules <strong>de</strong> transformations (4.21) et (4.22) n’ont <strong>de</strong> sens que si<br />

−1 < β < 1 ⇐⇒ −c < w < c. (4.25)<br />

Nous retrouvons donc ici que la valeur absolue <strong>de</strong> la vitesse <strong>de</strong> translation w d’un référentiel<br />

galiléen par rapport à un autre référentiel galiléen est toujours inférieure à la vitesse fondamentale<br />

c.<br />

50


4.3 Loi <strong>de</strong> composition relativiste <strong>de</strong>s vitesses<br />

Nous supposons que les origines <strong>de</strong>s coordonnées et les axes spatiaux sont choisis <strong>de</strong> telle<br />

sorte que S et S ′ soient reliés par la transformations spéciale <strong>de</strong> Lorentz (4.21). Si v ′ désigne<br />

le vecteur vitesse d’une particule isolée P par rapport à S ′ , et si w est le vecteur vitesse <strong>de</strong> S ′<br />

par rapport à S, la vitesse v <strong>de</strong> P par rapport à S n’est plus donnée par la loi d’addition bien<br />

connue en cinématique galiléenne<br />

v = v ′ + w . (4.26)<br />

Pour trouver la nouvelle loi <strong>de</strong> composition <strong>de</strong>s vitesses, considérons <strong>de</strong>ux événements infiniment<br />

voisins appartenant à l’histoire <strong>de</strong> P, <strong>de</strong> coordonnées galiléennes respectives (x0′ ,x1′ ,x2′ ,x3′ )<br />

et (x0′ +dx0′ ,x1′ +dx1′ ,x2′ +dx2′ ,x3′ +dx3′ ). Par rapport à S, ces <strong>de</strong>ux événements sont séparés<br />

par <strong>de</strong>s éléments différentiels dx 0 ,dx 1 ,dx 2 ,dx 3 obtenus en différentiant la transformation <strong>de</strong> Lorentz<br />

(4.21) :<br />

dx 0 = dx0′ + βdx1′ √ , dx<br />

1 − β2 1 = dx1′ + βdx0′ √ , dx<br />

1 − β2 2 = dx 2′<br />

Si on note vi′ les composantes du vecteur vitesse v ′ , on peut substituer dxi′ dans les éqs. (4.27). Il vient :<br />

dx 0 <br />

1<br />

= √ 1 +<br />

1 − β2 w v<br />

c<br />

1′<br />

<br />

dx<br />

c<br />

0′<br />

,<br />

dx 1 <br />

1 w v1′<br />

= √ +<br />

1 − β2 c c<br />

d’où après division <strong>de</strong>s dx i par dt = dx 0 /c :<br />

v 1 = v1′ + w<br />

w v1′<br />

1 +<br />

c2 , v 2 =<br />

, dx 3 = dx 3′<br />

. (4.27)<br />

dx 0′<br />

, dx 2 = v2′<br />

c dx0′ , dx 3 = v3′<br />

c dx0′ ,<br />

√ 1 − β 2<br />

1 +<br />

w v1′<br />

c 2<br />

v 2′<br />

, v 3 =<br />

√ 1 − β 2<br />

1 +<br />

w v1′<br />

c 2<br />

= (vi′ /c)dx0′ v 3′<br />

. (4.28)<br />

On note que ces formules sont nettement plus compliquées que la loi d’addition galiléenne.<br />

On remarquera en particulier que dx2 = dx2′ et dx3 = dx3′ n’entraînent pas que v2 = v2′ et<br />

v3 = v3′ . En fait, la présence du terme √ 1 − β2 dans les expressions <strong>de</strong> v2 et v3 implique que<br />

ces composantes ten<strong>de</strong>nt vers 0 lorsque |w| → c, v2′ et v3′ restant inchangées.<br />

Il est possible d’obtenir une expression du dénominateur commun à v 1 ,v 2 et v 3 qui soit<br />

indépendante du choix <strong>de</strong>s axes <strong>de</strong> l’espace lié au référentiel S ′ . On a vu plus haut que la<br />

vitesse relative <strong>de</strong> S par rapport à S ′ est en effet le vecteur w ′ <strong>de</strong> composantes w1′ = −w,<br />

w2′ = 0,w3′ = 0. En conséquence, la quantité wv1′ dans le second membre <strong>de</strong> (4.32) est en<br />

réalité l’opposé du produit scalaire du vecteur w ′ par le vecteur vitesse v ′ . On peut donc<br />

écrire :<br />

wv 1′<br />

= −w ′ .v ′ . (4.29)<br />

Substituons (4.29) dans(4.28). Il vient :<br />

v 1 = v1′ + w<br />

1 − w′ .v ′<br />

c2 , v 2 √<br />

1 − β2 =<br />

1 − w′ .v ′<br />

c2 51<br />

v 2′<br />

, v 3 =<br />

√ 1 − β 2<br />

1 − w′ .v ′<br />

c 2<br />

v 3′<br />

. (4.30)


On calcule aisément le carré <strong>de</strong> la norme <strong>de</strong> v à partir <strong>de</strong>s formules (4.28). En notant que<br />

on obtient 2 :<br />

(v 1′<br />

) 2 + (1 − β 2 )[(v 2′<br />

) 2 + (v 3′<br />

) 2 ] = (1 − β 2 )v ′2 2 1<br />

+ β (v ′<br />

) 2<br />

v 2 =<br />

⎛<br />

1<br />

⎝1 + wv1′<br />

c 2<br />

⎞2<br />

Compte tenu <strong>de</strong> (4.29), cette <strong>de</strong>rnière relation s’écrit encore<br />

v 2 =<br />

à condition <strong>de</strong> poser<br />

<br />

1<br />

1 − w′ .v ′<br />

c 2<br />

⎠<br />

2<br />

(4.31)<br />

<br />

(1 − β 2 )v ′2 + w 2 + 2wv 1 ′<br />

+ β 2 (v 1′<br />

) 2<br />

. (4.32)<br />

<br />

(1 − β ′2 )v ′2 + w ′2 − 2w ′ .v ′ + (β ′ .v ′ ) 2 <br />

, (4.33)<br />

β ′ = w′<br />

c = (β′ , 0, 0) = (−β, 0, 0). (4.34)<br />

Il faut bien entendu se souvenir que β ′2 2 ′2 2 = β et w = w .<br />

La relation (4.33) présente l’intérêt d’exprimer v2 sous une forme qui est indépendante du<br />

choix <strong>de</strong>s axes spatiaux dans les référentiels S et S ′ . On a donc une relation générale, et on<br />

peut oublier qu’on l’a démontrée en utilisant une transformation spéciale <strong>de</strong> Lorentz. Autrement<br />

dit : l’équation (4.33) exprime le carré <strong>de</strong> la vitesse d’une particule par rapport à S en fonction<br />

d’éléments qui sont tous relatifs au référentiel S ′ et qui ne dépen<strong>de</strong>nt pas du choix <strong>de</strong>s axes. En<br />

fait, v2 est exprimé en fonction <strong>de</strong> v ′2 ′2 ′ ′ , w et <strong>de</strong> l’angle que forment v avec w (on a en effet<br />

w ′ .v ′ = |w ′ ||v ′ | cos(w ′ ,v ′ )).<br />

On obtient l’expression <strong>de</strong>s composantes <strong>de</strong> la vitesse v ′ en fonction <strong>de</strong>s composantes <strong>de</strong> la<br />

vitesse v en échangeant les rôles <strong>de</strong>s quantités primées et non primées et en remplaçant w par<br />

−w dans les équations (4.28). Il vient :<br />

√ √<br />

1 − β2 1 − β2 v 1′<br />

= v1 − w<br />

w v1<br />

1 −<br />

c2 , v 2′<br />

=<br />

1 −<br />

w v1<br />

c 2<br />

v 2 , v 3′<br />

=<br />

1 −<br />

w v1<br />

c 2<br />

v 3 . (4.35)<br />

Là encore, le dénominateur commun aux quantités vi′ peut s’exprimer sous une forme<br />

indépendante du choix <strong>de</strong>s axes <strong>de</strong> l’espace lié au référentiel S. On a :<br />

v 1′<br />

= v1 − w<br />

1 − w.v<br />

c2 , v 2′<br />

√<br />

1 − β2 =<br />

1 − w.v<br />

c2 v 2 , v 3′<br />

√<br />

1 − β2 =<br />

1 − w.v<br />

c2 v 3 . (4.36)<br />

Un calcul analogue à celui qu’on a fait ci-<strong>de</strong>ssus pour trouver l’expression <strong>de</strong> v 2 donne pour<br />

le carré <strong>de</strong> la norme <strong>de</strong> v ′ :<br />

v ′2 =<br />

<br />

1<br />

1 − w.v<br />

c 2<br />

2<br />

<br />

(1 − β 2 )v 2 + w 2 − 2w.v + (β.v) 2<br />

, (4.37)<br />

2 On notera qu’il faudrait écrire β 2 au lieu <strong>de</strong> β 2 et β ′2 au lieu <strong>de</strong> β ′2 partout dans ce chapitre.<br />

52


où<br />

β = w<br />

= (β, 0, 0). (4.38)<br />

c<br />

Tout comme (4.33), la formule (4.37) est générale.<br />

On vérifie facilement avec ces formules que |v| = c si et seulement si |v ′ | = c. On peut en<br />

outre montrer qu’on a |v| < c si et seulement si |v ′ | < c, en supposant bien entendu |w| < c.<br />

Remarque.— Contrairement à ce que les équations (4.34) et (4.38) en termes <strong>de</strong> composantes<br />

pourraient laisser penser, les vecteurs (tridimendionnels) β et β ′ ne sont pas colinéaires<br />

car ils appartiennent à <strong>de</strong>s espace tridimensionnels distincts, puisqu’associés à <strong>de</strong>s référentiels<br />

en mouvement relatif. On n’écrira donc jamais β ′ = β ni w ′ = −w.<br />

4.4 Aberration <strong>de</strong> la lumière<br />

On appelle aberration <strong>de</strong> la lumière le fait que les rayons venant d’une source d’apparence<br />

ponctuelle 3 (satellite, étoile, quasar, ...) sont vus dans <strong>de</strong>s directions différentes lorsqu’ils sont<br />

observés dans <strong>de</strong>s systèmes <strong>de</strong> référence en mouvement l’un par rapport à l’autre. En effet<br />

un observateur lié à un référentiel voit une source lumineuse dans la direction définie dans ce<br />

référentiel par le vecteur vitesse du rayon lumineux qui lui arrive <strong>de</strong> cette source au moment <strong>de</strong><br />

son observation. Le phénomène d’aberration résulte donc <strong>de</strong> la propagation <strong>de</strong> la lumière avec<br />

une vitesse finie et <strong>de</strong> la loi <strong>de</strong> composition <strong>de</strong>s vitesses.<br />

Au départ, nous nous donnons les référentiels galiléens S et S ′ avec les origines et les<br />

systèmes d’axes fixés dans la section 4.2. Nous verrons que ce choix particulier n’empêche pas<br />

d’obtenir la formule fondamentale <strong>de</strong> l’aberration en toute généralité. En physique galiléenne,<br />

le vecteur vitesse V l d’un rayon lumineux par rapport à S est relié au vecteur vitesse V ′<br />

l <strong>de</strong> ce<br />

rayon par rapport à S ′ par la formule résultant immédiatement <strong>de</strong> (4.26)<br />

V l = V ′<br />

l + w. (4.39)<br />

La formule (4.39) est très simple mais son utisation pratique soulève une grave difficulté <strong>de</strong><br />

principe. En effet, le calcul <strong>de</strong> la différence <strong>de</strong> directions au moyen <strong>de</strong> (4.39) va faire intervenir<br />

la direction et la norme <strong>de</strong>s vecteurs V l et V ′<br />

l. Or l’astronome qui veut utiliser cette formule<br />

peut seulement mesurer la vitesse du rayon lumineux dans son propre référentiel (i.e., la Terre),<br />

et encore une telle mesure est-elle fort délicate en pratique. Il ne peut pas rester immobile<br />

avec ses instruments dans un référentiel S ′ lié au barycentre du système solaire par exemple.<br />

En conséquence notre astronome ne peut pas faire <strong>de</strong> calcul théorique précis sans faire <strong>de</strong>s<br />

hypothèses sur la vitesse <strong>de</strong> la lumière dans le référentiel S ′ .<br />

3 L’effet d’aberration fut mis en évi<strong>de</strong>nce pour la première fois par Römer en 1676 en comparant les observations<br />

<strong>de</strong>s éclipses <strong>de</strong>s satellites <strong>de</strong> Jupiter avec les tables <strong>de</strong> Cassini. L’aberration annuelle <strong>de</strong>s étoiles fut<br />

découverte en 1726 par Bradley à la suite <strong>de</strong> mesures <strong>de</strong>stinées à mettre en évi<strong>de</strong>nce une parallaxe stellaire.<br />

Pour une analyse très complète du point <strong>de</strong> vue astronomique, voir par ex. Astronomie générale, A. Danjon.<br />

(Edit. A. Blanchard, <strong>Paris</strong>, secon<strong>de</strong> éd., 1994).<br />

53


Les difficultés rencontrées par la conception préeinsteinienne disparaissent complètement<br />

en relativité restreinte si on admet comme nous le ferons désormais la validité <strong>de</strong> l’hypothèse<br />

suivante 4 :<br />

Hypothèse sur la lumière.— La lumière se propage dans le vi<strong>de</strong> avec la vitesse c.<br />

Il suffit dès lors d’appliquer la loi <strong>de</strong> composition relativiste <strong>de</strong>s vitesses à <strong>de</strong>s points se<br />

déplaçant avec la vitesse c pour obtenir une théorie complète <strong>de</strong> l’aberration dans le vi<strong>de</strong>.<br />

Commençons par traiter le problème simple du changement <strong>de</strong> direction apparente d’un<br />

rayon lumineux par rapport à l’axe <strong>de</strong>s x 1 .<br />

Changement <strong>de</strong> direction apparente d’un rayon lumineux.— Considérons un rayon<br />

lumineux se propageant parallèlement à une droite ∆ fixe par rapport au référentiel S. On<br />

appelle α l’angle que forme ∆ avec l’axe Ox1 (voir fig. 4.2). Par rapport au référentiel S ′ ,<br />

ce rayon se propage parallèlement à une droite ∆ ′ faisant un angle α ′ avec l’axe Ox1′ . On se<br />

propose <strong>de</strong> déterminer α ′ en fonction <strong>de</strong> α.<br />

x x<br />

3 3'<br />

∆ ∆'<br />

α α'<br />

O O'<br />

Fig. 4.2 – Aberration <strong>de</strong> la lumière.<br />

Par raison <strong>de</strong> symétrie, nous pouvons supposer que le rayon arrivant en O se propage dans<br />

le plan Ox 1 x 3 . Pour un rayon venant <strong>de</strong> l’infini et arrivant vers l’axe Ox 1 , les composantes du<br />

vecteur vitesse par rapport à S sont alors<br />

v 1 = −c cos α , v 2 = 0 v 3 = −c sin α . (4.40)<br />

L’application <strong>de</strong>s formules (4.35) donne immédiatement<br />

x<br />

v 1′ cos α + β<br />

= −c , (4.41)<br />

1 + β cosα<br />

4 On peut justifier cette hypothèse si on admet la validité <strong>de</strong>s équations <strong>de</strong> Maxwell formulées <strong>de</strong> manière<br />

à satisfaire au principe d’équivalence <strong>de</strong>s référentiels galiléens (généralement appelé principe <strong>de</strong> relativité, le<br />

principe d’équivalence <strong>de</strong>s référentiels galiléens est formulé dans la section 5.1).<br />

54<br />

1<br />

x<br />

1'


Or, on a évi<strong>de</strong>mment<br />

v 2′<br />

= 0,<br />

v 3′<br />

√<br />

1 − β2 = −c sin α . (4.42)<br />

1 + β cosα<br />

v 1′<br />

= −c cos α ′ , v 3′<br />

= −c sin α ′ . (4.43)<br />

Substituons les expressions (4.43) dans (4.41)-(4.42). Nous obtenons les formules <strong>de</strong> transformation<br />

suivantes :<br />

cos α ′ cos α + β<br />

= , (4.44)<br />

1 + β cos α<br />

sin α ′ √<br />

1 − β2 = sin α . (4.45)<br />

1 + β cos α<br />

Bien entendu, les formules (4.44) et (4.45) ne sont pas indépendantes. On peut les con<strong>de</strong>nser<br />

en une seule formule très élégante en utilisant l’i<strong>de</strong>ntité :<br />

tan α′<br />

2<br />

sin α′<br />

= . (4.46)<br />

1 + cosα ′<br />

En substituant (4.44) et (4.45) dans le second membre <strong>de</strong> (4.46), il vient en effet :<br />

tan α′<br />

2 =<br />

√ √<br />

1 − β2 sin α<br />

1 − β2 sin α<br />

<br />

=<br />

cos α+β<br />

(1 + β cos α) 1 +<br />

(1 + β)(1 + cosα)<br />

1+β cos α<br />

D’où on déduit :<br />

tan α′<br />

2 =<br />

<br />

1 − β α<br />

tan . (4.47)<br />

1 + β 2<br />

On obtient les formules permettant <strong>de</strong> calculer l’angle α en fonction <strong>de</strong> α ′ en échangeant<br />

le rôle <strong>de</strong>s quantités primées et non primées (noter que β doit être remplacé par −β dans cet<br />

échange). Il vient :<br />

et<br />

cosα = cos α′ − β<br />

, (4.48)<br />

1 − β cos α ′<br />

√<br />

1 − β2 sin α =<br />

1 − β cos α ′ sin α′ , (4.49)<br />

tan α<br />

2 =<br />

<br />

1 + β α′<br />

tan . (4.50)<br />

1 − β 2<br />

Distance angulaire entre <strong>de</strong>ux sources.— Considérons <strong>de</strong>ux rayons lumineux ∆(1) et<br />

∆(2) respectivement émis par les sources ponctuelles E(1) et E(2) et arrivant simultanément en<br />

O à l’instant t = 0. La distance angulaire séparant les <strong>de</strong>ux sources telle qu’elle est vue par<br />

un observateur en O au repos par rapport au référentiel S est l’angle φ entre ∆(1) et ∆(2).<br />

55


Demandons-nous quelle est la distance angulaire φ ′ entre E(1) et E(2) vue à l’instant t ′ = 0 par<br />

un observateur en O ′ au repos par rapport au référentiel S ′ .<br />

Précisons les notations. Etant donné un rayon lumineux arbitraire, on appelle l le vecteur<br />

unitaire caractérisant la direction et le sens <strong>de</strong> la propagation <strong>de</strong> ce rayon par rapport au<br />

référentiel S. Le vecteur vitesse v du rayon est alors donné par<br />

v = c l, avec |l| = 1. (4.51)<br />

Par rapport au référentiel S ′ , ce rayon se propage bien entendu avec le vecteur vitesse v ′<br />

v ′ = c l ′ , avec |l ′ | = 1. (4.52)<br />

Les rayons ∆(1) et ∆(2) seront donc respectivement caractérisés par les vecteurs l(1) et l(2)<br />

dans S et par les vecteurs correspondants l ′ (1) et l ′ (2) dans S ′ . Il résulte <strong>de</strong>s équations (4.51) et<br />

(4.52) et <strong>de</strong> la loi <strong>de</strong> composition <strong>de</strong>s vitesses (4.36) que les composantes <strong>de</strong> l ′ (1) et <strong>de</strong> l ′ (2) sont<br />

respectivement données par<br />

l 1′<br />

(1) = l1 (1)<br />

− β<br />

1 − β.l(1)<br />

, l 2′<br />

(1) =<br />

l 1′<br />

(2) = l(2) − β<br />

, l<br />

1 − β.l(2)<br />

2′<br />

(2) =<br />

√ 1 − β 2<br />

l<br />

1 − β.l(1)<br />

2 (1) , l 3′<br />

(1) =<br />

√ 1 − β 2<br />

l<br />

1 − β.l(2)<br />

2′<br />

(2) , l 3′<br />

(2) =<br />

√ 1 − β 2<br />

l<br />

1 − β.l(1)<br />

3 (1) , (4.53)<br />

√ 1 − β 2<br />

l<br />

1 − β.l(2)<br />

3′<br />

(2) . (4.54)<br />

L’angle φ ′ cherché étant l’angle formé par les <strong>de</strong>ux vecteurs l ′ (1) et l ′ (2), on peut écrire :<br />

cos φ ′ = l ′ (1).l ′ (2)<br />

(4.55)<br />

puisque |l ′ (1)| = 1 et |l ′ (2)| = 1. Explicitons le second membre <strong>de</strong> (4.55) en tenant compte <strong>de</strong><br />

(4.53) et <strong>de</strong> (4.54). Il vient :<br />

cos φ ′ =<br />

On a évi<strong>de</strong>mment<br />

3<br />

i ′ =1<br />

l i′<br />

(1)l i′<br />

(2)<br />

= (1 − β2 ) <br />

l1 (1) l1 (2) + l2 (1) l2 (2) + l3 (1) l3 <br />

(2) + β2l1 (1) l1 (2) + β2 − βl1 (1) − βl1 (2)<br />

[1 − β.l(1)] [1 − β.l(2)]<br />

l 1 (1)l 1 (2) + l 2 (1)l 2 (2) + l 3 (1)l 3 (2) = l(1).l(2)<br />

et, compte tenu du choix d’axes que nous avons fait :<br />

. (4.56)<br />

(4.57)<br />

βl 1 (1) = β.l(1) , βl 1 (2) = β.l(2). (4.58)<br />

En substituant (4.57) et (4.58) dans (4.56) et en notant que β 2 ≡ 1 − (1 − β 2 ), on obtient<br />

cos φ ′ = (1 − β2 )[l(1).l(2) − 1] + [1 − β.l(1)][1 − β.l(2)]<br />

[1 − β.l(1)] [1 − β.l(2)]<br />

= (1 − β2 )[l(1).l(2) − 1]<br />

+ 1. (4.59)<br />

[1 − β.l(1)] [1 − β.l(2)]<br />

56


On a évi<strong>de</strong>mment l(1).l(2) = cos φ. Compte tenu <strong>de</strong> l’i<strong>de</strong>ntité 1−cos x = 2 sin<br />

(4.59) s’écrit donc<br />

2 φ′<br />

sin<br />

2 =<br />

2 1<br />

2<br />

x, la relation<br />

1 − β2 φ<br />

sin2 . (4.60)<br />

[1 − β.l(1)] [1 − β.l(2)] 2<br />

Cette relation présente l’intérêt d’être complètement indépendante du choix <strong>de</strong>s axes spatiaux<br />

dans les référentiels S et S ′ . L’utilisation d’une transformation spéciale <strong>de</strong> Lorentz ne nous a<br />

donc pas empéché d’obtenir un résultat général.<br />

La formule (4.60) est fondamentale pour l’astrométrie puisqu’elle établit un lien direct entre<br />

<strong>de</strong>ux quantités angulaires qui sont en principe directement mesurables. Du point <strong>de</strong> vue astronomique,<br />

il est cependant plus commo<strong>de</strong> <strong>de</strong> caractériser les rayons lumineux par <strong>de</strong>s vecteurs<br />

unitaires orientés vers les sources lumineuses. C’est pourquoi nous poserons<br />

n(1) = −l(1) n(2) = −l(2) , n ′ (1) = −l ′ (1) , n(2) = −l(2) . (4.61)<br />

Nous formulerons donc la proposition fondamentale suivante.<br />

Proposition 4.4.1 Supposons qu’un observateur O au repos par rapport à un référentiel galiléen<br />

S observe simultanément <strong>de</strong>ux sources ponctuelles E(1) et E(2) respectivement dans les<br />

directions n(1) et n(2) (dans S). Soit φ l’angle entre n(1) et n(2) définissant dans S la distance<br />

angulaire entre E(1) et E(2). Un observateur O ′ lié à un référentiel galiléen S ′ <strong>de</strong> vecteur vitesse<br />

w par rapport à S et coïncidant avec O au moment <strong>de</strong> l’observation voit E(1) et E(2)<br />

respectivement dans les directions n ′ (1) et n ′ (2) formant l’angle φ ′ donné par la relation :<br />

2 φ′<br />

sin<br />

2 =<br />

les vecteurs n(1), n(2), n ′ (1) et n ′ (2) étant définis par (4.61).<br />

1 − β2 φ<br />

sin2 , (4.62)<br />

[1 + β.n(1)] [1 + β.n(2)] 2<br />

La relation (4.62) donne φ ′ en fonction <strong>de</strong> quantités qui sont toutes définies dans S. On<br />

obtient une relation donnant φ en fonction <strong>de</strong> quantités toutes définies dans S ′ en échangeant<br />

les rôles <strong>de</strong>s quantités primées et non primées :<br />

2 φ<br />

sin<br />

2 =<br />

1 − β ′2<br />

[1 + β ′ .n ′ (1)] [1 + β ′ .n ′ φ′<br />

sin2 , (4.63)<br />

(2)] 2<br />

dans laquelle on a posé β ′ = w ′ /c, w ′ étant le vecteur vitesse <strong>de</strong> S par rapport à S ′ . Nous<br />

avons vu dans la section précé<strong>de</strong>nte que β ′2 = β 2 , mais qu’on ne peut écrire w ′ = −w.<br />

4.5 Effet Doppler-Fizeau<br />

Une on<strong>de</strong> peut très généralement être représentée par une superposition d’on<strong>de</strong>s planes<br />

monochromatiques. En outre, la nature scalaire, vectorielle ou tensorielle d’une on<strong>de</strong> donnée<br />

ne change pas la théorie <strong>de</strong> l’effet Doppler-Fizeau. C’est pourquoi nous nous bornerons ici à<br />

l’étu<strong>de</strong> d’une on<strong>de</strong> plane monochromatique scalaire définie en chaque point-événement x par<br />

l’équation<br />

u(x) = A cos S(x), (4.64)<br />

57


où A est l’amplitu<strong>de</strong> supposée constante et S(x) est la phase ayant la forme suivante dans un<br />

reférentiel galiléen S donné :<br />

S(x) = ωt − k.x ,<br />

3<br />

k.x = k<br />

i=1<br />

i x i , (4.65)<br />

où ω est la pulsation <strong>de</strong> l’on<strong>de</strong> et k le vecteur d’on<strong>de</strong> par rapport à S.<br />

Rappelons que suivant <strong>de</strong>s résultats classiques, la fréquence ν <strong>de</strong> l’on<strong>de</strong> et sa longueur d’on<strong>de</strong><br />

λ par rapport à S sont respectivement données par les relations<br />

ν = ω<br />

2π<br />

2π<br />

, λ = , (4.66)<br />

|k|<br />

d’où on tire l’expression bien connue <strong>de</strong> la vitesse <strong>de</strong> propagation par rapport à S :<br />

V = ν λ = ω<br />

. (4.67)<br />

|k|<br />

Déterminons l’expression <strong>de</strong> la phase S(x) lorsqu’on effectue une transformation spéciale <strong>de</strong><br />

Lorentz définie par (4.21). On obtient<br />

avec<br />

et<br />

S(x) = ω<br />

=<br />

c x0 − k 1 x 1 − k 2 x 2 − k 3 x 3<br />

1<br />

√ 1 − β 2<br />

ω<br />

c<br />

− βk1<br />

Dans le référentiel S ′ , la phase S(x) s’écrit donc sous la forme<br />

k 1′<br />

=<br />

<br />

x 0′<br />

<br />

− k 1 − ω<br />

c β<br />

<br />

x 1′<br />

<br />

− k 2 x 2′<br />

− k 3 x 3′<br />

. (4.68)<br />

S(x) = ω′<br />

c x0′ − k 1′<br />

x 1′<br />

− k 2′<br />

x 2′<br />

− k 3′<br />

x 3′<br />

, (4.69)<br />

ω ′ =<br />

1 <br />

√ ω − wk<br />

1 − β2 1<br />

(4.70)<br />

<br />

1<br />

√ k<br />

1 − β2 1 − ω<br />

c β<br />

<br />

, k 2′<br />

= k 2 , k 3′<br />

= k 3 . (4.71)<br />

Il résulte <strong>de</strong> ces équations que l’on<strong>de</strong> (4.64) est vue dans le référentiel S ′ comme une on<strong>de</strong><br />

plane dont la pulsation ω ′ est donnée par (4.70) et le vecteur d’on<strong>de</strong> k ′ est le vecteur dont les<br />

composantes sont données par (4.71). On déduit <strong>de</strong> (4.70) que la fréquence ν ′ <strong>de</strong> l’on<strong>de</strong> telle<br />

qu’elle serait mesurée par un observateur au repos par rapport à S ′ est<br />

ν ′ = ω′<br />

2π =<br />

<br />

1<br />

√ ν − w<br />

1 − β2 k1<br />

<br />

2π<br />

(4.72)<br />

On note que wk 1 est la valeur du produit scalaire usuel du 3-vecteur vitesse w et du 3vecteur<br />

d’on<strong>de</strong> k, puisque w = (w, 0, 0). Utilisant la notation classique (4.1), on peut donc<br />

poser :<br />

wk 1 = w.k . (4.73)<br />

58


En conséquence, la relation (4.72) s’écrit encore<br />

ν ′ <br />

1<br />

= √ ν −<br />

1 − β2 w.k<br />

<br />

, (4.74)<br />

2π<br />

On sait que la direction et le sens dans lesquels l’on<strong>de</strong> se propage par rapport au référentiel<br />

S sont respectivement la direction et le sens du vecteur k. On peut tout aussi bien caractériser<br />

cette direction et ce sens par le vecteur unitaire l défini par<br />

l = k<br />

. (4.75)<br />

|k|<br />

Compte tenu <strong>de</strong> (4.66), (4.67) et (4.75), la relation (4.74) s’écrit finalement<br />

ν ′ <br />

ν<br />

= √ 1 −<br />

1 − β2 w.l<br />

<br />

.<br />

V<br />

Déterminons maintenant la longueur d’on<strong>de</strong> λ ′ par rapport au référentiel S ′ . On a<br />

λ ′ = 2π<br />

|k ′ . (4.76)<br />

|<br />

D’après (4.67) et (4.73), la première équation <strong>de</strong> (4.71) élevée au carré peut sécrire<br />

(k 1′<br />

) 2 = 1<br />

1 − β2 <br />

(k 1 ) 2 2<br />

− |k|<br />

2V<br />

c2 <br />

2 w.l<br />

<br />

− β2<br />

V<br />

Compte tenu <strong>de</strong> cette équation et <strong>de</strong> k2′ = k2 ,k3′ = k3 , il vient<br />

|k ′ | 2 = (k 1′<br />

) 2 + (k 2′<br />

= |k|2<br />

1 − β2 <br />

1 − β 2 2<br />

+ β<br />

2V<br />

− 2V<br />

c2 c<br />

) 2 + (k 3′<br />

) 2<br />

(β.l) + (β.l)2<br />

La longueur d’on<strong>de</strong> par rapport au référentiel S ′ a donc pour expression :<br />

λ ′ = λ<br />

√<br />

1 − β2 .<br />

1 − β2 + β2 V 2<br />

c2 − 2 V<br />

c<br />

(β.l) + (β.l)2<br />

<br />

(4.77)<br />

. (4.78)<br />

La vitesse <strong>de</strong> propagation V ′ <strong>de</strong> l’on<strong>de</strong> par rapport à S ′ se déduit aisément <strong>de</strong>s expressions<br />

obtenues pour ν ′ et λ ′ . Il vient :<br />

V ′ = ν ′ λ ′ = ν′<br />

ν<br />

λ ′<br />

V = V<br />

λ<br />

<br />

1 − w.l<br />

V<br />

1 − β2 + β2 V 2<br />

c2 − 2 V<br />

c<br />

(β.l) + (β.l)2<br />

Les formules trouvées ci-<strong>de</strong>ssus expriment les rapports ν ′ /ν, λ ′ /λ et V ′ /V sous une forme<br />

qui est indépendante du choix <strong>de</strong>s axes spatiaux dans les référentiels S et S ′ . Autrement dit,<br />

nous pouvons oublier que nous nous sommes servis <strong>de</strong> la transformation spéciale <strong>de</strong> Lorentz<br />

pour les établir. En conséquence, nous avons établi <strong>de</strong>s relations générales. Rappelons que nous<br />

avons déjà rencontré ce type <strong>de</strong> déduction dans la section 4.4.<br />

Nous sommes ainsi conduits à la proposition suivante :<br />

59<br />

.


Proposition 4.5.1 Soit une on<strong>de</strong> monochromatique plane décrite dans un référentiel galiléen<br />

arbitraire S par l’équation<br />

<br />

ω<br />

u(x) = A cos<br />

c x0 <br />

− k.x .<br />

Soit S ′ un référentiel galiléen ayant une vitesse w par rapport à S. Si ν, λ et V désignent<br />

respectivement la fréquence, la longueur d’on<strong>de</strong> et la vitesse <strong>de</strong> phase <strong>de</strong> l’on<strong>de</strong> telles qu’elles<br />

sont mesurées dans le référentiel S, alors la fréquence ν ′ , la longueur d’on<strong>de</strong> λ ′ et la vitesse <strong>de</strong><br />

phase V ′ mesurées dans le référentiel S ′ sont respectivement données par<br />

ν ′ =<br />

λ ′ = λ<br />

<br />

1 − w.l<br />

<br />

,<br />

V<br />

(4.79)<br />

√<br />

1 − β2 1 − β2 + β2 V 2<br />

c2 − 2 V<br />

,<br />

c<br />

(β.l) + (β.l)2<br />

(4.80)<br />

ν<br />

√ 1 − β 2<br />

V ′ = V <br />

où l est le vecteur unitaire défini par (4.75).<br />

1 − w.l<br />

V<br />

1 − β2 + β2 V 2<br />

c2 − 2 V<br />

c<br />

(β.l) + (β.l)2<br />

, (4.81)<br />

On<strong>de</strong> monochromatique émise par une source éloignée.— Considérons maintenant<br />

une on<strong>de</strong> monochromatique émise par une source ponctuelle E dont l’éloignement est beaucoup<br />

plus grand que la dimension du récepteur R utilisé pour son observation. Nous supposons que<br />

le récepteur est situé en un point xR immobile par rapport à un référentiel galiléen S et que la<br />

source E est animée d’un mouvement rectiligne uniforme <strong>de</strong> vecteur vitesse w par rapport à S.<br />

Nous pouvons assimiler l’on<strong>de</strong> arrivant sur le récepteur R à une on<strong>de</strong> monochromatique plane.<br />

L’on<strong>de</strong> arrivant sur le récepteur R a été émise en x(tE) à l’instant tE défini par<br />

|xR − xE(tE)| = V (tR − tE). (4.82)<br />

Le vecteur l parallèle à la direction <strong>de</strong> cette on<strong>de</strong> inci<strong>de</strong>nte et orienté dans le sens <strong>de</strong><br />

propagation est donc défini par<br />

l = xR − xE(tE)<br />

. (4.83)<br />

|xR − xE(tE)|<br />

Il faut noter que tE est une fonction <strong>de</strong> tR, <strong>de</strong> w et <strong>de</strong> la position x0 <strong>de</strong> E à un instant<br />

initial t0 arbitrairement choisi.<br />

Le référentiel galiléen S0 comouvant avec la source E joue le rôle joué par le référentiel<br />

S ′ dans ce qui précè<strong>de</strong>. La fréquence ν ′ dans la formule (4.79) est maintenant la fréquence ν0<br />

<strong>de</strong> la source émettrice qui serait mesurée par un observateur au repos par rapport à S0. On<br />

appelle ν0 la fréquence propre <strong>de</strong> E. La fréquence ν observée dans S à l’instant tR se déduit<br />

immédiatement <strong>de</strong> (4.79). Nous pouvons donc formuler la proposition qui suit.<br />

Proposition 4.5.2 (Effet Doppler-Fizeau) Soit R un récepteur au repos par rapport à un<br />

référentiel galiléen S observant un train d’on<strong>de</strong>s monochromatiques <strong>de</strong> fréquence propre ν0 émis<br />

60


par une source se mouvant avec un vecteur vitesse w constant par rapport à S. La fréquence ν<br />

du train d’on<strong>de</strong>s mesurée par R à l’instant tR est donnée par la relation :<br />

√<br />

1 − β2 ν = ν0<br />

1 − w.l<br />

, (4.84)<br />

V<br />

où V désigne la vitesse <strong>de</strong> propagation <strong>de</strong>s on<strong>de</strong>s par rapport à S et l est le vecteur défini par<br />

(4.83).<br />

Pour un train d’on<strong>de</strong>s monochromatiques se déplaçant avec la vitesse invariante c (cas <strong>de</strong><br />

la lumière, par exemple), on a V = c et la relation (4.84) s’écrit<br />

√<br />

1 − β2 ν = ν0 , (4.85)<br />

1 − β.l<br />

où β est défini par (4.38). L’équation (4.85) est l’expression relativiste <strong>de</strong> l’effet Doppler-Fizeau<br />

pour les radiations lumineuses se propageant dans le vi<strong>de</strong>.<br />

61


Chapitre 5<br />

Dynamique relativiste (I)<br />

Nous nous sommes jusqu’ici uniquement préoccupés <strong>de</strong> construire une cinématique. Nous<br />

avons en effet décrit les mouvements <strong>de</strong>s particules et <strong>de</strong>s observateurs sans nous intéresser<br />

aux causes susceptibles <strong>de</strong> produire ces mouvements. Dans ce chapitre, nous allons formuler une<br />

dynamique compatible avec le cadre défini par l’espace-temps <strong>de</strong> Minkowski. Pour cela, les postulats<br />

que nous avons introduits jusqu’ici sont insuffisants. Il nous faut introduire <strong>de</strong> nouveaux<br />

postulats, dont le plus important est ce que l’on appelle fort improprement le principe <strong>de</strong> relativité<br />

et qu’il nous paraît bien préférable <strong>de</strong> nommer le principe d’équivalence <strong>de</strong>s référentiels<br />

galiléens.<br />

Les notations et conventions utilisées dans ce chapitre sont les mêmes que dans le chapitre<br />

précé<strong>de</strong>nt. En particulier, un vecteur <strong>de</strong> l’espace affine proprement euclidien E3[S] associé à<br />

un référentiel galiléen S est représenté par une lettre grasse ou par le triplet constitué par ses<br />

composantes par rapport à un trièdre orthonormé (O,ei).<br />

5.1 Principe d’équivalence <strong>de</strong>s référentiels galiléens<br />

Nous allons avoir besoin d’un nouveau principe pour fon<strong>de</strong>r une physique et en particulier<br />

une dynamique compatibles avec la cinématique exposée dans les chapitres précé<strong>de</strong>nts. Ce principe<br />

est universellement appelé “principe <strong>de</strong> relativité”, mais cette dénomination est regrettable<br />

car elle ne renseigne pas sur le contenu effectif du dit principe. Il s’agit en fait d’un principe<br />

postulant l’équivalence complète <strong>de</strong>s référentiels galiléens pour formuler les lois <strong>de</strong> la physique.<br />

D’où la dénomination proposée ici.<br />

Postulat 5.1.1 (Principe d’équivalence <strong>de</strong>s référentiels galiléens ou principe <strong>de</strong> relativité)<br />

Les lois physiques gouvernant les interactions ont la même forme dans tous les<br />

référentiels galiléens.<br />

Nous notons que le postulat d’existence d’une vitesse c invariante par les changements <strong>de</strong><br />

référentiels galiléens est compatible avec le principe d’équivalence <strong>de</strong>s référentiels galiléens. Un<br />

physicien déterminant cette vitesse fondamentale dans un référentiel galiléen S donné va trouver<br />

la même valeur <strong>de</strong> c qu’un autre physicien effectuant <strong>de</strong>s expériences analogues dans un autre<br />

référentiel galiléen S ′ en mouvement par rapport à S précisément parce que c est invariante (on<br />

suppose bien entendu que les mêmes systèmes d’unités sont utilisés dans S et S ′ ).<br />

62


5.2 Quantité <strong>de</strong> mouvement et énergie cinétique d’une<br />

particule isolée<br />

Considérons une particule se mouvant avec une vitesse v par rapport à un reférentiel galiléen<br />

arbitraire S. Selon la mécanique newtonienne, cette particule possè<strong>de</strong> une quantité <strong>de</strong><br />

mouvement p et une énergie cinétique Ec respectivement définies par<br />

et<br />

p = mv (5.1)<br />

Ec = 1<br />

2 mv2 , (5.2)<br />

où m est un nombre réel positif appelé la masse inerte (ou simplement la masse) <strong>de</strong> la particule.<br />

Comment peut-on définir <strong>de</strong>s gran<strong>de</strong>urs analogues en relativité restreinte ? On suppose bien<br />

entendu que les particules considérées ont toutes <strong>de</strong>s lignes d’univers du genre temps.<br />

On commence d’abord par généraliser le concept <strong>de</strong> masse en admettant le postulat qui<br />

suit.<br />

Postulat 5.2.1 À toute particule P dont la ligne d’univers est du genre temps, on peut attribuer<br />

un nombre réel positif m qu’on appelle la masse inerte (ou simplement masse) <strong>de</strong> P. La<br />

quantité scalaire m est indépendante du référentiel1 .<br />

Le postulat 5.2.1 ne stipule nullement que la masse d’une particule reste nécessairement<br />

inchangée au cours <strong>de</strong> l’histoire <strong>de</strong> cette particule. Considérons par exemple un atome. Il découle<br />

<strong>de</strong> ce qui va être établi dans la suite que si cet atome émet ou absorbe un photon, sa masse<br />

inerte varie : dans le premier cas sa masse inerte diminue, dans le second cas sa masse augmente.<br />

Nous allons maintenant chercher à définir la quantité <strong>de</strong> mouvement p et l’énergie cinétique<br />

Ec d’une particule en supposant que ces gran<strong>de</strong>urs sont <strong>de</strong> la forme suivante :<br />

<br />

p = M m, v<br />

<br />

v (5.3)<br />

c<br />

et<br />

<br />

Ec = Ec m, v<br />

<br />

, (5.4)<br />

c<br />

où M(m, v/c) et Ec(m, v/c) sont <strong>de</strong>s fonctions <strong>de</strong> la masse et du vecteur vitesse <strong>de</strong> la particule.<br />

Le principe d’équivalence <strong>de</strong>s référentiels galiléens entraîne que M(m, v/c) et Ec(m, v/c)<br />

sont <strong>de</strong>s fonctions universelles <strong>de</strong> la masse inerte m et du vecteur vitesse v, i.e. <strong>de</strong>s fonctions<br />

qui ne dépen<strong>de</strong>nt pas du référentiel galiléen par rapport auquel la particule est décrite. De<br />

plus le principe d’isotropie <strong>de</strong> l’espace implique que M(m, v/c) et Ec(m, v/c) doivent dépendre<br />

seulement <strong>de</strong> m et <strong>de</strong> la valeur absolue <strong>de</strong> v ou encore du carré <strong>de</strong> v. En conséquence on cherche<br />

à déterminer p et Ec sous la forme<br />

<br />

p = M<br />

m, v2<br />

c 2<br />

v (5.5)<br />

1 On évitera <strong>de</strong> parler <strong>de</strong> masse relativiste variant avec la vitesse comme on a continué à le faire longtemps<br />

après la naissance <strong>de</strong> la relativité restreinte. Les anciens traités introduisaient souvent la masse longitudinale<br />

et la masse transversale. La quantité m introduite dans le postulat 5.2.1 était alors souvent appelée la masse<br />

propre.<br />

63


et<br />

où on a posé<br />

Ec = Ec<br />

<br />

m, v2<br />

c 2<br />

<br />

, (5.6)<br />

v = |v|. (5.7)<br />

On admet que (5.5) et (5.6) coïnci<strong>de</strong>nt avec les expressions newtoniennes lorsque la vitesse<br />

|v| <strong>de</strong>vient infiniment petite. On doit donc avoir<br />

et<br />

lim<br />

|v|→0 M<br />

<br />

2Ec<br />

lim<br />

|v|→0<br />

<br />

m, v2<br />

c 2<br />

m, v2<br />

c 2<br />

<br />

<br />

= m (5.8)<br />

mv 2 = 1. (5.9)<br />

On admet en outre que la valeur absolue <strong>de</strong> la quantité <strong>de</strong> mouvement M(m,v 2 /c 2 )v et<br />

l’énergie cinétique Ec(m,v 2 /c 2 ) sont <strong>de</strong>s fonctions continues, monotones croissantes <strong>de</strong> v sur<br />

l’intervalle 0 ≤ v < c. Comme la quantité <strong>de</strong> mouvement et l’énergie cinétique doivent prendre<br />

la valeur nulle lorsque v = 0 d’après (5.8) et (5.9), les fonctions M(m,v 2 /c 2 ), M(m,v 2 /c 2 )v et<br />

Ec(m,v 2 /c 2 ) sont > 0 lorsque v = 0.<br />

Sous ces hypothèses, on démontre que les fonctions universelles M(m,v 2 /c 2 ) et Ec(m,v 2 /c 2 )<br />

sont complètement déterminées en écrivant que lors d’une collision élastique <strong>de</strong> <strong>de</strong>ux particules<br />

<strong>de</strong> masses i<strong>de</strong>ntiques, la somme vectorielle <strong>de</strong>s quantités <strong>de</strong> mouvement et la somme <strong>de</strong>s énergies<br />

totales sont conservées quel que soit le référentiel gali̷léen dans lequel on décrit le processus (voir<br />

Annexe D). On trouve ainsi qu’une particule <strong>de</strong> vitesse v a pour quantité <strong>de</strong> mouvement le<br />

vecteur<br />

et pour énergie cinétique la quantité<br />

p = mv<br />

<br />

1 − v2<br />

c2 ⎛<br />

⎞<br />

(5.10)<br />

Ec = mc 2<br />

⎜ 1<br />

⎜<br />

⎝<br />

<br />

1 − v2<br />

c2 ⎟<br />

− 1⎟<br />

⎠ . (5.11)<br />

Lorsque la vitesse <strong>de</strong> la particule est petite <strong>de</strong>vant la vitesse fondamentale c, on peut faire un<br />

développement approché <strong>de</strong>s seconds membres <strong>de</strong> (5.11) et (5.10). Compte tenu <strong>de</strong> (1−x 2 ) −1/2 ≈<br />

1 + 1<br />

2 x2 + 3<br />

8 x4 + ..., on obtient<br />

et<br />

p = m<br />

Ec = 1<br />

2 mv2<br />

<br />

<br />

1 + 1 v<br />

2<br />

2<br />

<br />

+ ... v (5.12)<br />

c2 1 + 3<br />

4<br />

v2 <br />

+ ... . (5.13)<br />

c2 Ces <strong>de</strong>ux <strong>de</strong>rnières formules montrent comment les expressions relativistes <strong>de</strong> la quantité <strong>de</strong><br />

mouvement et <strong>de</strong> l’énergie cinétique diffèrent <strong>de</strong>s expressions newtoniennes aux faibles vitesses.<br />

64


5.3 Energie d’une particule. Inertie <strong>de</strong> l’énergie<br />

La formule (5.11) suggère que la quantité mc 2 est une énergie qui appartient en propre<br />

à la particule lorsque celle-ci est au repos par rapport au référentiel choisi pour décrire les<br />

phénomènes. On peut montrer la validité <strong>de</strong> ce point <strong>de</strong> vue en considérant le cas d’un choc<br />

mou <strong>de</strong> <strong>de</strong>ux particules <strong>de</strong> masses i<strong>de</strong>ntiques m0 animées <strong>de</strong> vitesse opposées avant la collision.<br />

Dans un référentiel galiléen S, donnons-nous <strong>de</strong>ux particules isolées (1) et (2) i<strong>de</strong>ntiques se<br />

mouvant sur la même ligne droite avec <strong>de</strong>s vitesses v(1) et v(2) opposées : v(2) = −v(1). On peut<br />

toujours choisir l’origine O et l’axe Ox 1 <strong>de</strong> telle sorte que le mouvement <strong>de</strong>s <strong>de</strong>ux particules<br />

s’effectue sur Ox 1 et que la collision frontale se produise en O. On appelle m0 la masse <strong>de</strong><br />

chaque particule inci<strong>de</strong>nte. On suppose que la collision est un choc tel que les <strong>de</strong>ux particules<br />

fusionnent parfaitement en donnant une particule unique ayant une masse M (choc mou). Il<br />

résulte immédiatement <strong>de</strong> la conservation <strong>de</strong> la quantité <strong>de</strong> mouvement totale que la particule<br />

résultante est au repos par rapport au référentiel S. Pour simplifier, nous posons<br />

v = v 1 (1) = −v 1 (2). (5.14)<br />

Pour déterminer la masse M <strong>de</strong> la particule résultante, décrivons la collision dans le référentiel<br />

galiléen S ′ se mouvant avec la vitesse v(1) par rapport au référentiel S. Nous supposons que les<br />

axes <strong>de</strong> S et <strong>de</strong> S ′ sont disposés comme on l’a représenté sur la Fig. 4.1 du chapitre précé<strong>de</strong>nt.<br />

Par rapport à S ′ , la vitesse v1′ (1) <strong>de</strong> la particule (1) est nulle et la vitesse v1′<br />

(2) <strong>de</strong> la particule (2)<br />

est selon la loi <strong>de</strong> composition <strong>de</strong>s vitesses énoncée par les éqs. (4.35) (w doit être remplacé ici<br />

par v) :<br />

v 1′ −v − v<br />

(2) =<br />

1 − v(−v)<br />

c2 = − 2v<br />

1 + v2<br />

c2 . (5.15)<br />

La vitesse <strong>de</strong> la particule résultante par rapport à S ′ est évi<strong>de</strong>mment −v. La conservation<br />

<strong>de</strong> la quantité <strong>de</strong> mouvement totale se traduit donc dans S ′ par l’équation<br />

−<br />

<br />

<br />

1<br />

−<br />

<br />

m0<br />

c 2<br />

4v2 <br />

1+ v2<br />

c2 2 2v<br />

1 + v2<br />

c 2<br />

= − Mv<br />

<br />

1 − v2<br />

c2 . (5.16)<br />

Après une division <strong>de</strong>s <strong>de</strong>ux membres par −v et un petit calcul, (5.16) donne pour la masse<br />

<strong>de</strong> la particule résultant <strong>de</strong> la collision :<br />

M = 2m0<br />

<br />

1 − v2<br />

c2 . (5.17)<br />

Cette formule montre que la masse M <strong>de</strong> la particule résultant d’un choc parfaitement mou,<br />

i.e. sans rebond, est plus gran<strong>de</strong> que la somme <strong>de</strong>s masses m0 <strong>de</strong>s particules inci<strong>de</strong>ntes. D’où<br />

la conclusion fondamentale : le principe newtonien stipulant que la masse inerte d’un système<br />

est égale à la somme <strong>de</strong>s masses inertes <strong>de</strong>s particules constituant ce système ne peut être<br />

maintenu.<br />

Nous allons voir que la relation (5.17) permet d’établir l’équivalence entre masse inerte et<br />

énergie au repos à condition d’admettre la validité <strong>de</strong>s trois hypothèses suivantes :<br />

65


1.— On peut attribuer à toute particule <strong>de</strong> masse inerte m une énergie définie par une<br />

relation <strong>de</strong> la forme<br />

E = Ec + Er, (5.18)<br />

où Ec est l’énergie cinétique donnée par (5.11) et Er est l’énergie au repos <strong>de</strong> la particule.<br />

2.— L’énergie au repos d’une telle particule dépend uniquement <strong>de</strong> sa masse inerte. Il résulte<br />

alors du principe d’équivalence <strong>de</strong>s référentiels galiléens que Er est indépendante du référentiel<br />

galiléen. Autrement dit, Er est une fonction universelle <strong>de</strong> m, ce qui nous permet <strong>de</strong> poser<br />

Er = Er(mc 2 ). (5.19)<br />

3.— La fonction universelle Er(mc 2 ) est une fonction continue <strong>de</strong> m telle que<br />

Er(0) = 0. (5.20)<br />

Il est possible <strong>de</strong> déterminer la fonction Er(mc2 ) en écrivant la conservation <strong>de</strong> l’énergie<br />

totale. Dans le référentiel S, on a en effet d’après (5.18) et (5.19) :<br />

⎛ ⎞<br />

2m0c 2<br />

⎜ 1<br />

⎜<br />

⎝<br />

<br />

1 − v2<br />

c2 ⎟<br />

− 1⎟<br />

⎠ + 2Er(m0c 2 ) = Er(Mc 2 ). (5.21)<br />

Compte tenu <strong>de</strong> (5.17), (5.21) s’écrit<br />

Er(Mc 2 ) − Mc 2 = 2 <br />

Er(m0c 2 ) − m0c 2<br />

. (5.22)<br />

Posons M = 2m1. La relation (5.22) s’écrit alors<br />

Er(2m1c 2 ) − 2m1c 2 = 2Er(m0c 2 ) − 2m0c 2 . (5.23)<br />

Cette relation doit être vérifiée pour toute masse m0 et pour toute masse m1 ≥ m0 puisque<br />

v peut être choisie arbitrairement entre 0 et c. Pour m1 = m0, (5.23) donne<br />

Er(2m0c 2 ) = 2Er(m0c 2 ) (5.24)<br />

La relation (5.24) entraîne évi<strong>de</strong>mment Er(2m1c 2 ) = 2Er(m1c 2 ) puisque la fonction E(mc 2 )<br />

est universelle. L’équation (5.23) peut donc s’écrire après division <strong>de</strong>s <strong>de</strong>ux membres par 2 :<br />

Er(m1c 2 ) − Er(m0c 2 ) = m1c 2 − m0c 2 . (5.25)<br />

Il résulte immédiatement <strong>de</strong> l’équation (5.25) et <strong>de</strong> l’hypothèse 3 que la fonction universelle<br />

Er(m) est donnée par la célèbre relation<br />

Er(mc 2 ) = mc 2 . (5.26)<br />

Nous avons établi cette relation en étudiant le choc mou <strong>de</strong> <strong>de</strong>ux particules, mais nous<br />

aurions pu par exemple remplacer les <strong>de</strong>ux particules par <strong>de</strong>ux sphères matérielles i<strong>de</strong>ntiques<br />

subissant un choc mou. C’est pourquoi on admet la validité générale du postulat qui suit.<br />

Postulat 5.3.1 (Principe <strong>de</strong> l’inertie <strong>de</strong> l’énergie) Tout système physique <strong>de</strong> masse inerte<br />

m possè<strong>de</strong> une énergie au repos Er = mc 2 . Réciproquement, tout système possédant une énergie<br />

totale au repos Er a une masse inerte m = Er/c 2 .<br />

Le postulat 5.3.1 s’est avéré en excellent accord avec l’expérience. Cette extension du principe<br />

<strong>de</strong> l’inertie <strong>de</strong> l’énergie est à la base, on le sait, <strong>de</strong> l’exploitation <strong>de</strong> l’énergie nucléaire et<br />

permet d’expliquer le rayonnement <strong>de</strong>s étoiles.<br />

66


5.4 Relations entre l’énergie et la quantité <strong>de</strong> mouvement<br />

d’une particule<br />

Il résulte <strong>de</strong> ce qui précè<strong>de</strong> qu’on peut attribuer à toute particule <strong>de</strong> masse inerte m et <strong>de</strong><br />

vecteur vitesse v une énergie E et une quantité <strong>de</strong> mouvement p respectivement définies par<br />

et<br />

E = Er + Ec = mc2<br />

<br />

1 − v2<br />

c2 (5.27)<br />

p = mv<br />

<br />

1 − v2<br />

c2 . (5.28)<br />

L’énergie E peut s’exprimer en fonction <strong>de</strong> m et <strong>de</strong> p. Formons en effet le carré <strong>de</strong> chacun<br />

<strong>de</strong>s membres <strong>de</strong> (5.28). Il vient :<br />

p 2 = m2v2 1 − v2<br />

c2 ,<br />

ce qui entraîne<br />

m 2 c 2 + p 2 = m 2 c 2 + m2v2 1 − v2<br />

c2 = m2c2 1 − v2<br />

c2 . (5.29)<br />

Rapprochée <strong>de</strong> l’expression <strong>de</strong> l’énergie donnée par (5.27), l’équation (5.29) montre que<br />

l’énergie d’une particule s’exprime en fonction <strong>de</strong> la masse et <strong>de</strong> la quantité <strong>de</strong> mouvement par<br />

la relation<br />

E =<br />

<br />

m 2 c 4 + c 2 p 2 . (5.30)<br />

On peut également exprimer le vecteur quantité <strong>de</strong> mouvement en fonction <strong>de</strong> l’énergie E<br />

et du vecteur vitesse v. En effet, l’équation (5.27) donne<br />

m<br />

<br />

1 − v2<br />

c2 = E<br />

c 2.<br />

En substituant (5.31) dans (5.28), il vient donc :<br />

p = E<br />

c 2v.<br />

(5.31)<br />

(5.32)<br />

Les relations (5.30) et (5.32) sont fondamentales en théorie <strong>de</strong>s particules <strong>de</strong> masse non<br />

nulle. Elles permettent également d’élaborer la théorie <strong>de</strong>s particules <strong>de</strong> masse nulle, comme<br />

nous allons le voir maintenant.<br />

5.5 Particules <strong>de</strong> masse nulle<br />

67


Les formules obtenues jusqu’ici montrent que si la masse d’une particule est supposée = 0,<br />

l’énergie et la quantité <strong>de</strong> mouvement sont <strong>de</strong>s quantités réelles si et seulement si la vitesse |v|<br />

<strong>de</strong> la particule est inférieure à c. Nous pouvons en conclure qu’une particule <strong>de</strong> masse inerte m<br />

réelle non nulle a une ligne d’univers du genre temps.<br />

Peut-il exister <strong>de</strong>s particules <strong>de</strong> masse nulle ? Les formules (5.27) et (5.28) montrent qu’une<br />

particule <strong>de</strong> masse nulle se mouvant avec une vitesse inférieure à c possè<strong>de</strong> une énergie et une<br />

quantité <strong>de</strong> mouvement toutes <strong>de</strong>ux nulles. Or, un objet ne transportant ni énergie ni quantité<br />

<strong>de</strong> mouvement ne semble pas pouvoir constituer une entité physique observable. Le formalisme<br />

<strong>de</strong> la théorie rend toutefois possible l’existence <strong>de</strong> masses nulles transportant une énergie et une<br />

quantité <strong>de</strong> mouvement différentes <strong>de</strong> zéro. On voit en effet que poser m = 0 dans l’ équation<br />

(5.30) entraîne la relation<br />

E = c|p|<br />

qui est compatible avec l’équation (5.32) et avec la condition E = 0 si la vitesse <strong>de</strong> la particule<br />

est égale à la vitesse fondamentale c. Nous pouvons donc énoncer la proposition suivante.<br />

Proposition 5.5.1 Une particule se mouvant avec une vitesse égale à c est une particule <strong>de</strong><br />

masse nulle. L’énergie E et la quantité <strong>de</strong> mouvement p d’une telle particule sont liées par la<br />

relation :<br />

|p| = E<br />

. (5.33)<br />

c<br />

On notera que la relation fondamentale (5.33) peut encore s’écrire <strong>de</strong> manière équivalente<br />

E2 c2 − p2 = 0. (5.34)<br />

Nous avons vu qu’on pouvait admettre expérimentalement que la vitesse <strong>de</strong> propagation<br />

<strong>de</strong> la lumière dans le vi<strong>de</strong> est égale à la vitesse fondamentale. Par ailleurs, l’étu<strong>de</strong> <strong>de</strong> l’effet<br />

photoélectrique a conduit Einstein à admettre que l’énergie transportée par une on<strong>de</strong> électromagnétique<br />

monochromatique <strong>de</strong> fréquence ν est distribuée en paquets discrets ou quanta d’énergie<br />

E = hν, où h est la constante <strong>de</strong> Planck2 . Ces quanta d’énergie lumineuse sont appelés <strong>de</strong>s<br />

photons. La relativité restreinte conduit donc à admettre que les photons sont <strong>de</strong>s particules <strong>de</strong><br />

masse nulle.<br />

Il résulte <strong>de</strong> (5.33) qu’un photon d’énergie hν possè<strong>de</strong> une quantité <strong>de</strong> mouvement donnée<br />

par<br />

|p| = hν<br />

. (5.35)<br />

c<br />

5.6 Loi fondamentale <strong>de</strong> la dynamique<br />

Donnons-nous un référentiel galiléen S et considérons une particule <strong>de</strong> masse m soumise<br />

à <strong>de</strong>s forces dont la résultante dans S est le vecteur F. En physique prérelativiste, la loi<br />

fondamentale <strong>de</strong> la dynamique (ou secon<strong>de</strong> loi <strong>de</strong> Newton) se traduit par l’équation<br />

2 h = 6,626 × 10 −34 J.s.<br />

F = d(mv)<br />

. (5.36)<br />

dt<br />

68


qui redonne la relation bien connue<br />

F = ma, a = dv<br />

, (5.37)<br />

dt<br />

lorsque la masse m est invariable.<br />

La relation (5.36) suggère <strong>de</strong> formuler le postulat suivant, qui s’est avérée en excellent accord<br />

avec l’expérience :<br />

Postulat 5.6.1 (Principe fondamental <strong>de</strong> la dynamique relativiste) Dans un référentiel<br />

galiléen arbitraire, le mouvement d’une particule <strong>de</strong> masse inerte m soumise à <strong>de</strong>s forces <strong>de</strong><br />

résultante F est gouverné par l’équation<br />

F = dp<br />

dt<br />

Ce postulat entraîne la proposition qui suit.<br />

⎛<br />

⎞<br />

d ⎜ mv<br />

= ⎜<br />

dt<br />

⎝<br />

<br />

1 − v2<br />

c2 ⎟<br />

⎠ . (5.38)<br />

Proposition 5.6.1 Soit P une particule <strong>de</strong> masse m soumise à <strong>de</strong>s forces <strong>de</strong> résultante F. La<br />

variation <strong>de</strong> l’énergie E <strong>de</strong> la particule est lié à la puissance <strong>de</strong> la force résultante F par la<br />

relation :<br />

dE<br />

dt = F.v + c2 <br />

dm<br />

dt<br />

1 − v2<br />

.<br />

c2 (5.39)<br />

Démonstration <strong>de</strong> la proposition 5.6.1.— En utilisant la règle <strong>de</strong> dérivation <strong>de</strong> Leibniz, la<br />

loi <strong>de</strong> la dynamique (5.38) s’écrit<br />

à condition <strong>de</strong> poser 3<br />

F = dm<br />

dt<br />

v<br />

√<br />

1 − β2 m dv<br />

+ √<br />

1 − β2 dt +<br />

β = |v|<br />

c<br />

m<br />

(1 − β 2 ) 3/2<br />

1<br />

c2 <br />

v. dv<br />

<br />

v, (5.40)<br />

dt<br />

v<br />

= . (5.41)<br />

c<br />

Notant que v.dv/dt = c 2 βdβ/dt, on déduit <strong>de</strong> (5.40) que la puissance <strong>de</strong> F s’écrit<br />

Or, on voit que<br />

F.v = mc2<br />

√<br />

1 − β2 βdβ<br />

dt + mc2β2 (1 − β2 ) 3/2βdβ dt +<br />

mc2 √<br />

1 − β2 βdβ<br />

dt + mc2β2 (1 − β2 ) 3/2βdβ dt ≡<br />

≡<br />

β2 √<br />

1 − β2 c2dm . (5.42)<br />

dt<br />

mc2 (1 − β2 ) 3/2[1 − β2 + β 2 ]β dβ<br />

dt<br />

mc2 (1 − β2 ) 3/2βdβ dt<br />

3 On notera que la quantité β définie par (5.41) est relative à la particule, alors que la quantité β du chap. 4<br />

était relative au référentiel galiléen utilisé pour décrire le mouvement.<br />

69


Mais on vérifie facilement que<br />

mc2 (1 − β2 ) 3/2βdβ dt<br />

<br />

2 d mc<br />

= √ −<br />

dt 1 − β2 Substituons le second membre <strong>de</strong> (5.43) dans (5.42). Il vient<br />

Du fait que<br />

l’équation (5.44) s’écrit<br />

F.v = d<br />

<br />

2 mc<br />

√ −<br />

dt 1 − β2 1<br />

−√<br />

1 − β2 c2dm<br />

dt +<br />

1<br />

√ 1 − β 2 c2dm<br />

dt +<br />

β 2<br />

√ 1 − β 2 c2dm<br />

dt<br />

1<br />

√ 1 − β 2 c2dm<br />

dt<br />

β 2<br />

√ 1 − β 2 c2dm<br />

dt<br />

<br />

≡ − 1 − β2c 2dm<br />

dt<br />

F.v = d<br />

<br />

2 mc<br />

√ − c<br />

dt 1 − β2 2dm<br />

<br />

1 − β<br />

dt<br />

2<br />

(5.43)<br />

(5.44)<br />

Cette équation est équivalente à (5.39). C. Q. F. D.<br />

Lorsque la masse m reste invariable, l’énergie E figurant dans la formule (5.39) peut être<br />

remplacée par l’énergie cinétique Ec définie par (5.11). On a alors la relation<br />

dEc<br />

dt<br />

= F.v, (5.45)<br />

équation formellement analogue à la relation existant entre la variation d’énergie cinétique et la<br />

puissance <strong>de</strong> la force en mécanique newtonienne usuelle. L’équation (5.45) est souvent présentée<br />

comme une justification a posteriori du postulat fondamental 5.6.1.<br />

En multipliant le numérateur et le dénominateur par c 2 , l’équation (5.38) <strong>de</strong> la dynamique<br />

peut encore s’écrire<br />

F =<br />

m<br />

<br />

1 − v2<br />

c2 dv<br />

dt<br />

⎛<br />

⎞<br />

v d ⎜ mc<br />

+ ⎜<br />

c2. dt<br />

⎝<br />

2<br />

<br />

1 − v2<br />

c2 ⎟<br />

⎠ =<br />

m<br />

<br />

1 − v2<br />

c 2<br />

a + v<br />

c 2<br />

dE<br />

. (5.46)<br />

dt<br />

Remplaçons dE/dt par l’expression (5.39) dans (5.46). On voit que l’équation fondamentale<br />

<strong>de</strong> la dynamique peut s’écrire sous la forme<br />

F =<br />

m<br />

<br />

1 − v2<br />

c2 ⎡<br />

a + ⎣ (F.v)<br />

<br />

+ 1 −<br />

c2 v2<br />

c2 ⎤<br />

dm<br />

⎦ v. (5.47)<br />

dt<br />

L’équation (5.47) montre qu’en relativité le 3-vecteur force et le 3-vecteur accélération ne<br />

sont généralement pas colinéaires. On notera que si la masse <strong>de</strong> la particule <strong>de</strong>meure constante<br />

au cours <strong>de</strong> l’interaction, la colinéarité <strong>de</strong> F et <strong>de</strong> a se produit si et seulement si F est orthogonal<br />

à v ou parallèle à v.<br />

70


5.7 Particule chargée dans un champ électromagnétique<br />

Pour illustrer ce qui précè<strong>de</strong>, considérons une particule <strong>de</strong> charge électrique e en mouvement<br />

dans un champ électromagnétique donné 4 , caractérisé par un champ électrique E(t,x) et une<br />

induction magnétique B(t,x). On admet que le premier membre <strong>de</strong> l’équation fondamentale <strong>de</strong><br />

la dynamique s’i<strong>de</strong>ntifie à la force <strong>de</strong> Lorentz F = e [E + v × B]. Le mouvement <strong>de</strong> la particule<br />

satisfait donc l’équation 5<br />

⎛<br />

d<br />

⎝<br />

dt<br />

mv<br />

<br />

1 − v2<br />

c2 ⎞<br />

⎠ = e [E + v × B] . (5.48)<br />

Dans tout ce qui suit, on suppose que la masse <strong>de</strong> la particule est invariable. On notera que<br />

l’équation (5.48) se réduit à<br />

ma = e [E + v × B] (5.49)<br />

si la particule se meut avec une vitesse très petite par rapport à la vitesse fondamentale c.<br />

La partie <strong>de</strong> la force <strong>de</strong> Lorentz due à l’induction magnétique B est orthogonale au vecteur<br />

vitesse : seul le champ électrique fournit un travail. L’équation (5.39) s’écrit donc ici<br />

⎛<br />

d<br />

⎝<br />

dt<br />

mc2<br />

<br />

1 − v2<br />

c2 ⎞<br />

⎠ dt = e(E.v). (5.50)<br />

Dans la théorie <strong>de</strong> Maxwell, le champ électrique E(t,x) s’exprime à partir d’un potentiel<br />

V (t,x) et d’un potentiel vecteur A(t,x) par la relation<br />

où ∇V est le vecteur gradient du potentiel scalaire V . On a donc<br />

E = −∇V − ∂A<br />

, (5.51)<br />

∂t<br />

e(E.v) = −ev.∇V − ev. ∂A<br />

. (5.52)<br />

∂t<br />

Or, la dérivée totale <strong>de</strong> V (t,x) par rapport au temps le long <strong>de</strong> la ligne d’univers <strong>de</strong> la<br />

particule chargée est<br />

ce qui entraîne<br />

dV<br />

dt<br />

ev.∇V = e dV<br />

dt<br />

Substituons (5.54) dans (5.52). Il vient<br />

e(E.v) = −e dV<br />

dt<br />

∂V<br />

= v.∇V + , (5.53)<br />

∂t<br />

+ e∂V<br />

∂t<br />

− e∂V . (5.54)<br />

∂t<br />

− ev.∂A . (5.55)<br />

∂t<br />

4 On veut dire par là que le champ électromagnétique est imposé par un ou <strong>de</strong>s systèmes extérieurs et n’est en<br />

aucune manière influencé par la particule chargée considérée. On dit aussi que cette particule est une particule<br />

d’épreuve. On notera que cette approche n’est acceptable que si on peut négliger l’émission <strong>de</strong> radiation par la<br />

particule chargée.<br />

5 Toutes les quantités sont exprimées dans le sytème SI.<br />

71


Substituons maintenant (5.55) dans (5.50) . Nous obtenons la relation :<br />

qui s’écrit encore<br />

⎛<br />

d<br />

⎝<br />

dt<br />

mc2<br />

<br />

1 − v2<br />

c2 ⎞<br />

⎠ = −e dV<br />

dt<br />

⎛<br />

d<br />

⎝<br />

dt<br />

mc2<br />

<br />

1 − v2<br />

c2 ⎞<br />

+ e<br />

∂V<br />

∂t<br />

<br />

∂V<br />

+ eV ⎠ = e<br />

∂t<br />

− v.∂A<br />

∂t<br />

− v.∂A<br />

∂t<br />

<br />

<br />

(5.56)<br />

. (5.57)<br />

Le second membre <strong>de</strong> (5.57) n’est généralement pas une différentielle totale le long <strong>de</strong> la<br />

ligne d’univers <strong>de</strong> la particule. Il est donc en règle générale impossible <strong>de</strong> définir une énergie<br />

totale conservée pour une particule chargée soumise à un champ électromagnétique donné.<br />

Lorsque le champ électromagnétique est indépendant du temps (on dit aussi constant ou<br />

encore stationnaire), il est toutefois possible <strong>de</strong> définir une loi <strong>de</strong> conservation <strong>de</strong> l’énergie.<br />

Dans ce cas en effet, on peut choisir la jauge du champ <strong>de</strong> telle sorte que les potentiels V et A<br />

soient <strong>de</strong>s fonctions indépendantes du temps, ce qui entraîne la nullité du second membre <strong>de</strong><br />

(5.57). La quantité figurant entre les parenthèses dans le premier membre est alors constante<br />

au cours du mouvement <strong>de</strong> la particule. Nous pouvons donc énoncer la proposition qui suit.<br />

Proposition 5.7.1 Dans un champ électromagnétique indépendant du temps <strong>de</strong> potentiel V =<br />

V (x), le mouvement d’une particule chargée <strong>de</strong> masse invariable m et <strong>de</strong> charge e est tel que<br />

la relation <strong>de</strong> conservation<br />

mc2 <br />

1 − v2<br />

c2 + eV (x) = Cte (5.58)<br />

soit satisfaite.<br />

L’intégrale première (5.58) est évi<strong>de</strong>mment précieuse pour l’étu<strong>de</strong> du mouvement, comme<br />

on va le voir dans la section suivante.<br />

5.8 Un exemple : mouvement d’une charge dans un champ<br />

magnétique constant uniforme<br />

Supposons qu’il n’y ait pas <strong>de</strong> champ électrique et que le champ magnétique soit indépendant<br />

du temps6 . Le premier membre <strong>de</strong> (5.58) se confond alors avec l’énergie <strong>de</strong> la particule7 <br />

E =<br />

mc 2 /<br />

1 − v2<br />

c 2 puisqu’on peut toujours poser V = 0. On a dès lors l’intégrale première<br />

E = mc2<br />

<br />

1 − v2<br />

c2 = Cte. (5.59)<br />

6On notera que d’après les équations <strong>de</strong> Maxwell, E(t,x) = 0 entraîne ∂B(t,x)/∂t = 0 dans les régions<br />

vi<strong>de</strong>s <strong>de</strong> charges.<br />

7Dans cette section, nous utilisons la lettre calligraphique E pour l’énergie <strong>de</strong> la particule afin d’éviter toute<br />

confusion avec le champ électrique.<br />

72


Il est commo<strong>de</strong> décrire (5.38) en remplaçant p par son expression donnée par (5.32). On<br />

obtient ainsi l’équation du mouvement<br />

dp<br />

dt<br />

E<br />

=<br />

c2 dv<br />

dt<br />

= ev × B,<br />

soit en divisant les <strong>de</strong>ux membres par la constante E/c 2<br />

dv<br />

dt<br />

= ec2<br />

E<br />

(v × B). (5.60)<br />

On peut remplacer E par mc 2 lorsque la particule est <strong>de</strong> vitesse très petite par rapport à c<br />

(approximation non relativiste). Lae rapport ec 2 /E se réduit alors à e/m.<br />

Lorsque le champ magnétique constant est en outre supposé uniforme, on peut poser<br />

B = Bk, (5.61)<br />

où B est une constante et k un vecteur unitaire constant. A condition <strong>de</strong> poser<br />

l’équation du mouvement (5.60) s’écrit alors<br />

dv<br />

dt<br />

ω = eBc2<br />

, (5.62)<br />

E<br />

= ω(v × k). (5.63)<br />

La quantité ω est appelée fréquence synchrotron ou encore fréquence <strong>de</strong> gyration. On notera<br />

que pour une particule <strong>de</strong> masse donnée, la fréquence synchrotron dépend <strong>de</strong> la vitesse <strong>de</strong> la<br />

particule. Il suit en effet <strong>de</strong> (5.59) que<br />

ω = eB<br />

m<br />

1<br />

, (5.64)<br />

Γ<br />

où Γ est le facteur <strong>de</strong> Lorentz <strong>de</strong> la particule (cf. Chap. 3). La quantité eB/m est appelée<br />

fréquence cyclotron.<br />

À titre d’exercice, on déduira <strong>de</strong> cette équation que la trajectoire <strong>de</strong> la particule est une<br />

hélice dont l’axe est parallèle au vecteur B et dont le rayon R est donné par<br />

R = E(v⊥)0<br />

, (5.65)<br />

e|B|c2 où (v⊥)0 est la valeur absolue <strong>de</strong> la projection du vecteur vitesse initiale <strong>de</strong> la particule sur un<br />

plan orthogonal à B.<br />

Pour démontrer cette relation, on pourra au choix expliciter et intégrer les équations (5.63)<br />

dans un système d’axes orthonormés (O,x 1 ,x 2 ,x 3 ) tel que Ox 3 soit parallèle à B, ou bien<br />

utiliser une métho<strong>de</strong> vectorielle fondée sur la décomposition du vecteur vitesse v <strong>de</strong> la particule<br />

en un vecteur v|| parallèle à B et un vecteur v⊥ orthogonal à B.<br />

La formule (5.65) est à la base <strong>de</strong> la conception <strong>de</strong>s synchrocyclotrons et <strong>de</strong>s synchrotrons,<br />

accélérateurs <strong>de</strong> particules permettant d’obtenir <strong>de</strong>s vitesses relativistes. Le complexe du CERN<br />

73


près <strong>de</strong> Genève abrite plusieurs synchrotrons, dont le plus grand du mon<strong>de</strong>, le Large Hadron<br />

Colli<strong>de</strong>r (LHC), inauguré en 2008.<br />

Lorsque |v| est très faible <strong>de</strong>vant c, on a E ≈ mc 2 . La relation (5.65) se réduit alors à<br />

R ≈ m(v⊥)0<br />

e|B|<br />

(5.66)<br />

Cette relation approchée est suffisante pour rendre compte du fonctionnement <strong>de</strong>s cyclotrons,<br />

qui sont <strong>de</strong>s accélérateurs <strong>de</strong> particules limités à <strong>de</strong>s vitesses petites <strong>de</strong>vant c.<br />

74


Chapitre 6<br />

Dynamique relativiste (II)<br />

Dans le chapitre précé<strong>de</strong>nt, nous avons montré comment on peut édifier la dynamique<br />

relativiste <strong>de</strong>s particules en maintenant la distinction entre l’espace affine à trois dimensions<br />

associé à un référentiel galiléen arbitraire et le temps dans le même référentiel. Le but <strong>de</strong> ce<br />

nouveau chapitre est formuler les équations <strong>de</strong> la dynamique en termes <strong>de</strong> vecteurs et <strong>de</strong> tenseurs<br />

sur l’espace-temps <strong>de</strong> Minkowski. Cette reconstruction est en fait indispensable pour développer<br />

une dynamique <strong>de</strong>s milieux continus, et préparer ainsi le terrain aux théories relativistes <strong>de</strong> la<br />

gravitation.<br />

6.1 Quadri-vecteur vitesse unitaire d’une particule<br />

6.2 Quadrivecteur impulsion-énergie<br />

6.3 Quadrivecteur accélération<br />

6.4 Loi <strong>de</strong> la dynamique en formalisme quadridimensionnel<br />

6.5 Dynamique <strong>de</strong>s milieux continus<br />

75


Chapitre 7<br />

Gravitation et relativité<br />

La gravitation est une interaction qui rend les corps interdépendants les uns <strong>de</strong>s autres,<br />

indépendamment <strong>de</strong> leurs charges électriques ou <strong>de</strong>s actions <strong>de</strong> contact qu’ils peuvent subir.<br />

Dans le chapitre 5, nous avons supposé <strong>de</strong> manière explicite l’absence <strong>de</strong> cette interaction pour<br />

énoncer le principe d’équivalence <strong>de</strong>s référentiels galiléens (ou principe <strong>de</strong> relativité). Il nous<br />

allons voir maintenant que les idées relativistes entraînent inéluctablement une modification<br />

radicale <strong>de</strong> notre conception <strong>de</strong> l’interaction gravitationnelle. Nous commençons par exposer la<br />

théorie <strong>de</strong> Newton dans le cadre préeinsteinien.<br />

7.1 La théorie newtonienne <strong>de</strong> la gravitation<br />

Dans ce chapitre, nous considérons uniquement <strong>de</strong>s particules <strong>de</strong> masse invariable.<br />

Loi newtonienne <strong>de</strong> la gravitation.— Soient P1 et P2 <strong>de</strong>ux particules quelconques dont<br />

les vecteurs position respectifs sont <strong>de</strong>s fonctions du temps x1(t) et x2(t). La particule P1 exerce<br />

sur la particule P2 une force attractive dont l’expression F 12(t) à l’instant t est donnée par :<br />

F 12(t) = −G<br />

m1m2<br />

|x2(t) − x1(t)| 2<br />

x2(t) − x1(t)<br />

, (7.1)<br />

|x2(t) − x1(t)|<br />

où m1 et m2 sont les masses inertes respectives <strong>de</strong> P1 et P2 et G est une constante universelle,<br />

appelée constante <strong>de</strong> la gravitation. La particule P2 exerce sur P1 une force F 21(t) = −F 12(t).<br />

Rappelons qu’on appelle masse inerte d’une particule P le coefficient m figurant dans<br />

l’énoncé <strong>de</strong> la loi fondamentale <strong>de</strong> la dynamique galiléenne<br />

F étant la résultante <strong>de</strong>s forces agissant sur P à l’instant t.<br />

F = ma, a(t) = d2 x(t)<br />

dt 2 , (7.2)<br />

La loi <strong>de</strong> gravitation (7.1) présente un certain nombre <strong>de</strong> propriétés fondamentales qu’il<br />

importe <strong>de</strong> dégager.<br />

76


P1.— La force gravitationnelle newtonienne est une action à distance. La théorie newtonienne<br />

ne fournit en effet aucune hypothèse plausible permettant <strong>de</strong> concevoir la gravitation<br />

comme une action <strong>de</strong> contact.<br />

P2.— Du fait <strong>de</strong> la décroissance <strong>de</strong> |F | selon une loi <strong>de</strong> puissance <strong>de</strong> la distance, la gravitation<br />

est une interaction dite <strong>de</strong> portée infinie, par opposition aux forces décroissant exponentiellement,<br />

qui sont dites <strong>de</strong> portée finie (interaction décrite par un potentiel <strong>de</strong> Yukawa, par<br />

exemple).<br />

P3.— En accord avec l’invariance galiléenne, la propagation <strong>de</strong> la gravitation s’effectue avec<br />

une vitesse infinie. On dit encore que l’interaction gravitationnelle newtonienne est instantanée.<br />

P4.— L’expression (7.1) est vali<strong>de</strong> qu’il y ait ou non d’autres masses. La théorie newtonienne<br />

admet donc qu’il n’y a pas d’effet d’écran. C’est pourquoi on généralise la formule (7.1) en<br />

posant que la force gravitationnelle exercée par une distribution volumique <strong>de</strong> matière sur une<br />

particule <strong>de</strong> masse m en x à l’instant t est donnée par :<br />

<br />

F(x,t) = −Gm<br />

V (t)<br />

ρ(x ′ ,t)<br />

|x − x ′ | 2<br />

x − x ′<br />

|x − x ′ | d3 x ′ , (7.3)<br />

où ρ(x ′ ,t) est la <strong>de</strong>nsité volumique <strong>de</strong> masse inerte et V (t) est le volume occupé par la distribution<br />

considérée à l’instant t.<br />

P5.— On démontre que l’équation (7.3) peut s’écrire sous la forme :<br />

F(x,t) = ∇xU(x,t), (7.4)<br />

où ∇x désigne l’opérateur gradient opérant au point x et U est la fonction définie par<br />

<br />

ρ(x<br />

U(x,t) = G<br />

V (t)<br />

′ ,t)<br />

|x − x ′ | d3x ′ . (7.5)<br />

La fonction U(x,t) est appelée le potentiel <strong>de</strong> gravitation créé à l’instant t par la distribution<br />

matérielle répartie dans le volume V (t). On montre qu’à l’extérieur du volume V (t), U(x,t) est<br />

solution <strong>de</strong> l’équation <strong>de</strong> Laplace :<br />

∆2U = 0, (7.6)<br />

et qu’à l’intérieur du volume V empli <strong>de</strong> matière, U(x,t) vérifie l’équation <strong>de</strong> Poisson :<br />

∆2U(x,t) = −4πGρ(x,t), (7.7)<br />

où ∆2 est l’opérateur laplacien, défini en coordonnées cartésiennes orthonormées par<br />

∆2U(x,t) = δij<br />

∂ 2 U<br />

∂xi∂xj = ∂2U (∂x1 ) 2 + ∂2U (∂x2 ) 2 + ∂2U 77<br />

(∂x 3 ) 2.<br />

(7.8)


P6.— Les quantités m1 et m2 figurant dans l’équation (7.1) sont les masses inertes <strong>de</strong>s<br />

particules P1 et P2, avons-nous dit. Si nous supposons que le système constitué par les particules<br />

P1 et P2 est isolé, l’équation du mouvement <strong>de</strong> P2 est d’après (7.2) :<br />

m2<br />

d2x2(t) = −G<br />

dt2 m1m2<br />

|x2(t) − x1(t)| 2<br />

En divisant les <strong>de</strong>ux membres <strong>de</strong> (7.2) par m2, il vient l’équation :<br />

d2x2(t) = −G<br />

dt2 m1<br />

|x2(t) − x1(t)| 2<br />

x2(t) − x1(t)<br />

. (7.9)<br />

|x2(t) − x1(t)|<br />

x2(t) − x1(t)<br />

, (7.10)<br />

|x2(t) − x1(t)|<br />

dans laquelle la masse inerte m2 ne figure pas. On obtient bien entendu l’équation du mouvement<br />

<strong>de</strong> P1 en échangeant les rôles <strong>de</strong> m1 et m2 :<br />

d2x1(t) = G<br />

dt2 m2<br />

|x2(t) − x1(t)| 2<br />

x2(t) − x1(t)<br />

, (7.11)<br />

|x2(t) − x1(t)|<br />

et là encore, on constate l’absence <strong>de</strong> la masse inerte <strong>de</strong> la particule dont on décrit le mouvement.<br />

En mécanique newtonienne, les équations du mouvement <strong>de</strong>s particules P1 et P2 en interaction<br />

gravitationnelle ont la forme du système (7.10)-(7.11) dans n’importe quel référentiel<br />

galiléen. La loi <strong>de</strong> gravitation newtonienne satisfait donc le principe <strong>de</strong> relativité galiléenne.<br />

La loi (7.10) entraîne que <strong>de</strong>ux particules <strong>de</strong> masses inertes distinctes lâchées en un point<br />

donné au même instant avec <strong>de</strong>s vecteurs vitesse i<strong>de</strong>ntiques restent en coïnci<strong>de</strong>nce, pourvu<br />

que ces <strong>de</strong>ux particules soient seulement soumises à <strong>de</strong>s forces gravitationnelles. Cette caractéristique<br />

fondamentale <strong>de</strong> l’interaction gravitationnelle, postulée par Newton, est en fait<br />

remarquablement vérifiée avec un précision <strong>de</strong> 10 −13 par l’expérience en laboratoire. On l’appelle<br />

le principe d’équivalence faible ou selon la terminologie que nous adopterons la propriété<br />

d’universalité <strong>de</strong> la loi <strong>de</strong> chute libre. On parle d’universalité car nul objet n’échappe à la force<br />

gravitationnelle : il n’existe aucun moyen <strong>de</strong> construire une cage <strong>de</strong> Faraday gravitationnelle.<br />

Soulignons que par chute libre, nous entendons le mouvement d’une particule qui n’est soumise<br />

à aucune autre force que la gravitation.<br />

Historiquement, la propriété d’universalité <strong>de</strong> la loi <strong>de</strong> chute libre a servi <strong>de</strong> fil directeur<br />

pour introduire les théories métriques <strong>de</strong> la gravitation. Pour l’instant, nous nous contenterons<br />

<strong>de</strong> noter à quel point il est surprenant que les quantités m1 et m2 figurant dans (7.1) soient les<br />

masses inertes <strong>de</strong>s particules P1 et P2. A priori, une loi <strong>de</strong> force centrale attractive en inverse<br />

du carré <strong>de</strong> la distance <strong>de</strong>vrait s’écrire<br />

F 12 = −G M(a) 1 M (p)<br />

2<br />

|x2 − x1| 2<br />

x2 − x1<br />

, (7.12)<br />

|x2 − x1|<br />

où M (a)<br />

1 désignerait la masse grave (ou gravitationnelle) active créant la force F 12 et M (p)<br />

2<br />

désignerait la masse grave (ou gravitationnelle) passive subissant l’action <strong>de</strong> la masse active<br />

M (a)<br />

1 . Naturellement, la force F 21 agissant sur la particule P1 <strong>de</strong>vrait s’écrire<br />

F 21 = G M(p) 1 M (a)<br />

2<br />

|x2 − x1| 2<br />

78<br />

x2 − x1<br />

, (7.13)<br />

|x2 − x1|


M (p)<br />

1 étant la masse grave passive <strong>de</strong> la particule P1 et M (a)<br />

2 la masse grave active <strong>de</strong> la particule<br />

P2. Il n’y a aucune raison d’i<strong>de</strong>ntifier la masse grave active et la masse grave passive avec la<br />

masse inerte qui est une notion introduite indépendamment <strong>de</strong> la gravitation. On peut tout au<br />

plus limiter l’arbitraire sur le rapport (masse grave active)/(masse grave passive) en se référant<br />

au principe <strong>de</strong> l’égalité <strong>de</strong> l’action et <strong>de</strong> la réaction. Il découle en effet immédiatement <strong>de</strong>s<br />

équations (7.12) et (7.13) et <strong>de</strong> F 12 + F 21 = 0 que<br />

M (a)<br />

1<br />

M (p)<br />

1<br />

= M(a) 2<br />

M (p)<br />

2<br />

= constante universelle. (7.14)<br />

La loi <strong>de</strong> Newton ne se contente pas <strong>de</strong> postuler (7.14) : elle i<strong>de</strong>ntifie purement et simplement<br />

sans aucunement l’expliquer la masse inerte d’une particule avec sa masse grave passive (à une<br />

constante multiplicative universelle près, bien entendu, prise ici égale à l’unité).<br />

P7.— Il est enfin un caractère <strong>de</strong> la gravitation qui reste encore très énigmatique : la<br />

force gravitationnelle est extrêmement faible. La constante <strong>de</strong> la gravitation ayant pour valeur<br />

numérique G = 6, 67 × 10 −11 m 3 .s −2 .kg −1 , le rapport <strong>de</strong> la force gravitationnelle et <strong>de</strong> la force<br />

électrostatique qu’exercent l’un sur l’autre <strong>de</strong>ux protons est donné par<br />

Fgrav<br />

Felec<br />

mp étant la masse du proton et e sa charge.<br />

= 4πε0G m2 p<br />

e 2 ≈ 8, 3 × 10−37 ,<br />

7.2 Analyse critique <strong>de</strong> la théorie newtonienne<br />

La théorie newtonienne a permis une <strong>de</strong>scription remarquablement précise d’un ensemble<br />

impressionnant <strong>de</strong> phénomènes physiques (mouvements et figures <strong>de</strong>s corps célestes, comportements<br />

<strong>de</strong>s flui<strong>de</strong>s, etc.). Pourtant, il est clair qu’en dépit <strong>de</strong> ses succès, la conception newtonienne<br />

présente <strong>de</strong> graves défauts internes et s’est en outre trouvée en contradiction avec l’observation<br />

dès la secon<strong>de</strong> moitié du XIX e siècle.<br />

Incohérences conceptuelles<br />

1.— Nous avons vu que la théorie newtonienne décrit la gravitation comme une action à<br />

distance. Or, ce point <strong>de</strong> vue est acceptable comme <strong>de</strong>scription mathématique, mais pas comme<br />

théorie “fondamentale”. Il y a en effet action seulement là où il y a un être pour effectuer<br />

cette action. L’idée d’action à distance est donc inintelligible, comme l’a souligné le philosophe<br />

Leibniz, contemporain <strong>de</strong> Newton 1 .<br />

2.— Un autre défaut tout aussi grave <strong>de</strong> la conception newtonienne est <strong>de</strong> considérer la<br />

gravitation comme une interaction se propageant avec une vitesse infinie et d’entrer ainsi en<br />

1 Newton a reconnu ce point, tout en soulignant qu’il n’avait pu trouver un mécanisme physique plausible<br />

pour expliquer l’attraction par <strong>de</strong>s actions <strong>de</strong> contact.<br />

79


contradiction frontale avec la relativité restreinte 2 , qui s’est révélée en parfait accord avec<br />

l’expérience. La théorie <strong>de</strong> la gravitation doit donc être profondément modifiée. Par analogie<br />

avec la théorie <strong>de</strong> l’électromagnétisme proposée par Maxwell, il est naturel <strong>de</strong> supposer que<br />

la gravitation est un champ ayant une propagation s’effectuant avec une vitesse cg finie. Si<br />

on admettait en outre que l’interaction gravitationnelle satisfait au principe <strong>de</strong> relativité dans<br />

l’espace-temps <strong>de</strong> Minkowski, on <strong>de</strong>vrait même en conclure que cg = c et s’attendre notamment<br />

à l’existence d’on<strong>de</strong>s gravitationnelles se propageant avec la vitesse fondamentale, comme l’avait<br />

déjà vu H. Poincaré dès 1905 3 .<br />

3.— L’équation <strong>de</strong> Poisson (7.7) couple le potentiel <strong>de</strong> gravitation avec la <strong>de</strong>nsité ρ <strong>de</strong><br />

masse inerte. Or, la relativité restreinte montre que toutes les formes d’énergie contribuent<br />

à la masse d’un système matériel. Une théorie cohérente <strong>de</strong>vrait donc considérer toutes les<br />

distributions d’énergie comme <strong>de</strong>s sources du champ gravitationnel. Par exemple, un champ<br />

électromagnétique <strong>de</strong>vrait engendrer un champ gravitationnel.<br />

4.— Il serait peu cohérent d’admettre qu’une distribution d’énergie puisse créer un champ<br />

gravitationnel sans subir l’action du champ créé par une autre distibution d’énergie (dans<br />

le cas contraire, il existerait <strong>de</strong>s situations physiques dans lesquelles le principe d’égalité <strong>de</strong><br />

l’action et <strong>de</strong> la réaction serait violé, ce qui pourrait entraîner la possibilité du mouvement<br />

perpétuel, par ex.). Une théorie viable <strong>de</strong>vrait donc prévoir qu’une masse <strong>de</strong> matière comme le<br />

Soleil courbe un rayon lumineux tout comme elle incurve la trajectoire d’une planète ou d’une<br />

comète. L’introduction <strong>de</strong>s quanta <strong>de</strong> lumière ou photons conforte ce point <strong>de</strong> vue. N’oublions<br />

pas que <strong>de</strong>s calculs <strong>de</strong> déflexion <strong>de</strong> la lumière avaient déjà été tentés dans le cadre newtonien<br />

par Cavendish (1784) et Soldner (1801) précisément en supposant une structure corpusculaire<br />

<strong>de</strong> la lumière.<br />

Désaccord historique avec l’observation<br />

Avant même l’irruption <strong>de</strong>s idées relativistes, la théorie newtonienne présentait un grave<br />

désaccord avec les observations astronomiques. Dès 1859, Le Verrier avait en effet mis en<br />

évi<strong>de</strong>nce une avance résiduelle du périhélie <strong>de</strong> Mercure qu’il estimait être <strong>de</strong> l’ordre <strong>de</strong> 38”/siècle,<br />

inexpliquée par la mécanique céleste. L’existence <strong>de</strong> ce désaccord fut confirmé ultérieurement<br />

par Newcomb (1882, 1895), puis par Doolitle (1912). La valeur actuellement admise pour<br />

l’avance non newtonienne du périhélie <strong>de</strong> Mercure est 42,98”/siècle. Diverses explications ad<br />

hoc furent proposées en restant dans le cadre <strong>de</strong> la physique galiléenne : existence d’une planète<br />

intramercurielle (Vulcain), perturbation produite par un nuage <strong>de</strong> poussières à l’origine <strong>de</strong> la<br />

lumière zodiacale 4 , modification <strong>de</strong> la loi <strong>de</strong> gravitation visant à se rapprocher d’un modèle<br />

électrodynamique, etc. Ces tentatives ne purent cependant pas s’imposer, soit parce qu’elles<br />

ne furent pas confirmées par l’observation (on n’a jamais observé <strong>de</strong> planète intramercurielle),<br />

2 Notons que même avant l’apparition <strong>de</strong>s théories relativistes, la propagation instantanée <strong>de</strong> la gravitation<br />

était très difficilement acceptable. Comment concevoir en effet que si je bouge mon stylo, l’univers entier en soit<br />

instantanément informé ? Le son, les on<strong>de</strong>s sismiques, la lumière se propagent avec une vitesse finie. Pourquoi<br />

la gravitation ferait-elle exception ?<br />

3 Cf. Sur la dynamique <strong>de</strong> l’électron, Rendiconti <strong>de</strong>l Circolo mathematico di Palermo, t. 21, 1906. Réédité par<br />

J. Gabay, <strong>Paris</strong>.<br />

4 Déjà une hypothèse <strong>de</strong> matière noire...<br />

80


soit parce qu’elles contenaient trop d’arbitraire (poussières, modèles inspirés par l’electrodynamique)<br />

ou manquaient <strong>de</strong> cohérence interne.<br />

7.3 Introduction <strong>de</strong>s théories métriques<br />

À l’évi<strong>de</strong>nce, les conceptions relativistes exigent l’abandon <strong>de</strong> la théorie newtonienne <strong>de</strong><br />

la gravitation. De prime abord, il peut sembler naturel <strong>de</strong> chercher à construire une (ou <strong>de</strong>s)<br />

nouvelle(s) théorie(s) du champ <strong>de</strong> gravitation en conservant le cadre <strong>de</strong> l’espace-temps <strong>de</strong><br />

Minkowski. Cette démarche a suscité <strong>de</strong> nombreux travaux 5 . On sait aujourd’hui que cette<br />

construction est possible. Elle s’avère toutefois beaucoup moins simple conceptuellement que<br />

la démarche consistant à munir la variété <strong>de</strong>s événements d’une métrique plus générale que la<br />

métrique <strong>de</strong> Minkowski, selon l’approche initiée par Einstein. C’est cette approche géométrique<br />

que l’on retient ici.<br />

L’abandon du cadre spatio-temporel <strong>de</strong> Minkowski est motivé par un constat simple : le<br />

caractère universel <strong>de</strong> l’interaction gravitationnelle rend le principe d’inertie invérifiable. En<br />

effet, pour être considérée comme isolée, une particule <strong>de</strong>vrait être située à une distance infinie<br />

<strong>de</strong> toutes les concentrations matérielles, <strong>de</strong> manière à ne subir aucune action gravitationnelle<br />

mesurable. Or, rien n’indique que la matière et l’énergie <strong>de</strong> l’univers soit contenue dans un<br />

volume borné en <strong>de</strong>hors duquel il y aurait un “vi<strong>de</strong>” d’extension spatiale indéfinie. Nous pouvons<br />

donc accepter l’idée qu’il faut abandonner le principe d’inertie tel que nous l’avons formulé au<br />

chap. 3 et le remplacer par un principe qui tienne compte d’emblée du fait qu’une particule<br />

dépourvue <strong>de</strong> charge électrique, <strong>de</strong> moment magnétique et <strong>de</strong> “spin” n’est pas isolée mais<br />

effectue toujours un mouvement <strong>de</strong> chute libre dans un champ <strong>de</strong> gravitation.<br />

Quel serait ce nouveau principe ? Dans la section 7.1, nous avons souligné qu’une particule<br />

en chute libre tombe selon une loi <strong>de</strong> mouvement indépendante <strong>de</strong> sa masse inerte (propriété<br />

d’universalité <strong>de</strong> la loi <strong>de</strong> chute libre). Une manière naturelle d’expliquer cette indépendance<br />

serait <strong>de</strong> caractériser le mouvement <strong>de</strong> chute libre par une loi purement géométrique ne faisant<br />

pas intervenir la masse. Or, il se trouve que la relativité restreinte fournit d’emblée une indication<br />

précise <strong>de</strong> ce que peut être une telle loi. Dans le chap. 3, nous avons en effet montré que la<br />

ligne d’univers d’une particule en mouvement rectiligne uniforme par rapport à un référentiel<br />

galiléen arbitraire réalisait un extremum (en fait un maximum) <strong>de</strong> ds. Cette condition signifie<br />

que le mouvement d’une particule isolée dans un espace-temps dépourvu <strong>de</strong> gravitation est<br />

défini par le principe variationnel 6<br />

<br />

δ<br />

<br />

dx<br />

ηµν<br />

µ<br />

dℓ<br />

dxν dℓ = 0, (7.15)<br />

dℓ<br />

x µ = x µ (ℓ) étant les équations paramétriques <strong>de</strong> la ligne d’univers et les points x1 et x2 entre<br />

lesquels on calcule l’intégrale étant maintenues fixes quand on effectue la variation. L’équation<br />

5 dans l’espoir notamment <strong>de</strong> construire une théorie quantique du champ <strong>de</strong> gravitation analogue à<br />

l’électrodynamique quantique, mais ces tentatives n’ont pas jusqu’ici été couronnées <strong>de</strong> succès.<br />

6 sous réserve qu’on choisisse <strong>de</strong>s coordonnées galiléennes.<br />

81


(7.15) peut donc être considérée comme la formulation variationnelle du principe d’inertie dans<br />

l’espace-temps <strong>de</strong> Minkowski.<br />

Nous sommes ainsi conduits au problème préliminaire suivant :<br />

Problème préliminaire.— Étant donnée une variété <strong>de</strong>s événements dans laquelle l’interaction<br />

gravitationnelle n’est pas négligeable, peut-on se donner un intervalle élémentaire ds2 plus général que la métrique <strong>de</strong> Minkowski tel que le principe variationnel7 <br />

δ ds = 0 (7.16)<br />

ren<strong>de</strong> compte <strong>de</strong> la chute libre <strong>de</strong>s corps d’épreuve selon la loi <strong>de</strong> Newton en première approximation?<br />

La réponse à cette question exige certaines définitions et soulève plusieurs problèmes distincts<br />

qu’il faut analyser séparément.<br />

Particule d’épreuve.— Il nous faut d’abord préciser ce qu’on appelle une particule d’épreuve<br />

(on dit aussi une particule-test).<br />

Définition 7.3.1 Une particule d’épreuve est un corps électriquement neutre ayant un champ<br />

gravitationnel propre négligeable et <strong>de</strong>s dimensions si petites que ses paramètres “internes”<br />

(charges 8 , moment magnétique, moment cinétique intrinsèque, etc.) ont une influence négligeable<br />

sur son mouvement.<br />

Cette restriction <strong>de</strong>s postulats fondamentaux aux particules d’épreuve vient <strong>de</strong> ce que les<br />

développements ultérieurs <strong>de</strong>s théories relativistes <strong>de</strong> la gravitation ont montré qu’une particule<br />

qui possè<strong>de</strong> certains caractères <strong>de</strong> “structure interne” comme un moment cinétique interne n’a<br />

pas les mêmes équations <strong>de</strong> mouvement qu’une particule qui en est dépourvue.<br />

Quel type <strong>de</strong> ds 2 choisir ?.— Il est nécessaire <strong>de</strong> spécifier quel type <strong>de</strong> métrique pourrait<br />

éventuellement généraliser la métrique <strong>de</strong> Minkowski <strong>de</strong> manière à rendre compte <strong>de</strong> la<br />

gravitation.<br />

1. Un premier critère <strong>de</strong> choix repose sur le théorème suivant que nous énonçons sans<br />

démonstration 9 .<br />

Théorème 7.3.1 Soit (V4,g) une variété riemannienne <strong>de</strong> dimension 4. Un point x étant<br />

choisi arbitrairement dans V4, il existe <strong>de</strong>s systèmes <strong>de</strong> coordonnées locales y β qui permettent<br />

d’écrire le ds 2 en x sous la forme<br />

ds 2 p<br />

= (dy<br />

α=0<br />

α ) 2 −<br />

3<br />

(dy<br />

β=p+1<br />

β ) 2 , (7.17)<br />

p étant un entier caractéristique <strong>de</strong> la métrique tel que 0 ≤ p ≤ 3.<br />

7 Chaque fois que nous invoquons un principe variationnel dans ce chapitre, il est sous-entendu que les<br />

points <strong>de</strong> V4 entre lesquels on calcule l’intégrale curviligne sont maintenues fixes lorsqu’on effectue la variation,<br />

exactement comme pour l’équation (7.15).<br />

8 La somme algébrique <strong>de</strong> ces charges doit bien entendu être nulle pour assurer la neutralité électrique globale.<br />

9 Cette propriété découle du fait que la matrice (gµν) est symétrique et inversible, donc diagonalisable.<br />

82


L’entier σ = 2(p + 1) − 4 s’appelle la signature <strong>de</strong> la métrique g sur V4 (la signature d’une<br />

métrique sur une variété <strong>de</strong> dimension n serait σ = 2(p + 1) − n, avec 0 ≤ p ≤ n − 1). Pour<br />

que le ds 2 réduit à (7.17) en x ait la forme du ds 2 <strong>de</strong> Minkowski, il faut que la métrique g soit<br />

<strong>de</strong> signature σ = −2. Nous supposerons donc désormais que la métrique susceptible <strong>de</strong> décrire<br />

l’action d’un champ <strong>de</strong> gravitation est précisément <strong>de</strong> signature −2, ce qui entraîne p = 0. Ces<br />

métriques sont dites lorentziennes ou encore hyperboliques normales.<br />

2. Dans un domaine D <strong>de</strong> la variété V4 où se manifeste un champ gravitationnel, le principe<br />

variationnel (7.16) ne doit pas se réduire au principe (7.15), puisque ce <strong>de</strong>rnier conduit au<br />

principe d’inertie. Il ne doit donc pas exister <strong>de</strong> systèmes <strong>de</strong> coordonnées locales dans lesquelles<br />

les gµν se réduisent à leurs valeurs galiléennes ηµν en tout point <strong>de</strong> D. Une métrique qui satisfait<br />

à cette condition est dite douée <strong>de</strong> courbure dans le domaine D, alors que la métrique <strong>de</strong><br />

Minkowski est dite plate. Le point <strong>de</strong> vue développé ici conduit donc à considérer la gravitation<br />

comme une manifestation <strong>de</strong> la courbure d’une métrique lorentzienne.<br />

Il faut souligner que cette conclusion ne contredit en rien le théorème 7.3.1, qui exprime<br />

la possibilité d’une forme minkowskienne <strong>de</strong> la métrique en un point arbitraire, sans que cela<br />

implique que le même système <strong>de</strong> coordonnées va donner une forme minkowskienne en tout<br />

autre point.<br />

De quelle nature sont les lignes d’univers <strong>de</strong>s particules matérielles ?.– Pour que<br />

la quantité ds figurant dans (7.16) soit réelle, il faut que le ds 2 correspondant soit > 0. Par<br />

analogie avec les principes <strong>de</strong> la relativité restreinte dégagés dans le chapitre 3, nous sommes<br />

ainsi conduits à proposer les définitions et à poser au moins à titre provisoire les postulats<br />

suivants :<br />

Définition 7.3.2 Une courbe <strong>de</strong> l’espace-temps (V4,g) est dite du genre temps si ds 2 > 0 le<br />

long <strong>de</strong> cette courbe.<br />

Postulat 7.3.1 Les lignes d’univers <strong>de</strong>s particules matérielles sont <strong>de</strong>s courbes du genre temps.<br />

Ce postulat est une généralisation immédiate du fait que la ligne d’univers d’une particule<br />

matérielle <strong>de</strong> l’espace-temps <strong>de</strong> Minkowski est toujours du genre temps. Il s’applique bien<br />

entendu aux observateurs ponctuels.<br />

Nous pouvons maintenant généraliser la définition et le postulat relatifs au temps propre<br />

énoncés dans le chapitre 3.<br />

Définition 7.3.3 (Définition du temps propre) Soit une particule matérielle P <strong>de</strong> ligne<br />

d’univers C. Le laps <strong>de</strong> temps propre <strong>de</strong> P écoulé entre les événements x1 et x2 appartenant à<br />

C est la quantité τ12[C] définie par<br />

τ12[C] = 1<br />

x2<br />

ds, (7.18)<br />

c x1<br />

où l’intégrale du second membre est calculée le long <strong>de</strong> la ligne C.<br />

Lorsque la ligne d’univers C est décrite par les équations paramétriques x α = x α (ℓ) dans un<br />

système <strong>de</strong> coordonnées locales arbitraires (x α ), l’expression du temps propre τ12[C] est donnée<br />

83


par l’intégrale curviligne :<br />

τ12[C] = 1<br />

ℓ2 <br />

gµν(x<br />

c ℓ1<br />

α (ℓ)) ˙x µ ˙x ν dℓ, ˙x µ = dxµ (ℓ)<br />

, (7.19)<br />

dℓ<br />

où ℓ1 et ℓ2 sont respectivement les valeurs <strong>de</strong> ℓ pour x1 et x2.<br />

Cette définition s’applique à toutes les particules matérielles, même si leur mouvement n’est<br />

pas une chute libre. On notera que le paramètre ℓ <strong>de</strong> la ligne C peut être choisi <strong>de</strong> manière<br />

arbitraire. Il est clair en effet que l’intégrale figurant dans le second membre <strong>de</strong> l’équation (7.19)<br />

ne dépend pas du choix <strong>de</strong> paramétrage <strong>de</strong> C.<br />

Postulat 7.3.2 (Hypothèse <strong>de</strong>s horloges) La quantité τ12[C] définie par (7.18) ou (7.19)<br />

est le temps délivré par une horloge atomique idéale comouvante avec la particule P entre les<br />

événements x1 et x2, que la particule soit en chute libre ou non.<br />

Nature <strong>de</strong>s lignes d’univers <strong>de</strong>s particules d’épreuve en chute libre.– La généralisation<br />

la plus naturelle <strong>de</strong> la relativité restreinte consiste à admettre que la chute libre d’une particule<br />

est gouvernée par le principe variationnel suivant.<br />

Postulat 7.3.3 La ligne d’univers d’une particule matérielle d’épreuve en chute libre est une<br />

courbe <strong>de</strong> genre temps dont les équations paramétriques x α = x α (ℓ) satisfont le principe varia-<br />

tionnel :<br />

<br />

δ<br />

ℓ étant un paramètre arbitraire.<br />

<br />

ds = 0 ⇐⇒ δ<br />

<br />

gµν(xα (ℓ)) dxµ<br />

dℓ<br />

dxν dℓ = 0, (7.20)<br />

dℓ<br />

Toute courbe <strong>de</strong> genre temps qui satisfait (7.20) coïnci<strong>de</strong> avec une géodésique <strong>de</strong> genre temps<br />

<strong>de</strong> l’espace-temps (V4,g) 10 .<br />

Compte tenu <strong>de</strong> la définition 7.3.3, on peut également dire que la ligne d’univers d’une<br />

particule d’épreuve en chute libre satisfait la condition<br />

<br />

δ dτ = 0. (7.21)<br />

On obtient ainsi une généralisation d’une propriété vérifiée en relativité restreinte par les<br />

particules isolées (particules en mouvement inertiel). L’effet “voyageur <strong>de</strong> Langevin” se retrouve<br />

donc ici.<br />

La propriété qu’ont les rayons lumineux en relativité restreinte d’être <strong>de</strong>s droites isotropes<br />

<strong>de</strong> la métrique <strong>de</strong> Minkowski peut se généraliser en admettant le postulat suivant 11 .<br />

Postulat 7.3.4 Les rayons lumineux sont <strong>de</strong>s géodésiques isotropes 12 du ds 2 , c’est-à-dire <strong>de</strong>s<br />

géodésiques le long <strong>de</strong>squelles ds 2 = 0.<br />

10 On utilise ici le théorème C.2.5 énoncé dans l’annexe C.<br />

11 On notera que ce postulat peut en fait se déduire <strong>de</strong>s équations <strong>de</strong> Maxwell formulées dans le cadre <strong>de</strong>s<br />

théories métriques.<br />

12 Se reporter à l’annexe C, sect. C.2 pour la définition <strong>de</strong>s géodésiques isotropes. Soulignons sans insister ici<br />

que le principe variationnel (7.20) ne peut être vali<strong>de</strong> pour ces géodésiques.<br />

84


Peut-on retrouver la loi <strong>de</strong> Newton en première approximation ?– Cherchons maintenant<br />

comment doit s’écrire la métrique pour qu’on puisse retrouver en première approximation<br />

le mouvement newtonien d’une particule à partir du principe variationnel (7.20). Pour retrouver<br />

un principe d’action minimale pour une particule <strong>de</strong> masse unité, il faut multiplier ds par −c.<br />

Nous écrirons donc (7.20) sous la forme<br />

⎛<br />

<br />

δ ⎝−c<br />

<br />

gµν(xα (ℓ) dxµ<br />

dℓ<br />

dxν ⎞<br />

⎠ dℓ = 0, (7.22)<br />

dℓ<br />

ℓ étant un paramètre arbitraire <strong>de</strong> la ligne d’univers le long <strong>de</strong> laquelle l’intégrale du second<br />

membre est calculée. Si on prend le temps coordonnée t = x0 /c comme paramètre, on voit<br />

que (7.22) est formellement équivalent au principe variationnel δ Ldt = 0 formulé avec le<br />

lagrangien<br />

L(x i , ˙x j ,t) = −c 2<br />

<br />

g00(xk ,t) + 2<br />

c g0i(xk ,t) ˙x i + 1<br />

c2gij(x k ,t) ˙x i ˙x j , (7.23)<br />

où les quantités ˙x j sont définies par<br />

˙x j = dxj<br />

. (7.24)<br />

Pour comparer avec la théorie newtonienne, nous allons supposer que le champ gravitationnel<br />

est faible partout. Cette hypothèse consiste à admettre qu’il existe <strong>de</strong>s systèmes <strong>de</strong><br />

coordonnées locales x µ tels que les composantes gµν du tenseur métrique s’écrivent<br />

dt<br />

gµν(x) = ηµν + hµν(x), (7.25)<br />

où ηµν = diag (1, −1, −1, −1) et où les hµν(x) sont <strong>de</strong>s termes perturbateurs très petits :<br />

|hµν(x)| ≪ 1. La métrique écrite sous la forme (7.25) est alors très voisine <strong>de</strong> la métrique <strong>de</strong><br />

Minkowski ds 2 Mink = ηµνdx µ dx ν . Pour cette raison, on appelle les x µ figurant dans le second<br />

membre <strong>de</strong> (7.25) <strong>de</strong>s coordonnées quasi galiléennes.<br />

Nous allons supposer en outre que le mouvement <strong>de</strong> la particule d’épreuve est très lent par<br />

rapport au système <strong>de</strong> coordonnées quasi galiléennes x µ . On a donc | ˙x j |/c ≪ 1.<br />

Sous ces <strong>de</strong>ux hypothèses, le lagrangien (7.23) s’écrit en première approximation :<br />

L(x i , ˙x j ,t) = −c 2<br />

<br />

≈ −c 2 + 1<br />

2<br />

3<br />

( ˙x<br />

i=1<br />

i ) 2 + 1<br />

c2hij ˙x i ˙x j<br />

1/2<br />

3<br />

( ˙x<br />

i=1<br />

i ) 2 − c2<br />

2 h00 + ... (7.26)<br />

1 + h00 + 2<br />

c h0i ˙x i − 1<br />

c 2<br />

Or, en théorie newtonienne, le lagrangien d’une particule <strong>de</strong> masse unité dans un champ<br />

gravitationnel <strong>de</strong> potentiel U(x,t) est :<br />

LN = 1<br />

2<br />

3<br />

( ˙x<br />

i=1<br />

i ) 2 + U(x,t) + C , (7.27)<br />

C étant une constante arbitraire 13 . La comparaison <strong>de</strong> (7.26) et (7.27) montre immédiatement<br />

qu’il suffit <strong>de</strong> poser<br />

h00(x) ≈ − 2U(x,t)<br />

c 2 + C ′ , h0i ≈ 0, hij ≈ 0 (7.28)<br />

13 L’énergie potentielle n’est en effet définie qu’à une constante arbitraire près.<br />

85


pour retrouver la loi <strong>de</strong> gravitation newtonienne en première approximation, C ′ étant une<br />

constante arbitraire. Si on suppose comme nous le ferons désormais que la métrique (7.25)<br />

coïnci<strong>de</strong> avec la métrique <strong>de</strong> Minkowski à l’infini, il faudra poser C ′ = 0, ce qui entraîne<br />

h00(x) ≈ − 2U(x,t)<br />

c 2 . (7.29)<br />

La réponse au problème préliminaire posé ci-<strong>de</strong>ssus est donc positive si la métrique lorentzienne<br />

satisfait le postulat suivant :<br />

Postulat 7.3.5 Lorsque le champ gravitationnel est créé par N corps, il existe une classe <strong>de</strong><br />

systèmes <strong>de</strong> coordonnées locales x α = (x 0 ,x) tels que la métrique prenne en première approximation<br />

la forme :<br />

ds 2 <br />

= 1 − 2U<br />

c2 <br />

(dx 0 ) 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 , (7.30)<br />

où U est le potentiel newtonien engendré par l’ensemble <strong>de</strong>s N masses, tel qu’il est défini par<br />

l’équation (7.5).<br />

On notera que la métrique (7.30) se réduit à la métrique <strong>de</strong> Minkowski lorsque U(x,t) = 0.<br />

Une telle conclusion était évi<strong>de</strong>nte par avance, puisqu’en l’absence <strong>de</strong> champ <strong>de</strong> gravitation,<br />

une particule en chute libre est isolée et son mouvement est en conséquence purement inertiel.<br />

Les résultats ci-<strong>de</strong>ssus encouragent donc la construction d’un cadre théorique dans lequel<br />

les mouvements d’une particule d’épreuve seraient entièrement définis par les géodésiques d’une<br />

métrique g <strong>de</strong> signature −2. La restitution <strong>de</strong> la loi newtonienne en première approximation<br />

n’est cependant pas suffisante à elle seule pour vali<strong>de</strong>r la démarche, car elle ne nous a pas fait<br />

découvrir une nouvelle conséquence susceptible d’être vérifiée expérimentalemnt. Heureusement,<br />

une telle conséquence existe : c’est l’effet Doppler gravitationnel (dit aussi effet Eintein).<br />

7.4 Une conséquence <strong>de</strong> l’approximation newtonienne :<br />

l’effet Doppler gravitationnel<br />

Nous nous contenterons ici <strong>de</strong> raisonner sur un champ gravitationnel stationnaire. Par champ<br />

stationnaire, nous entendons un champ tel qu’il existe <strong>de</strong>s systèmes <strong>de</strong> coordonnées locales dans<br />

lesquels les potentiels <strong>de</strong> gravitation gµν ne dépen<strong>de</strong>nt pas du “temps”, i.e. <strong>de</strong> la coordonnée<br />

que nous avons appelée x 0 : <strong>de</strong> tels systèmes <strong>de</strong> coordonnées sont dits adaptés au caractère stationnaire.<br />

Pour simplifier, nous allons admettre que ce champ est décrit avec une approximation<br />

suffisante par la métrique (7.30) avec un potentiel U indépendant <strong>de</strong> t = x 0 /c.<br />

Supposons que l’on dispose d’un émetteur A susceptible d’émettre un certain type <strong>de</strong> signaux<br />

en un point xA <strong>de</strong> coordonnées spatiales fixes (x i A = const.) et que ces signaux soient captés par<br />

un récepteur B en un point xB lui aussi <strong>de</strong> coordonnées spatiales x i B fixes. La seule hypothèse<br />

faite sur le signal est que le temps <strong>de</strong> propagation entre A et B, soit tB − tA, est une quantité<br />

86


qui dépend uniquement <strong>de</strong>s coordonnées spatiales <strong>de</strong> A et <strong>de</strong> B, ce qu’on peut écrire 14<br />

tB − tA = T (xA,xB), (7.31)<br />

où x désigne le point <strong>de</strong> coordonnées spatiales (xi ) dans chaque hypersurface x0 = constante.<br />

Bien entendu, on admet que l’émetteur A et le récepteur B sont munis chacun d’une horloge<br />

standard comouvante, HA pour A et HB pour B. Appelons TA la pério<strong>de</strong> du signal émis en A,<br />

telle qu’elle est mesurée par l’horloge HA et cherchons à déterminer la pério<strong>de</strong> TB du signal<br />

reçu par B, telle qu’est mesurée par HB. Du fait que l’émetteur A est au repos, le temps propre<br />

le long <strong>de</strong> sa ligne d’univers s’obtient à partir du postulat 7.3.2 en posant dxi = 0 dans la<br />

métrique (7.30), ce qui donne<br />

<br />

dτA ≈ 1 − 2UA<br />

dt. (7.32)<br />

c2 On déduit immédiatement <strong>de</strong> (7.32) que la pério<strong>de</strong> TA du signal émis correspond au laps <strong>de</strong><br />

temps coordonnée ∆tA donné par<br />

∆tA ≈<br />

TA<br />

<br />

1 − 2UA<br />

c 2<br />

. (7.33)<br />

Le même raisonnement s’applique au récepteur B qui est également au repos. La liaison<br />

entre la pério<strong>de</strong> TB du signal reçu en B et le temps coordonnée ∆tB est fournie par une relation<br />

analogue à (7.33) :<br />

∆tB ≈ <br />

1 − 2UB<br />

c2 . (7.34)<br />

Or, on a ∆tB = ∆tA, puisque le temps <strong>de</strong> parcours entre l’émission et la réception ne dépend<br />

pas <strong>de</strong> l’instant d’émission (voir éq. (7.31)). En rapprochant (7.33) et (7.34), il vient :<br />

<br />

2UA<br />

TA <br />

≈ 1 − c<br />

TB<br />

2<br />

1 − 2UB<br />

c2 . (7.35)<br />

Cette formule montre qu’une horloge au repos en A semble ralentie à un observateur au<br />

repos qui l’observe en B, si le potentiel <strong>de</strong> gravitation est plus faible en B qu’en A. D’après<br />

(7.35) en effet, UA > UB =⇒ TB > TA.<br />

La fréquence ν d’un signal mesurée par un observateur est par définition l’inverse <strong>de</strong> la<br />

pério<strong>de</strong> <strong>de</strong> ce signal mesurée par l’observateur à l’ai<strong>de</strong> <strong>de</strong> son horloge standard. On déduit<br />

immédiatement <strong>de</strong> (7.35) que si νA désigne la fréquence du signal émis en A telle qu’elle est<br />

mesurée avec l’horloge standard HA, la fréquence νB du signal mesurée en B avec l’horloge<br />

standard HB est donnée par la relation :<br />

νB<br />

νA<br />

= TA<br />

TB<br />

TB<br />

<br />

2UA <br />

≈ 1 − c2 1 − 2UB<br />

c2 . (7.36)<br />

14 Une telle hypothèse restreint bien entendu la classe <strong>de</strong>s processus physiques que nous considérons comme<br />

<strong>de</strong>s signaux, mais l’important est qu’elle soit compatible avec le caractère stationnaire <strong>de</strong> la métrique. Il est clair<br />

par exemple que les signaux lumineux ou acoustiques ont cette propriété dans un environnement stationnaire.<br />

En revanche, il faut souligner que l’équation (7.31) n’a aucune raison d’être vraie si le champ gravitationnel varie<br />

au cours du temps : dans ce cas, tB − tA dépend aussi <strong>de</strong> l’instant d’émission tA, ou <strong>de</strong> l’instant <strong>de</strong> réception<br />

tB du signal.<br />

87


A l’extérieur du Soleil, on a U/c 2 ≤ 2, 12 × 10 −6 . On peut donc écrire à <strong>de</strong>s termes en 10 −12<br />

près<br />

νB<br />

≈ 1 −<br />

νA<br />

UA − UB<br />

c2 . (7.37)<br />

L’existence <strong>de</strong> l’effet Doppler gravitationnel a été prédite par Einstein dès 1907.<br />

Comme nous l’avons dit plus haut, la seule hypothèse faite sur le signal est celle qui est<br />

exprimée par l’équation (7.31). Il en résulte que la nature physique du signal n’intervient pas<br />

dans les seconds membres <strong>de</strong> (7.35), (7.36) et (7.37) : le signal peut être lumineux, acoustique,<br />

élastique ou s’effectuer par <strong>de</strong>s émissions à intervalles réguliers <strong>de</strong> particules matérielles produites<br />

par un appareil standard (un canon à électrons, par ex). Il faut toutefois souligner que<br />

cette propriété n’est pas générale car elle suppose que l’émetteur et le récepteur sont plongés<br />

dans un champ stationnaire et sont au repos par rapport à n’importe quel système <strong>de</strong> coordonnées<br />

adapté à la stationnarité du champ. Dans le cas général d’un champ gravitationnel<br />

variable, le rapport νB/νA dépendra <strong>de</strong> la nature du signal.<br />

Exemple 1.— On considère un atome au repos en un point A à la surface d’un corps à<br />

symétrie sphérique, dont une raie spectrale bien déterminée est observée en un point B au repos<br />

à l’infini. Le décalage spectral <strong>de</strong> la raie défini par<br />

est d’après (7.36)<br />

∆ν<br />

ν = νB − νA<br />

νA<br />

= νB<br />

νA<br />

− 1<br />

∆ν<br />

≈ −GM<br />

ν c2 , (7.38)<br />

R<br />

où M est la masse du corps central et R son rayon.<br />

Pour le Soleil, on a M = 1, 989 × 10 30 kg et R = 6, 96 × 10 8 m. La formule (7.38) donne<br />

∆ν<br />

ν ≈ 2, 12 × 10−6 . (7.39)<br />

Le signe moins montre que les raies émises sur le Soleil sont décalées vers le rouge pour<br />

un observateur au repos à l’infini. Un effet <strong>de</strong> cet ordre a été effectivement observé mais l’interprétation<br />

<strong>de</strong>s résultats est très délicate en raison <strong>de</strong>s nombreux effets parasites dus à la<br />

température et à l’atmosphère solaires. On a également observé un décalage <strong>de</strong>s raies spectrales<br />

émises par <strong>de</strong>s naines blanches, mais les résultats ont été encore plus incertains.<br />

Exemple 2.— On suppose maintenant que A est au niveau du sol et que B est à une<br />

altitu<strong>de</strong> h au <strong>de</strong>ssus <strong>de</strong> A. Du fait que UA − UB = gh, le décalage <strong>de</strong> fréquence ∆ν/ν défini<br />

comme dans l’exemple ci-<strong>de</strong>ssus est alors donné par la formule approchée<br />

∆ν<br />

ν<br />

≈ −gh , (7.40)<br />

c2 g étant l’accélération <strong>de</strong> la pesanteur. Pour h = 1m, on trouve au sol 15<br />

∆ν<br />

ν ≈ −10−16 .<br />

15 L’estimation ∆ν/ν ≈ 10 −16 pour ∆h = 1 m est à comparer avec la précision <strong>de</strong> l’ordre <strong>de</strong> 4 × 10 −16 en<br />

fraction <strong>de</strong> fréquence qui est obtenue avec les meilleures horloges atomiques actuelles.<br />

88


L’existence du glissement <strong>de</strong> fréquences donné par (7.40) fut vérifié dans le champ terrestre<br />

pour la première fois par Pound et Rebka en 1960 16 , puis <strong>de</strong> manière plus précise (1 %) par<br />

Pound et Sni<strong>de</strong>r en 1964 17 , en faisant “tomber” un rayon lumineux d’une hauteur <strong>de</strong> 22 m dans<br />

une tour <strong>de</strong> l’université <strong>de</strong> Harvard. Une vérification à 10 −4 près <strong>de</strong> la formule (7.37) a par la<br />

suite été faite avec un maser à hydrogène embarqué dans une fusée par Vessot, Levine et al. 18 .<br />

Il semble qu’on puisse aujourd’hui gagner au moins un facteur 30 sur le résultat <strong>de</strong> Vessot et al.<br />

en comparant une fontaine atomique à atomes <strong>de</strong> Césium refroidis embarquée dans un satellite<br />

avec une horloge atomique au sol (mission ACES en préparation).<br />

7.5 Conclusion<br />

La démarche conceptuelle consistant à décrire l’action <strong>de</strong> la gravitation par une métrique<br />

semble fructueuse et incite à poursuivre l’effort <strong>de</strong> reconstruction <strong>de</strong> la physique lorsqu’on prend<br />

en compte la gravitation. Il faut cependant être conscients que les postulats que nous venons<br />

d’introduire ne sont nullement suffisants pour construire une théorie unique. Ils constituent<br />

seulement le socle d’une classe très large (en fait infinie !) <strong>de</strong> théories que l’on appelle les théories<br />

métriques <strong>de</strong> la gravitation. Dans un tel cadre, les composantes gµν du tenseur métrique sont<br />

souvent appelées potentiels <strong>de</strong> gravitation en raison <strong>de</strong> leur rôle déterminant dans la <strong>de</strong>scription<br />

<strong>de</strong> l’interaction gravitationnelle.<br />

Dans les <strong>de</strong>ux chapitres qui suivent, nous allons expliciter un certain nombre d’effets prédits<br />

par ces théories et voir comment ces effets peuvent être utilisés pour discriminer les dites théories<br />

dans le cadre <strong>de</strong> ce qu’on appelle l’approximation postnewtonienne paramétrée <strong>de</strong> premier ordre<br />

(1PPN).<br />

16R. V. Pound & G. A. Rebka, Apparent weight of photons, Physical Review Letters, vol. 4, p. 337, 1960.<br />

17R. V. Pound & J. L. Sni<strong>de</strong>r, Effect of gravity on nuclear resonance, Physical Review Letters, vol. 13, p. 539,<br />

1964.<br />

18Voir R. F. C. Vessot, M. W. Levine et al., Physical Review Letters, vol. 45, p. 2081, 1980, et les références<br />

citées dans cet article.<br />

89


Chapitre 8<br />

Notion d’approximation<br />

postnewtonienne <strong>de</strong>s théories<br />

métriques<br />

Dans ce chapitre, nous étudions comment on peut définir une approximation postnewtonienne<br />

paramétrée <strong>de</strong>s théories métriques dans le cas simple d’une masse à symétrie sphérique<br />

isolée. Cette approche élémentaire s’avère suffisante pour calculer les effets les plus importants<br />

prévus par les théories métriques <strong>de</strong> la gravitation.<br />

8.1 Notion d’approximation postnewtonienne<br />

Comme on l’a vu à la fin du chapitre précé<strong>de</strong>nt, les vérifications expérimentales <strong>de</strong> l’effet<br />

Doppler gravitationnel dont on dispose aujourd’hui montrent que le concept <strong>de</strong> théorie métrique<br />

est viable et incite en conséquence à creuser l’idée. On ne peut cependant s’en tenir à la métrique<br />

quasi newtonienne (7.30), car l’étu<strong>de</strong> <strong>de</strong>s géodésiques <strong>de</strong> cette métrique conduit à une avance du<br />

périhélie <strong>de</strong> Mercure égale à 2/3 <strong>de</strong> l’avance effectivement observée. Or, il semble à première vue<br />

impossible <strong>de</strong> former une meilleur approximation <strong>de</strong> la métrique sans avoir développé une théorie<br />

complète <strong>de</strong> la gravitation, avec <strong>de</strong>s équations permettant <strong>de</strong> déterminer les dix potentiels gµν<br />

en fonction <strong>de</strong>s masses créant le champ. En conséquence, <strong>de</strong>vons-nous dès maintenant chercher<br />

à construire une théorie rigoureuse ou mieux encore une classe <strong>de</strong> théories rigoureuses pour<br />

tester l’idée que la gravitation puisse être décrite par une métrique ?<br />

Nous allons voir qu’il n’en est rien et qu’il est possible <strong>de</strong> progresser en développant une idée<br />

d’Eddington 1 . Nous pouvons tout d’abord déci<strong>de</strong>r <strong>de</strong> nous intéresser uniquement au champ <strong>de</strong><br />

gravitation engendré par une masse à symétrie sphérique (le Soleil par ex.) 2 . De plus, nous pouvons<br />

supposer que le champ est indépendant du temps, comme nous l’avons fait dans la section<br />

7.4. On peut montrer que sous ces hypothèses, il est toujours possible <strong>de</strong> choisir les coordonnées<br />

1 A. S. Eddington, The Mathematical Theory of Relativity, paragr. 47. Cambridge University Press, 1922.<br />

2 Cette approximation s’est avérée suffisante jusqu’ici pour la lumière, mais nous verrons qu’on ne peut s’en<br />

contenter pour le périhélie <strong>de</strong> Mercure.<br />

90


(x 0 ,x i ) <strong>de</strong> telle sorte que la métrique cherchée s’écrive sous la forme simple suivante 3 :<br />

ds 2 = A(r)(dx 0 ) 2 − B(r) <br />

(dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2<br />

, (8.1)<br />

où A(r) et B(r) sont <strong>de</strong>s quantités qui dépen<strong>de</strong>nt uniquement <strong>de</strong> la coordonnée radiale r définie<br />

par<br />

r =<br />

<br />

(x 1 ) 2 + (x 2 ) 2 + (x 3 ) 2 , (8.2)<br />

l’origine O <strong>de</strong>s coordonnées x i étant le centre <strong>de</strong> la masse attractive.<br />

Il faut noter que la réduction <strong>de</strong> la métrique à la forme (8.1) ne contenant que <strong>de</strong>ux fonctions<br />

inconnues A(r) et B(r) est un résultat rigoureux indépendant <strong>de</strong> la théorie lorsqu’on impose la<br />

symétrie sphérique statique. Nous pourrons donc utiliser cette forme quand nous chercherons à<br />

résoudre les équations <strong>de</strong> la relativité générale (équations d’Einstein) dans le cas <strong>de</strong> la symétrie<br />

sphérique.<br />

En second lieu, nous pouvons postuler que la métrique (8.1) doit se réduire à la métrique<br />

<strong>de</strong> Minkowski lorsqu’on s’éloigne indéfiniment <strong>de</strong> la masse centrale. Nous imposons donc les<br />

conditions <strong>de</strong> comportement asymptotique<br />

lim A(r) = 1, lim B(r) = 1. (8.3)<br />

r→∞ r→∞<br />

Le potentiel newtonien d’une masse M à symétrie sphérique est donné par<br />

U = GM<br />

r<br />

Compte tenu <strong>de</strong> (8.4), on doit avoir à l’approximation newtonienne<br />

A(r) = 1 − 2GM<br />

c 2 r<br />

. (8.4)<br />

+ · · ·, (8.5)<br />

le symbole + · · · correspondant à <strong>de</strong>s termes beaucoup plus petits que 2GM/c 2 r dans le système<br />

solaire. Nous voyons intervenir la quantité 2m définie par<br />

2m = 2GM<br />

c 2 . (8.6)<br />

La quantité 2m ayant la dimension d’une longueur, on l’appelle le rayon gravitationnel ou<br />

encore le rayon <strong>de</strong> Schwarzschild 4 du corps. A titre d’exemple, le rayon <strong>de</strong> Schwarzschild du<br />

Soleil vaut<br />

2m⊙ = 2, 953km, (8.7)<br />

à comparer avec le rayon R⊙ du Soleil, qui vaut 6, 96 × 105 km. En conséquence, la variable u<br />

sans dimension définie par<br />

u = m<br />

r<br />

(8.8)<br />

3 Pour la métrique (8.1), on a donc g00 = A(r), g0i = gi0 = 0, gij = −B(r)δij. Les coordonnées spatiales<br />

telles que la partie spatiale <strong>de</strong> la métrique soit <strong>de</strong> la forme F(x α ) (dx) 2 + (dx) 2 + (dx) 2 sont dites isotropiques<br />

ou encore isotropes.<br />

4 Il serait beaucoup plus approprié d’appeler 2m le paramètre d’échelle gravitationnel, car la notion <strong>de</strong> rayon<br />

<strong>de</strong>man<strong>de</strong> à être précisée, mais nous nous conformons à l’usage.<br />

91


est inférieure à m⊙/R⊙ = 2, 12 × 10 −6 dans le système solaire. Sur l’orbite <strong>de</strong> Mercure, u ≈<br />

2, 6 × 10 −8 .<br />

Il résulte <strong>de</strong> ces considérations que nous pouvons supposer que le champ gravitationnel est<br />

faible dans le système solaire et admettre en conséquence que la métrique (8.1) s’écarte très peu<br />

<strong>de</strong> la métrique <strong>de</strong> Minkowski. Il est compatible avec ces hypothèses d’admettre qu’à l’extérieur<br />

du Soleil, A et B figurant dans la métrique (8.1) sont <strong>de</strong>s fonctions analytiques <strong>de</strong> la variable<br />

u au voisinage <strong>de</strong> u = 0, qui correspond au domaine à l’infini <strong>de</strong> l’espace 5 . En conséquence, A<br />

et B peuvent être développés en séries <strong>de</strong> puissances entières <strong>de</strong> u. Nous pouvons donc poser<br />

A(r) = 1 − 2m 3β1 m<br />

+ 2βm2 −<br />

r r2 2<br />

3<br />

+ · · · ,<br />

r3 (8.9)<br />

B(r) = 1 + 2γ m 3δ m<br />

+<br />

r 2<br />

2<br />

γ2 m<br />

+<br />

r2 2<br />

3<br />

+ · · ·<br />

r3 (8.10)<br />

où β,γ,δ,β1,γ2,... sont <strong>de</strong>s constantes sans dimension que l’on appelle <strong>de</strong>s paramètres postnewtoniens,<br />

car leur introduction permet <strong>de</strong> décrire <strong>de</strong>s effets gravitationnels qui ne peuvent<br />

être prédits par l’approximation newtonienne. Les valeurs <strong>de</strong> ces paramètres vont dépendre <strong>de</strong><br />

la théorie métrique qu’on va considérer.<br />

Pour l’instant, nous n’avons pas construit une théorie métrique susceptible d’attribuer <strong>de</strong>s<br />

valeurs définies aux paramètres postnewtoniens. Nous allons donc considérer β, γ, δ, etc. comme<br />

<strong>de</strong>s quantités qu’il nous faudra déterminer en confrontant les effets prédits à partir <strong>de</strong> (8.9) et<br />

(8.10) avec <strong>de</strong>s observations ou <strong>de</strong>s expériences 6 .<br />

8.2 Quels termes faut-il retenir à l’approximation postnewtonienne?<br />

Pour étudier les effets mentionnés ci-<strong>de</strong>ssus, il est primordial <strong>de</strong> savoir quels sont les termes<br />

qu’on peut négliger dans les développements (8.9)-(8.10) en fonction <strong>de</strong> l’ordre d’approximation<br />

postnewtonienne que l’on désire atteindre. Nous allons voir que les termes à retenir ne sont pas<br />

les mêmes selon que l’on s’intéresse aux rayons lumineux (propagation “rapi<strong>de</strong>”) ou aux planètes<br />

du système solaire (corps “lents”).<br />

La déduction <strong>de</strong>s tests classiques repose sur l’étu<strong>de</strong> <strong>de</strong>s géodésiques <strong>de</strong> la métrique (8.1).<br />

C’est pourquoi nous allons effectuer la discussion en partant du principe variationnel qui définit<br />

les géodésiques d’un espace-temps (V4,g) vu dans le chap. 7. Rappelons que si nous prenons<br />

le temps coordonnée t = x 0 /c comme paramètre dans (7.22), la détermination <strong>de</strong>s géodésiques<br />

se ramène à la résolution <strong>de</strong>s équations du mouvement d’un système dynamique décrit par la<br />

fonction <strong>de</strong> Lagrange<br />

L(x i , ˙x j ,t) = −c 2<br />

<br />

g00(x k ,t) + 2<br />

c g0i(x k ,t) ˙x i + 1<br />

c 2gij(x k ,t) ˙x i ˙x j , (8.11)<br />

5 Notons que cette hypothèse d’analyticité ne va pas <strong>de</strong> soi. On pourrait supposer que A et B contiennent<br />

<strong>de</strong>s termes <strong>de</strong> portée finie du type potentiel <strong>de</strong> Yukawa, par exemple. On suppose ici que dans le domaine<br />

astronomique tout au moins, les termes <strong>de</strong> portée finie ont une action négligeable.<br />

6 Les coefficients numériques <strong>de</strong>vant β,γ,δ,β1,γ2,... sont choisis <strong>de</strong> telle sorte que l’on ait β = 1,γ = 1,δ =<br />

1,β1 = 1,γ2 = 1,... en relativité générale, comme on le verra dans le Chapitre 10.<br />

92


où les quantités ˙x j sont définies par<br />

˙x j = dxj<br />

. (8.12)<br />

dt<br />

Les équations différentielles <strong>de</strong>s géodésiques sont alors les équations <strong>de</strong> Lagrange associées<br />

à la fonction <strong>de</strong> Lagrange (8.11) :<br />

d<br />

dt<br />

<br />

∂L ∂ ˙x i<br />

− ∂ L<br />

= 0. (8.13)<br />

∂xi Pour la métrique (8.1), la fonction <strong>de</strong> Lagrange (8.11) s’écrit simplement<br />

L(x i , ˙x j ,t) = −c 2<br />

<br />

A(r) − 1<br />

c 2B(r)δij ˙x i ˙x j . (8.14)<br />

Sous les hypothèses que nous avons faites, les fonctions A(r) et B(r) peuvent être respectivement<br />

remplacées par les développements (8.9) et (8.10). À quel ordre doit-on arrêter ces<br />

développements pour avoir une approximation cohérente ?<br />

Supposons d’abord que nous voulions déterminer les rayons lumineux. Les quantités c −1 ˙x i<br />

sont <strong>de</strong> l’ordre <strong>de</strong> 1, puisque la vitesse <strong>de</strong> la lumière est <strong>de</strong> l’ordre <strong>de</strong> c (nous disons <strong>de</strong> l’ordre<br />

ce c et non égale à c car nous n’avons pas encore défini rigoureusement la notion <strong>de</strong> vitesse).<br />

On a donc<br />

1<br />

c 2δij ˙x i ˙x j ≈ 1 (8.15)<br />

dans (8.14). Il en résulte que les développements <strong>de</strong> A et <strong>de</strong> B doivent être arrêtés aux termes<br />

<strong>de</strong> même puissance <strong>de</strong> m/r. Ainsi, pour une <strong>de</strong>scription cohérente <strong>de</strong>s rayons lumineux, la<br />

première approximation postnewtonienne peut se contenter <strong>de</strong>s dévelopements<br />

A(r) = 1 − 2m<br />

r<br />

, B(r) = 1 + 2γm<br />

r<br />

, (8.16)<br />

tandis que l’approximation postpostnewtonienne nécessite les développements suivants<br />

A(r) = 1 − 2m<br />

r<br />

3δ<br />

+ 2βm2 , B(r) = 1 + 2γm +<br />

r2 r 2<br />

m2 . (8.17)<br />

r2 Il résulte <strong>de</strong> ces formules que la métrique quasi newtonienne (7.30) ne peut fournir une<br />

approximation cohérente pour la lumière : la déviation que l’on pourrait calculer à partir <strong>de</strong><br />

cette métrique ou <strong>de</strong> la dynamique newtonienne usuelle appliquée à <strong>de</strong>s corpuscules allant à la<br />

vitesse <strong>de</strong> la lumière n’est pas une approximation <strong>de</strong> la déviation prédite à partir <strong>de</strong> (8.16).<br />

Examinons maintenant le cas d’une planète ou <strong>de</strong> n’importe quel autre corps autogravitant<br />

dont l’orbite ne va jamais à l’infini (état <strong>de</strong> liaison gravitationnelle). Les équations <strong>de</strong> la<br />

dynamique newtonienne montrent que le carré <strong>de</strong> la vitesse d’un tel corps satisfait la relation<br />

ce qui entraîne<br />

v 2 ∼ GM<br />

r<br />

, (8.18)<br />

1<br />

c2δij ˙x i ˙x j ∼ m<br />

. (8.19)<br />

r<br />

93


On déduit <strong>de</strong> cette équivalence d’ordres <strong>de</strong> gran<strong>de</strong>ur que si on arrête le développement <strong>de</strong><br />

B au terme en m n /r n , il faut aller jusqu’au terme en m n+1 /r n+1 dans le développement <strong>de</strong> A.<br />

Ainsi la première approximation postnewtonienne cohérente pour les corps autogravitants en<br />

état <strong>de</strong> liaison gravitationnelle est définie par<br />

A(r) = 1 − 2m<br />

r<br />

l’approximation postpostnewtonienne correspond à<br />

A(r) = 1 − 2m<br />

r<br />

3β1<br />

+ 2βm2 −<br />

r2 2<br />

+ 2βm2 , B(r) = 1 + 2γm , (8.20)<br />

r2 r<br />

m3 3δ<br />

, B(r) = 1 + 2γm +<br />

r3 r 2<br />

m2 , (8.21)<br />

r2 et ainsi <strong>de</strong> suite.<br />

La forme approchée (8.20) est dite approximation 1PN <strong>de</strong> la métrique à symétrie sphérique<br />

statique (8.1) car le potentiel A = g00 contient un terme d’ordre (v/c) 2 ×(le terme m/r donnant<br />

l’approximation newtonienne). On a en effet m 2 /r 2 ≈ (v/c) 2 × m/r. Par extension, la forme<br />

(8.21) est dite approximation 2PN <strong>de</strong> la métrique, et on peut définir l’approximation kPN pour<br />

k ≥ 3 si besoin est. Pour abréger, on dit que les effets en v n /c n et en m n /r n sont d’ordre 1/c n ,<br />

ce que l’on dénote par O(1/c n ) ou plus simplement par O(n).<br />

8.3 Conclusion<br />

On voit que l’approximation 1PN <strong>de</strong> la métrique suffit pour déterminer les effets relativistes<br />

d’ordre 1/c 2 sur les rayons lumineux, mais qu’il faut impérativement considérer l’approximation<br />

2PN si on veut calculer les effets d’ordre 1/c 4 sur la lumière.<br />

94


Chapitre 9<br />

Quelques effets classiques prévus par<br />

les théories métriques<br />

Nous allons maintenant déterminer un certain nombre d’effets spécifiquement prédits à<br />

partir <strong>de</strong> la métrique postnewtonienne définie par (8.1) et (8.20) et pouvant servir <strong>de</strong> tests <strong>de</strong>s<br />

théories métriques : l’effet <strong>de</strong> retard dans la propagation <strong>de</strong>s signaux électromagnétiques, la<br />

déviation gravitationnelle <strong>de</strong>s rayons lumineux et l’avance séculaire relativiste du périhélie <strong>de</strong>s<br />

planètes.<br />

9.1 Temps <strong>de</strong> propagation d’un rayon lumineux entre<br />

<strong>de</strong>ux points<br />

Supposons qu’un photon émis au point xA à l’instant tA soit reçu en un point xB à l’instant<br />

tB (fig. 9.1). Du fait que la métrique (8.1) s’écarte légèrement <strong>de</strong> la métrique <strong>de</strong> Minkowski, on<br />

doit avoir<br />

x 0 B − x 0 A = c(tB − tA) = |xB − xA| + c∆T (xA,xB), (9.1)<br />

le terme c∆T (xA,xB) <strong>de</strong>vant s’annuler en l’absence <strong>de</strong> champ gravitationnel (GM = 0), <strong>de</strong><br />

telle sorte qu’on retrouve alors l’expression <strong>de</strong> x 0 B − x 0 A dans l’espace-temps <strong>de</strong> Minkowski. On<br />

a effectivement le théorème suivant.<br />

Proposition 9.1.1 Soit un photon émis en xA à l’instant tA et reçu en xB à l’instant tB dans<br />

un espace-temps statique à symétrie sphérique dont la métrique est écrite sous la forme :<br />

ds 2 <br />

= 1 − 2m<br />

<br />

+ · · · c<br />

r 2 dt 2 <br />

− 1 + 2γ m<br />

+ · · · dx<br />

r 12 + <br />

dx 22 + <br />

dx 32 <br />

, (9.2)<br />

les termes négligés étant d’ordre 1/c4 .<br />

Le temps <strong>de</strong> parcours tB − tA est donné par les expressions équivalentes<br />

tB − tA = RAB<br />

+ (γ + 1)GM<br />

c c3 <br />

rB + N AB.xB<br />

ln<br />

+ O(1/c<br />

rA + N AB.xA<br />

5 ), (9.3)<br />

= RAB<br />

+ (γ + 1)GM<br />

c c3 <br />

rA − N AB.xA<br />

ln<br />

+ O(1/c<br />

rB − N AB.xB<br />

5 ), (9.4)<br />

95


qui peuvent encore s’écrire sous la forme<br />

où 1<br />

et<br />

tB − tA = RAB<br />

c<br />

+ (γ + 1)GM<br />

c 3 ln<br />

rA = |xA|, rB = |xB|, nA = xA<br />

, nB = xB<br />

<br />

rA + rB + RAB<br />

+ O(1/c<br />

rA + rB − RAB<br />

5 ), (9.5)<br />

rA<br />

rB<br />

(9.6)<br />

RAB = |xB − xA|, N AB = xB − xA<br />

. (9.7)<br />

Il est clair que le terme relativiste logarithmique dans le second membre <strong>de</strong> (9.5) est toujours<br />

positif si A et B sont distincts, car on sait aujour’hui que γ + 1 est très voisin <strong>de</strong> 2. La durée<br />

du trajet d’un rayon lumineux entre <strong>de</strong>ux points est donc toujours supérieure au temps RAB/c<br />

que mettrait ce rayon en l’absence <strong>de</strong> champ gravitationnel. La mesure <strong>de</strong> cet effet <strong>de</strong> retard<br />

a été proposée comme test <strong>de</strong> la relativité générale par Shapiro dès 1964 2 . C’est pourquoi on<br />

appelle souvent cet effet l’effet Shapiro.<br />

Démonstration.— On peut donner une démonstration élémentaire <strong>de</strong>s formules (9.3)-(9.5)<br />

sans intégrer explicitement les équations différentielles <strong>de</strong>s géodésiques isotropes. Compte tenu<br />

<strong>de</strong> la forme (9.2) <strong>de</strong> la métrique, la propriété que ds 2 = 0 le long d’un rayon mumineux se<br />

traduit par la relation<br />

<br />

<br />

<br />

cdt = <br />

1 + 2γ m<br />

r<br />

1 − 2 m<br />

r<br />

RAB<br />

<br />

|dx| = 1 + (γ + 1) m<br />

<br />

|dx| + O(1/c<br />

r<br />

4 ), (9.8)<br />

où dx est le vecteur infinitésimal dx = (dx1 ,dx2 ,dx3 ) pris le long du rayon lumineux et |dx|<br />

la norme euclidienne usuelle <strong>de</strong> dx :<br />

|dx| =<br />

<br />

δijdx i dx j . (9.9)<br />

On peut toujours choisir le paramètre affine λ le long du rayon <strong>de</strong> telle sorte que λ = 0 en<br />

xA et λ = 1 en xB. Avec ce choix la trajectoire du rayon est alors décrite par une équation <strong>de</strong><br />

la forme<br />

x(λ) = RABN ABλ + xA + X(λ), (9.10)<br />

où RABN ABλ + xA est la droite reliant xA et xB (approximation d’ordre zéro) et X(λ)<br />

représente la perturbation gravitationelle subie par le rayon. La fonction X(λ) doit évi<strong>de</strong>mment<br />

satisfaire aux conditions aux limites<br />

X(0) = 0, X(1) = 0. (9.11)<br />

1 On notera que nA, nB et NAB sont <strong>de</strong>s vecteurs unitaires au sens usuel.<br />

2 I. I. Shapiro, Physical Review Letters, vol. 13, p. 789 (1964).<br />

96


A<br />

o<br />

N AB<br />

n A<br />

o<br />

O<br />

n B<br />

Fig. 9.1 – Retard gravitationnel <strong>de</strong>s rayons lumineux.<br />

D’après (9.8) et (9.10), la différence tB − tA a pour expression :<br />

tB − tA = 1<br />

<br />

1<br />

1 + (γ + 1)<br />

c 0<br />

m<br />

<br />

<br />

RABN AB +<br />

|x(λ)|<br />

dX<br />

dλ<br />

o<br />

B<br />

<br />

<br />

<br />

<br />

dλ + O(1/c5 ), (9.12)<br />

Les équations d’Euler-Lagrange <strong>de</strong>s géodésiques 3 entraînent que X(λ) est d’ordre 1/c 2 . En<br />

conséquence, dX/dλ est aussi d’ordre 1/c 2 . Du fait que nous voulons seulement calculer la<br />

contribution gravitationnelle d’ordre 1/c 3 dans tB − tA, nous pouvons donc négliger le terme<br />

(dX/dλ) 2 dans le calcul <strong>de</strong> |dx/dλ|, puisque ce terme est d’ordre 1/c 4 . Cette approximation<br />

donne : <br />

<br />

dx(λ) <br />

<br />

= RAB 1 +<br />

dλ N AB<br />

RAB<br />

d’où après substitution dans le second membre <strong>de</strong> (9.12) :<br />

tB − tA = RAB<br />

c<br />

<br />

1<br />

1 + (γ + 1)<br />

0<br />

m<br />

|x(λ)| + N AB<br />

RAB<br />

· dX<br />

<br />

dλ + O(1/c<br />

dλ<br />

4 ). (9.13)<br />

· dX<br />

<br />

dλ + O(1/c<br />

dλ<br />

5 ). (9.14)<br />

Or, la <strong>de</strong>rnière intégrale du second membre <strong>de</strong> (9.14) est nulle en raison <strong>de</strong>s conditions aux<br />

limites (9.11). En effet<br />

1 N AB<br />

0<br />

RAB<br />

En conséquence, (9.14) s’écrit<br />

tB − tA = RAB<br />

c<br />

3 Equations (C.19) <strong>de</strong> l’annexe C.<br />

· dX<br />

dλ dλ = N AB<br />

RAB<br />

+ (γ + 1)mRAB<br />

c<br />

97<br />

· [X(1) − ·X(0)] = 0. (9.15)<br />

1<br />

0<br />

dλ<br />

|x(λ)| + O(1/c5 ). (9.16)


Le terme m/|x(λ)| étant d’ordre 1/c 2 , on peut négliger la contribution <strong>de</strong> X(λ) dans |x(λ)|<br />

et poser simplement<br />

et<br />

m<br />

|x(λ)| =<br />

Compte tenu <strong>de</strong>s i<strong>de</strong>ntités<br />

on trouve<br />

m<br />

<br />

R 2 ABλ 2 + 2RAB(N AB.xA)λ + r 2 A<br />

R 2 AB + 2RAB.xA + r 2 A ≡ r 2 B<br />

RAB + N AB.xA ≡ (xB − xA).N AB + xA.N AB ≡ N AB.xB ,<br />

1<br />

m<br />

0<br />

dλ<br />

|x(λ)|<br />

<br />

m rB + N AB.xB<br />

= ln<br />

RAB rA + N AB.xA<br />

D’où l’expression <strong>de</strong> tB − tA donnée par (9.3).<br />

En utilisant l’i<strong>de</strong>ntité <strong>de</strong> “polarisation”<br />

on voit que<br />

Mais on a aussi l’i<strong>de</strong>ntité<br />

qui entraîne<br />

|x||y| + x.y ≡ 1 <br />

(|x| + |y|)<br />

2<br />

2 − (x − y) 2<br />

,<br />

rB + N AB.xB = rBRAB + RAB.xB<br />

RAB<br />

|x||y| + x.y ≡ 1 <br />

(x + y)<br />

2<br />

2 − (|x| − |y|) 2<br />

,<br />

rA + N AB.xA = rARAB + RAB.xA<br />

Il résulte <strong>de</strong> (9.19) et (9.20) que<br />

rB + N AB.xB<br />

rA + N AB.xA<br />

RAB<br />

<br />

+ O(1/c 5 ). (9.17)<br />

+ O(1/c 4 ). (9.18)<br />

= 1 (rA + RAB)<br />

2<br />

2 − r2 A<br />

. (9.19)<br />

RAB<br />

= 1 r<br />

2<br />

2 B − (rA − RAB) 2<br />

. (9.20)<br />

RAB<br />

= (rA + RAB) 2 − r2 A<br />

r2 B − (rA − RAB) 2 = rA + rB + RAB<br />

. (9.21)<br />

rA + rB − RAB<br />

L’équation (9.21) entraîne immédiatement (9.5). La formule (9.5) montre que la quantité<br />

tB − tA est inchangée lorsqu’on échange xA et xB (cette propriété est en fait liée au caractère<br />

statique <strong>de</strong> la métrique). On voit facilement en échangeant le rôle <strong>de</strong> A et <strong>de</strong> B que (9.3) peut<br />

également s’écrire sous la forme (9.4).<br />

L’expression (9.5) est très commo<strong>de</strong> pour évaluer le temps <strong>de</strong> parcours d’un photon entre<br />

une station terrestre et un satellite artificiel. Les expressions (9.3) ou (9.4) sont d’un emploi<br />

courant dans la modélisation <strong>de</strong> l’effet Shapiro dans le système solaire, mais il est <strong>de</strong>s cas où il<br />

est utile d’introduire la distance minimale entre le rayon lumineux et l’origine <strong>de</strong>s coordonnées.<br />

On peut alors se servir <strong>de</strong> l’expression <strong>de</strong> tB − tA fournie par le corollaire qui suit.<br />

98


Corollaire 9.1.1 Sous les hypothèses du théorème 9.1.1, le temps <strong>de</strong> parcours tB − tA peut<br />

encore s’écrire sous la forme :<br />

tB − tA = RAB<br />

c<br />

+(γ + 1) GM<br />

c3 ln rArB [1 + (nB − nA).N AB − (N AB.nA)(N AB.nB)]<br />

r2 + O(1/c<br />

c<br />

5 ),<br />

(9.22)<br />

où rc est la distance euclidienne entre le point O et la droite passant par les points xA et xB :<br />

rc = rArB<br />

RAB<br />

sin ψAB, (9.23)<br />

ψAB étant l’angle entre les vecteurs nA et nB.<br />

Dans le cas où A et B sont très éloignés <strong>de</strong> l’origine O et rc ≪ inf (rA,rB), on a avec une<br />

approximation suffisante<br />

tB − tA ≈ RAB<br />

c<br />

+ (γ + 1)GM<br />

c3 <br />

4rArB<br />

ln<br />

Démonstration.— Un raisonnement géométrique élémentaire montre que 4<br />

D’où :<br />

rB + N AB.xB<br />

rA + N AB.xA<br />

(N AB.xA) 2 = r 2 A − r 2 c<br />

= (rB + N AB.xB)(rA − N AB.xA)<br />

r 2 A − (N AB.xA) 2<br />

= rArB<br />

r 2 c<br />

r 2 c<br />

<br />

+ O(1/c 5 ). (9.24)<br />

[1 + (nB − nA)N AB − (N AB.nA)(N AB.nB)], (9.25)<br />

qui entraîne immédiatement (9.22) par substitution dans (9.3).<br />

Supposons que A et B soient très éloignés du Soleil et que le rayon lumineux passe très près<br />

<strong>de</strong> la surface solaire . Alors nB ≈ nA et N AB ≈ nB, ce qui entraîne<br />

1 + (nB − nA).N AB − (N AB.nA)(N AB.nB) ≈ 4.<br />

D’où (9.24) en substituant dans (9.22).<br />

L’équation (9.24) est l’expression <strong>de</strong> tB − tA que l’on a utilisée pour interpréter le décalage<br />

<strong>de</strong>s fréquences <strong>de</strong>s signaux radio échangés entre la Terre et la son<strong>de</strong> Cassini lors <strong>de</strong> son passage<br />

<strong>de</strong>rrière le Soleil. On a ainsi pu effectuer la meilleure détermination du paramètre γ obtenue à<br />

ce jour 5 :<br />

γ − 1 = (2, 1 ± 2, 3) × 10 −5 . (9.26)<br />

4 De même, on a (NAB.xB) 2 = r 2 B − r2 c .<br />

5 B. Bertotti, L. Iess & P. Tortura, Nature, vol. 425, p. 374 (2003).<br />

99


9.2 Équations <strong>de</strong>s géodésiques d’une métrique à symétrie<br />

sphérique statique<br />

Pour déterminer la déviation <strong>de</strong>s rayons lumineux et l’avance séculaire du périhélie, nous<br />

allons appliquer la théorie <strong>de</strong>s géodésiques exposée dans la section C.2 <strong>de</strong> l’annexe C. Nous<br />

utilisons une métrique à symétrie sphérique telle que (8.1), que nous recopions ici<br />

ds 2 = A(r)(dx 0 ) 2 − B(r) <br />

(dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2<br />

, (9.27)<br />

les quantités A(r) et B(r) étant pour l’instant <strong>de</strong>s fonctions différentiables arbitraires.<br />

Les calculs effectués dans cette section sont rigoureux.<br />

Introduisons les coordonnées sphériques r,θ,ϕ définies par<br />

x 1 = r sin θ cos ϕ, x 2 = r sin θ sin ϕ, x 3 = r cos θ . (9.28)<br />

La métrique (9.27) s’écrit alors sous la forme<br />

ds 2 = A(r)(dx 0 ) 2 − B(r)(dr 2 + r 2 dθ 2 + r 2 sin 2 θdϕ 2 ). (9.29)<br />

La fonction <strong>de</strong> Lagrange L correspondant à cette métrique est donnée par<br />

2L = A(r)( ˙x 0 ) 2 − B(r)(˙r 2 + r 2 ˙ θ 2 + r 2 sin 2 θ ˙ϕ 2 ), (9.30)<br />

où on utilise la notation ˙x = dx/dλ, λ étant un paramètre affine arbitraire <strong>de</strong> la géodésique.<br />

L’intégrale première 2L = K = const. s’écrit alors<br />

A(r)( ˙x 0 ) 2 − B(r)(˙r 2 + r 2 ˙ θ 2 + r 2 sin 2 θ ˙ϕ 2 ) = K , (9.31)<br />

avec K > 0 pour une géodésique du genre temps et K = 0 pour une géodésique isotrope.<br />

Du fait que L ne dépend explicitement ni <strong>de</strong> x 0 ni <strong>de</strong> ϕ (<strong>de</strong> telles variables sont dites<br />

cycliques ou ignorables), il existe <strong>de</strong>ux autres intégrales premières :<br />

∂L<br />

∂ ˙x 0 ≡ A(r) ˙x0 = E , (9.32)<br />

∂L<br />

∂ ˙ϕ ≡ −B(r)r2 sin 2 θ ˙ϕ = −L, (9.33)<br />

où E et L sont <strong>de</strong>s constantes d’intégration. Notons que L correspond au moment cinétique<br />

conservé en mécanique newtonienne.<br />

Pour obtenir un système complet d’équations du mouvement, il suffit d’adjoindre l’équation<br />

d’Euler-Lagrange pour la variable θ :<br />

d<br />

dλ [−B(r)r2 ˙ θ] + B(r)r 2 sin θ cos θ ˙ϕ 2 = 0. (9.34)<br />

En raison <strong>de</strong> la symétrie sphérique, on peut poser que le mouvement s’effectue dans un plan<br />

fixe passant par l’origine O. Il est alors possible <strong>de</strong> choisir l’orientation <strong>de</strong>s axes <strong>de</strong> telle sorte<br />

que la géodésique étudiée soit dans le plan équatorial d’équation<br />

θ = π<br />

. (9.35)<br />

2<br />

100


Avec ce choix d’axes, on a ˙ θ = 0 et la géodésique est alors déterminée par le système <strong>de</strong>s<br />

trois intégrales premières<br />

<br />

0 2 2 dx dr<br />

A(r) − B(r) − B(r)r<br />

dλ dλ<br />

2<br />

2 dϕ<br />

= K , (9.36)<br />

dλ<br />

A(r) dx0<br />

dλ<br />

B(r)r 2dϕ<br />

dλ<br />

De (9.37) et (9.38), on déduit :<br />

= E , (9.37)<br />

dx 0<br />

dλ<br />

= L. (9.38)<br />

= E<br />

A(r) ,<br />

dϕ<br />

dλ<br />

L<br />

=<br />

r2 . (9.39)<br />

B(r)<br />

Substituons ces expressions dans (9.36) et divisons <strong>de</strong>s <strong>de</strong>ux membres par B(r). Nous obtenons<br />

l’équation différentielle du premier ordre à variables séparables :<br />

2 dr E<br />

=<br />

dλ<br />

2<br />

L2<br />

−<br />

A(r)B(r) r2 1<br />

B2 K<br />

− . (9.40)<br />

(r) B(r)<br />

Deux cas sont à distinguer.<br />

1. L = 0. Dans ce cas ˙ϕ = 0, ce qui entraîne ϕ = constante. La géodésique est dite radiale.<br />

L’équation (9.40) se réduit alors à<br />

2 dr E<br />

=<br />

dλ<br />

2 K<br />

− . (9.41)<br />

A(r)B(r) B(r)<br />

En éliminant dλ entre (9.41) et la première équation <strong>de</strong> (9.39), il vient :<br />

<br />

dr<br />

dx0 2 = A(r)<br />

<br />

1 −<br />

B(r)<br />

K<br />

E2A(r) <br />

. (9.42)<br />

Cette équation du premier ordre à variables séparables permet <strong>de</strong> trouver la relation entre<br />

r et le temps coordonnée t sous forme <strong>de</strong> quadrature.<br />

2. L = 0. Dans ce cas, on peut éliminer dλ entre (9.40) et (9.38), ce qui donne :<br />

2 dr<br />

= r<br />

dϕ<br />

4<br />

<br />

2 E<br />

L2 1 K<br />

−<br />

A(r) L2 <br />

B(r) − 1<br />

r2 <br />

. (9.43)<br />

L’équation (9.43) est une équation différentielle du premier ordre à variables séparables<br />

qui permet en principe <strong>de</strong> déterminer l’angle ϕ en fonction <strong>de</strong> la variable radiale r lorsque les<br />

fonctions A(r) et B(r) sont connues. Il est toutefois plus pratique d’utiliser u = m/r comme<br />

fonction inconnue plutôt que r. En substituant dr = −mu−2du dans (9.43) et en multipliant<br />

les <strong>de</strong>ux membres par u4 , on obtient une équation qui peut s’écrire sous la forme :<br />

2 du<br />

dϕ<br />

= m2 E 2<br />

L 2<br />

B(u) m2<br />

− K<br />

A(u) L2 B(u) − u2 . (9.44)<br />

101


Cette équation différentielle est elle aussi à variables séparables. En prenant la racine carrée<br />

<strong>de</strong> chaque membre <strong>de</strong> (9.44), on obtient l’équation<br />

dϕ = ± <br />

du<br />

m2E2 L2 B(u) m2 − K A(u) L2 B(u) − u2 , (9.45)<br />

qui permet d’exprimer ϕ en fonction <strong>de</strong> u par une quadrature.<br />

L’intégration <strong>de</strong> l’équation (9.45) permet <strong>de</strong> déterminer l’angle <strong>de</strong> déviation <strong>de</strong> la lumière<br />

ainsi que l’avance du périhélie sous la forme d’une intégrale exacte. Pour obtenir une expression<br />

approchée <strong>de</strong> u (ou <strong>de</strong> r) en fonction <strong>de</strong> ϕ, il est toutefois commo<strong>de</strong> <strong>de</strong> différencier (9.44) par<br />

rapport à ϕ. On obtient ainsi<br />

2 du d<br />

dϕ<br />

2u d<br />

=<br />

dϕ2 du<br />

m 2 E 2<br />

L 2<br />

B(u)<br />

A(u)<br />

<br />

m2 du<br />

− K B(u) − 2udu . (9.46)<br />

L2 dϕ dϕ<br />

Si l’orbite ou le rayon lumineux ne sont pas circulaires, du/dϕ = 0 sauf au péricentre ou à<br />

l’apocentre. On peut alors diviser les <strong>de</strong>ux membres <strong>de</strong> (9.46) par 2du/dϕ. En faisant passer le<br />

terme u du second membre dans le premier membre, il vient :<br />

d2u 1<br />

+ u =<br />

dϕ2 2<br />

d<br />

du<br />

m 2 E 2<br />

L 2<br />

B(u)<br />

A(u)<br />

<br />

m2<br />

− K B(u) . (9.47)<br />

L2 L’équation (9.47) se prête mieux que l’équation (9.44) à <strong>de</strong>s calculs perturbatifs.<br />

9.3 Déviation <strong>de</strong> la lumière par une masse à symétrie<br />

sphérique<br />

On doit poser K = 0 pour un rayon lumineux. L’équation (9.44) se réduit alors à<br />

2 du<br />

=<br />

dϕ<br />

m2E2 L2 B(u)<br />

A(u) − u2 . (9.48)<br />

Nous posons que le rayon lumineux atteint le point le plus proche <strong>de</strong> l’origine (péricentre<br />

P) lorsque ϕ = 0 et nous appelons rp la valeur <strong>de</strong> r en ce point (fig. 9.2). La solution <strong>de</strong> (9.48)<br />

doit donc satisfaire aux conditions aux limites<br />

<br />

du<br />

= 0, up ≡ u|ϕ=0 =<br />

dϕ<br />

m<br />

. (9.49)<br />

ϕ=0<br />

En substituant ces expressions dans (9.48), on voit que la constante m2E2 /L2 est donnée<br />

par<br />

m2E2 L2 = u2 Ap<br />

p , (9.50)<br />

Bp<br />

où<br />

rp<br />

Ap = A(up), Bp = B(up). (9.51)<br />

102


L’équation (9.47) s’écrit donc maintenant<br />

d2u 1<br />

+ u =<br />

dϕ2 2 u2 Ap<br />

p<br />

Bp<br />

d<br />

du<br />

<br />

B(u)<br />

. (9.52)<br />

A(u)<br />

L’équation (9.52) est rigoureuse. Nous allons l’appliquer au calcul <strong>de</strong> la déviation <strong>de</strong> la<br />

lumière à l’approximation postnewtonienne du premier ordre en posant (voir chapitre 8) :<br />

A(u) = 1 − 2u + · · · , B(u) = 1 + 2γu + · · · . (9.53)<br />

Pour évaluer l’ordre <strong>de</strong> gran<strong>de</strong>ur <strong>de</strong>s différentes quantités intervenant dans les équations du<br />

mouvement, il est très commo<strong>de</strong> d’introduire le paramètre sans dimension ǫ défini par<br />

ǫ = up = m<br />

. (9.54)<br />

D’après ce que nous avons vu précé<strong>de</strong>mment, une quantité d’ordre ǫ est d’ordre 1/c 2 . Nous<br />

pourrons donc poser<br />

rp<br />

O(ǫ) ∼ O(1/c 2 ) = O(2), O(ǫ 2 ) ∼ O(1/c 4 ) = O(4). (9.55)<br />

Rappelons qu’on a ǫ ≤ 2, 13 × 10−6 à l’extérieur du Soleil.<br />

Il est clair que le second membre <strong>de</strong> (9.47) est d’ordre ǫ2 . À l’approximation du premier<br />

ordre en ǫ, l’équation (9.52) se réduit donc à<br />

d2u + u = 0. (9.56)<br />

dϕ2 La solution <strong>de</strong> cette équation satisfaisant aux conditions aux limites (9.49) est<br />

u = up cos ϕ ⇐⇒ rp = r cos ϕ, (9.57)<br />

ce qui montre que le rayon lumineux coïnci<strong>de</strong> avec la droite orthogonale en P au rayon vecteur<br />

joignant O et P. Pour calculer la déviation relativiste du rayon lumineux, il faut donc retenir<br />

les termes d’ordre ǫ2 dans le second membre <strong>de</strong> (9.52). À cet ordre d’approximation, il suffit <strong>de</strong><br />

prendre :<br />

Ap<br />

B(u)<br />

= 1 + O(ǫ),<br />

Bp<br />

A(u) = 1 + 2(γ + 1)u + O(ǫ2 ) =⇒ d<br />

<br />

B(u)<br />

= 2(γ + 1) + O(ǫ).<br />

du A(u)<br />

Compte tenu <strong>de</strong> (9.53), l’équation (9.52) <strong>de</strong>vient :<br />

d2u dϕ2 + u = (γ + 1)u2p = (γ + 1) m2<br />

r2 . (9.58)<br />

p<br />

La solution <strong>de</strong> cette équation satisfaisant aux conditions (9.49) est<br />

ce qui est équivalent à<br />

u = up {[1 − (γ + 1)up] cos ϕ + (γ + 1)up} , (9.59)<br />

r =<br />

rp<br />

. (9.60)<br />

[1 − (γ + 1)up] cos ϕ + (γ + 1)up<br />

103


δ/2 ^<br />

O P<br />

δ/2<br />

^<br />

Fig. 9.2 – Déviation d’un rayon lumineux par une masse centrale.<br />

L’équation (9.60) est l’équation polaire d’une branche d’hyperbole <strong>de</strong> paramètre p et d’excentricité<br />

e donnés par<br />

p =<br />

r 2 p<br />

(γ + 1)m = rp(e + 1), e =<br />

rp<br />

− 1.<br />

(γ + 1)m<br />

La déviation totale du rayon entre −∞ et ∞ est l’angle δ que forment les <strong>de</strong>ux asymptotes.<br />

Soit ϕ∞ la limite <strong>de</strong> l’angle ϕ lorsque r → ∞, i.e. u → 0. On a <strong>de</strong> façon évi<strong>de</strong>nte<br />

L’équation (9.59) donne donc pour δ/2<br />

up<br />

<br />

[1 − (γ + 1)up] cos<br />

Or, l’angle δ étant petit, on a l’approximation<br />

ϕ∞ = π<br />

2 +<br />

δ<br />

. (9.61)<br />

2<br />

<br />

π<br />

cos<br />

2 +<br />

<br />

δ δ<br />

≈ − sin<br />

2 2<br />

La substitution <strong>de</strong> (9.63) dans (9.62) montre immédiatement que<br />

<br />

π<br />

2 +<br />

<br />

δ<br />

+ (γ + 1)up = 0. (9.62)<br />

2<br />

δ<br />

≈ − . (9.63)<br />

2<br />

δ = 2(γ + 1) m<br />

+ O(ǫ 2 ), (9.64)<br />

rp<br />

104


soit<br />

Si γ = 1, on a<br />

δ = 2(γ + 1) GM<br />

c 2 rp<br />

+ O(4). (9.65)<br />

δ = 1, 75”. (9.66)<br />

pour un rayon lumineux frôlant le Soleil.<br />

La première observation <strong>de</strong> cet effet fut effectuée par Eddington lors <strong>de</strong> l’éclipse totale <strong>de</strong><br />

Soleil <strong>de</strong> 1919 et joua un grand rôle dans l’histoire <strong>de</strong> la théorie <strong>de</strong> la relativité générale, en dépit<br />

d’erreurs systématiques <strong>de</strong> l’ordre <strong>de</strong> 30% sur l’effet à mesurer. Ultérieurement, <strong>de</strong>s mesures <strong>de</strong><br />

déviation d’on<strong>de</strong>s émises par <strong>de</strong>s radio-sources et passant près du Soleil ont permis d’améliorer<br />

les estimations <strong>de</strong> γ. Ainsi, par exemple, Fomalont et Sramec ont-ils trouvé en 1976 grâce à<br />

une technique interférométrique 6<br />

γ = 1, 014 ± 0, 018. (9.67)<br />

Toutefois, l’exactitu<strong>de</strong> <strong>de</strong> ces mesures “historiques” est restée limitée, en raison principalement<br />

d’effets difficilement modélisables dus à la couronne solaire. Heureusement, les mesures <strong>de</strong><br />

type interférométriques (V.L.B.I.) se sont diversifiées et considérablement raffinées 7 et surtout,<br />

on a pu effectuer <strong>de</strong>s déterminations <strong>de</strong> γ extrêmement précises à partir <strong>de</strong> mesures radar entre<br />

la Terre et une planète ou une son<strong>de</strong>, et tout récemment par effet Doppler sur les liens radio<br />

avec la son<strong>de</strong> Cassini, comme nous l’avons signalé dans la section 9.1.<br />

9.4 Avance séculaire du périhélie d’une planète<br />

Pour étudier le mouvement du périhélie d’une planète, nous supposons ici que la planète<br />

est assimilable à une particule d’épreuve, ce qui revient à négliger l’influence <strong>de</strong> sa structure<br />

interne sur son mouvement. En outre, nous négligeons l’influence <strong>de</strong>s autres planètes et nous<br />

supposons que le Soleil est un corps isolé dans l’univers, engendrant un champ gravitationnel à<br />

symétrie sphérique statique. La ligne d’univers <strong>de</strong> la planète est alors une géodésique du genre<br />

temps <strong>de</strong> la métrique.<br />

Du fait que l’on peut choisir l’abscisse curviligne s comme paramètre affine sur toute<br />

géodésique du genre temps, nous posons<br />

K = 1<br />

dans les équations <strong>de</strong>s géodésiques, <strong>de</strong> sorte que (9.44) et (9.47) s’écrivent respectivement<br />

et<br />

2 du<br />

=<br />

dϕ<br />

m2E2 L2 B(u)<br />

A(u)<br />

d2u 1 m<br />

+ u =<br />

dϕ2 2<br />

2E2 L2 d<br />

du<br />

m2<br />

− B(u) − u2<br />

L2 <br />

B(u)<br />

A(u)<br />

(9.68)<br />

− 1 m<br />

2<br />

2<br />

L2 dB(u)<br />

. (9.69)<br />

du<br />

6 Voir E. B. Fomalont & R. A. Sramek, Physical Review Letters, vol. 36, p. 1475 (1976).<br />

7 Voir D. E. Lebach et al., Physical Review Letters, vol. 75, p.1439 (1995).<br />

105


Dans ce qui suit, nous supposons que l’orbite est quasi elliptique (fig. 9.3). Au cours du<br />

mouvement, la variable r va donc passer <strong>de</strong> sa valeur rp au périhélie à sa valeur ra à l’aphélie<br />

et on peut définir le <strong>de</strong>mi-grand axe a et l’excentricité e en posant :<br />

rp = a(1 − e), ra = a(1 + e). (9.70)<br />

En outre, nous imposons ϕ = 0 pour l’un <strong>de</strong>s périhélies, considéré comme périhélie <strong>de</strong><br />

référence. Nous appelons ϕa l’angle <strong>de</strong> l’aphélie qui succè<strong>de</strong> au périhélie <strong>de</strong> référence.<br />

La solution <strong>de</strong> (9.68) décrivant cette orbite doit satisfaire aux conditions aux limites suivantes<br />

:<br />

<br />

du<br />

= 0, up ≡ u|ϕ=0 = m<br />

; (9.71)<br />

dϕ<br />

<br />

du<br />

dϕ<br />

ϕ=0<br />

ϕ=ϕa<br />

= 0, ua ≡ u|ϕ=ϕaph<br />

rp<br />

m<br />

= . (9.72)<br />

ra<br />

Compte tenu <strong>de</strong> l’équation du mouvement (9.68), ces conditions aux limites s’écrivent :<br />

m2E2 Bp<br />

L 2<br />

Ap<br />

m2E2 Ba<br />

où Ap, Bp sont définis par (9.51), et Aa,Ba sont définies par<br />

L 2<br />

Aa<br />

− m2<br />

L 2 Bp − u 2 p = 0, (9.73)<br />

− m2<br />

L 2 Ba − u 2 a = 0, (9.74)<br />

Aa = A(ua), Ba = B(ua). (9.75)<br />

Les équations (9.51) et (9.75) constituent un système <strong>de</strong> <strong>de</strong>ux équations linéaires satisfaites<br />

par les <strong>de</strong>ux inconnues m 2 E 2 /L 2 et m 2 /L 2 . La résolution <strong>de</strong> ce système est aisée. Il vient :<br />

et<br />

m 2 E 2<br />

m2 =<br />

L2 ApAa<br />

=<br />

L2 Aa − Ap<br />

u 2 p<br />

Bp<br />

− u2 a<br />

Ba<br />

<br />

<br />

1 Ap<br />

u<br />

Aa − Ap Bp<br />

2 p − Aa<br />

u<br />

Ba<br />

2 <br />

a<br />

(9.76)<br />

. (9.77)<br />

Toutes les équations données jusqu’ici dans cette section sont rigoureuses et peuvent être<br />

appliquées dans n’importe quelle théorie métrique. Nous allons maintenant remplacer Ap, Bp,<br />

Aa et Ba par leurs développements postnewtoniens respectifs obtenus à partir <strong>de</strong><br />

A(u) = 1 − 2mu + 2βu 2 + · · · , B(u) = 1 + 2γu + · · · (9.78)<br />

Pour définir l’ordre <strong>de</strong> gran<strong>de</strong>ur <strong>de</strong>s différentes quantités intervenant dans notre problème,<br />

nous pouvons nous servir du paramètre up comme nous l’avons fait pour la lumière ou encore<br />

poser pour plus <strong>de</strong> commodité<br />

ǫ = m<br />

. (9.79)<br />

L’approximation du premier ordre par rapport à ǫ correspond à l’approximation newtonienne.<br />

Il faudra donc développer le second membre <strong>de</strong> (9.69) jusqu’au second ordre en ǫ. En<br />

a<br />

106


conséquence, il faut former le développement <strong>de</strong>s constantes du mouvement m 2 E 2 /L 2 et m 2 /L 2<br />

à l’ordre ǫ 2 . Un calcul <strong>de</strong> développements limités donne 8 :<br />

et<br />

m2 =<br />

L2 m 2 E 2<br />

=<br />

L2 m<br />

a(1 − e 2 ) +<br />

m<br />

a(1 − e 2 ) +<br />

m2 a2 (1 − e2 <br />

2[β − 2(γ + 1)](1 − e<br />

)<br />

2 ) + γ <br />

+ O(ǫ 3 ) (9.80)<br />

m2 a2 (1 − e2 <br />

2[β − 2(γ + 1)](1 − e<br />

)<br />

2 ) + γ + 1 <br />

+ O(ǫ 3 ). (9.81)<br />

La comparaison <strong>de</strong> (9.80) et (9.81) montre immédiatement que<br />

m2 L2 = m2E2 m<br />

+<br />

L2 2<br />

a2 (1 − e2 ) + O(ǫ3 ). (9.82)<br />

Substituons (9.82) dans (9.69). Nous obtenons l’équation du mouvement :<br />

d2u 1<br />

+ u =<br />

dϕ2 2<br />

m 2 E 2<br />

L 2<br />

d<br />

du<br />

<br />

B(u)<br />

−<br />

A(u)<br />

dB(u)<br />

<br />

du<br />

− 1<br />

2<br />

m 2<br />

a 2 (1 − e 2 )<br />

dB(u)<br />

du + O(ǫ3 ) (9.83)<br />

où la constante m 2 E 2 /L 2 doit être remplacée par son expression approchée (9.80). Cette<br />

constante étant du premier ordre en ǫ, il suffit <strong>de</strong> retenir le développement du premier ordre<br />

pour l’expression entre accola<strong>de</strong>s dans le second membre <strong>de</strong> (9.83). On a :<br />

soit<br />

D’où<br />

d<br />

du<br />

B(u)<br />

A(u) − B(u) = 2u + 2[2(γ + 1) − β]u2 + O(u 3 ).<br />

<br />

B(u)<br />

−<br />

A(u)<br />

dB(u)<br />

du = 2 + 4[2(γ + 1) − β]u + O(u2 ). (9.84)<br />

Pour terminer le calcul du second membre <strong>de</strong> (9.83), il suffit <strong>de</strong> noter que<br />

1<br />

2<br />

m 2<br />

a 2 (1 − e 2 )<br />

dB(u)<br />

du<br />

Substituons (9.84) et (9.85) dans (9.83). Il vient :<br />

d 2 u<br />

dϕ2 + u = m2E2 L<br />

= γ m2<br />

a 2 (1 − e 2 ) + O(ǫ3 ). (9.85)<br />

2 {1 + 2[2(γ + 1) − β]u} − γ m2<br />

a 2 (1 − e 2 ) + O(ǫ3 ),<br />

d2 <br />

u<br />

+ 1 − 2<br />

dϕ2 m2E2 L2 <br />

[2(γ + 1) − β] u = m2E2 m2<br />

− γ<br />

L2 a2 (1 − e2 . (9.86)<br />

)<br />

Dans le premier membre <strong>de</strong> (9.86), la constante m 2 E 2 /L 2 peut être remplacée par son<br />

expression approchée du premier ordre<br />

m 2 E 2<br />

=<br />

L2 8 On déduit aisément <strong>de</strong> ces formules que E 2 = 1 − m<br />

a + O(ǫ2 ) .<br />

m<br />

a(1 − e 2 ) + O(ǫ2 ). (9.87)<br />

107


Le second membre <strong>de</strong> (9.86) est quant à lui donné par<br />

m 2 E 2<br />

m2<br />

− γ<br />

L2 a2 (1 − e2 ) =<br />

m<br />

a(1 − e2 <br />

1 −<br />

)<br />

6m<br />

a(1 − e 2 )<br />

<br />

2(γ + 1) − β<br />

3<br />

(9.88)<br />

Substituons (9.87) et (9.88) dans (9.86). Nous obtenons finalement l’équation du mouvement<br />

approchée<br />

d2 <br />

u 6m<br />

+ 1 −<br />

dϕ2 a(1 − e2 <br />

2(γ + 1) − β m<br />

u =<br />

) 3 a(1 − e2 <br />

6m<br />

1 −<br />

) a(1 − e2 <br />

2(γ + 1) − β<br />

. (9.89)<br />

) 3<br />

Cette équation différentielle est <strong>de</strong> la forme u ′′ + ω 2 u = const., qu’il est facile d’intégrer. La<br />

solution <strong>de</strong> (9.89) correspondant à un périhélie atteint en ϕ = 0 est<br />

où ω est la constante définie par<br />

ω =<br />

u =<br />

m<br />

a(1 − e2 (1 + e cos ωϕ), (9.90)<br />

)<br />

<br />

<br />

<br />

6m<br />

1 −<br />

a(1 − e2 2(γ + 1) − β<br />

) 3<br />

≈ 1 −<br />

3m<br />

a(1 − e2 2(γ + 1) − β<br />

. (9.91)<br />

) 3<br />

Du fait que u = m/r, on déduit immédiatement <strong>de</strong> (9.90) qu’à l’approximation 1PN, l’orbite<br />

relativiste d’une planète autour du Soleil est décrite en coordonnées polaires (r,ϕ) par l’équation<br />

où ω est donné par (9.91) que l’on peut encore écrire<br />

r = a(1 − e2 )<br />

, (9.92)<br />

1 + e cos ωϕ<br />

ω = 1 − 3GM<br />

c2a(1 − e2 2(γ + 1) − β<br />

. (9.93)<br />

) 3<br />

Les expressions (9.92) et (9.93) sont correctes à <strong>de</strong>s termes d’ordre ε 2 près. On notera que<br />

l’orbite képlérienne prévue par la théorie newtonienne serait obtenue en posant ω = 1 dans<br />

(9.92) (on a alors l’équation d’une ellipse <strong>de</strong> foyer O, <strong>de</strong> <strong>de</strong>mi-grand axe a et d’excentricité e.)<br />

L’équation polaire (9.92) permet <strong>de</strong> déduire très facilement l’avance ∆ϕper du périhélie par<br />

révolution. En effet, ∆ϕper est défini par<br />

soit<br />

ω(2π + ∆ϕper) = 2π ,<br />

<br />

1<br />

∆ϕper = 2π − 1 . (9.94)<br />

ω<br />

En substituant (9.93) dans (9.94), il vient à <strong>de</strong>s termes d’ordre 1/c4 près<br />

∆ϕper = 6πGM<br />

c2a(1 − e2 2(γ + 1) − β<br />

) 3<br />

108<br />

rad/révolution. (9.95)


A<br />

Pour la planète Mercure, on a<br />

1<br />

A<br />

2<br />

O<br />

Fig. 9.3 – Avance séculaire du péricentre.<br />

6πGM⊙<br />

c 2 a(1 − e 2 )<br />

P<br />

3<br />

P<br />

2<br />

A<br />

P<br />

3<br />

1<br />

= 42, 98 ”/siècle . (9.96)<br />

Par ailleurs, l’avance séculaire résiduelle du périhélie <strong>de</strong> Mercure déduite <strong>de</strong>s observations<br />

est très voisine <strong>de</strong> 43 ”/siècle. Citons par exemple <strong>de</strong>ux résultats récents obtenus à partir <strong>de</strong><br />

<strong>de</strong>ux systèmes d’éphéméri<strong>de</strong>s, DE 405 et EPM 2000 :<br />

(∆ϕper) obs = 43, 004 ± 0, 002 ”/siècle (DE 405)<br />

= 43, 0115 ± 0, 0085 ”/siècle (EPM 2000) . (9.97)<br />

La comparaison <strong>de</strong> (9.95) et (9.96) montre que le rapport (2(γ + 1) − β)/3 prédit doit être<br />

très voisin <strong>de</strong> 1 pour que la théorie métrique soit acceptable. Il faut néanmoins tenir compte du<br />

moment quadrupolaire J2 du Soleil pour avoir une contrainte fiable sur la combinaison 2(γ +<br />

1)−β. Un calcul plus complet que celui que nous avons fait ci-<strong>de</strong>ssus montre que le déplacement<br />

du périhélie d’une planète ayant une orbite d’inclinaison i est donné par l’expression 9<br />

∆ϕper = 6πGM⊙<br />

c 2 a(1 − e 2 )<br />

2(γ + 1) − β<br />

3<br />

−<br />

R2 ⊙<br />

2ma(1 − e2 ) J2(3 sin 2 <br />

i − 1)<br />

rad/révolution, (9.98)<br />

où R⊙ est le rayon équatorial du Soleil. Pour Mercure, la prédiction théorique est alors donnée<br />

par<br />

<br />

2(γ + 1) − β<br />

∆ϕper = 42, 98 + 3 × 10<br />

3<br />

−4<br />

<br />

J2<br />

10−7 ”/siècle . (9.99)<br />

9 Voir par ex. S. Pireaux, J.-P. Rozelot & S. Godier, Astrophys. Space Sci., vol. 284, pp. 1159-1194 (2003).<br />

109


Il est malheureusement difficile <strong>de</strong> donner un intervalle <strong>de</strong> valeurs acceptables très serré<br />

pour la quantité [2(γ +1) −β]/3 car on ne connaît pas bien la valeur du moment quadrupolaire<br />

J2 du Soleil 10 . Il est cependant admis qu’on peut poser<br />

9.5 Que faire pour aller plus loin?<br />

<br />

<br />

1<br />

<br />

<br />

[2(γ + 1) − β] − 1<br />

≤ 0, 001. (9.100)<br />

3<br />

Ce chapitre a montré que l’hypothèse selon laquelle la gravitation est une manifestation <strong>de</strong><br />

la courbure d’une métrique conduit à prédire un certain nombre d’effets qui sont effectivement<br />

observés. Le schéma “phénoménologique” contenant <strong>de</strong>ux paramètre postnewtoniens β et γ<br />

proposé par Eddington permet <strong>de</strong> tester cette hypothèse avant même d’avoir formulé une théorie<br />

complète.<br />

Nous avons vu que les valeurs “simples” γ = 1 et β = 1 sont compatibles avec les mesures<br />

effectuées dans le système solaire. Nous pourrons donc considérer ces valeurs comme<br />

<strong>de</strong>s valeurs “standard”, sans oublier toutefois qu’aucune observation ne peut évi<strong>de</strong>mment les<br />

imposer <strong>de</strong> manière formelle. Il convient donc <strong>de</strong> gar<strong>de</strong>r à l’esprit qu’une classe étendue <strong>de</strong><br />

théories métriques va s’avérer envisageable, d’autant que nous n’avons pas étudié tous les tests<br />

présentement disponibles.<br />

Il est toutefois clair que nous ne pouvons nous contenter d’un tel schéma phénoménologique,<br />

et ce pour plusieurs raisons.<br />

1. Il est évi<strong>de</strong>mment simpliste <strong>de</strong> supposer qu’une planète comme Mercure par exemple est<br />

une particule ponctuelle <strong>de</strong> masse négligeable gravitant dans un champ à symétrie sphérique<br />

invariable au cours du temps. Mercure est un corps étendu ayant un champ gravitationnel propre<br />

en interaction non seulement avec le Soleil mais aussi avec tous les autres objets du système<br />

solaire, eux-mêmes en interaction avec le reste <strong>de</strong> l’Univers. En fait, le champ gravitationnel<br />

du système solaire est un champ dynamique, créé par <strong>de</strong>s corps étendus qui se déforment sans<br />

cesse en raison <strong>de</strong> leurs mouvements et <strong>de</strong> leurs interactions mutuelles.<br />

2. On sait <strong>de</strong>puis longtemps qu’il existe <strong>de</strong> nombreux sites astrophysiques dans lesquels le<br />

champ <strong>de</strong> gravitation ne peut être considéré comme faible (étoiles à neutrons, pulsars binaires,<br />

noyaux <strong>de</strong>s galaxies, etc.).<br />

3. Nous avons déjà souligné que la relativité restreinte “prédisposait” à considérer l’interaction<br />

gravitationnelle comme <strong>de</strong>vant se propager par on<strong>de</strong>s se déplaçant avec la vitesse c.<br />

4. Enfin, bien que nous ne puissions insister ici, la théorie <strong>de</strong> Newton dans sa formulation<br />

usuelle soulève beaucoup <strong>de</strong> difficultés quand on veut formuler les problèmes cosmologiques <strong>de</strong><br />

manière vraiment cohérente.<br />

Il est donc maintenant impératif <strong>de</strong> chercher une théorie ou une classe <strong>de</strong> théories qui<br />

apportent <strong>de</strong>s réponses précises aux quatre types <strong>de</strong> problèmes que nous venons d’évoquer et<br />

qui prédisent <strong>de</strong>s valeurs <strong>de</strong> β et γ suffisamment proches <strong>de</strong> 1 pour être en bon accord avec les<br />

observations.<br />

10 La plupart <strong>de</strong>s modèles du Soleil conduisent à <strong>de</strong>s valeurs est <strong>de</strong> l’ordre <strong>de</strong> quelques 10 −7 pour J2. On prend<br />

souvent J2 = (2 ± 0,4) × 10 −7 .<br />

110


Nous allons voir dans le chapitre suivant qu’il existe une théorie qui 1) décrit entièrement<br />

le champ <strong>de</strong> gravitation par une métrique, 2) prédit exactement γ = 1 et β = 1, 3) n’est en<br />

contradiction avec aucun autre test actuel. Cette théorie est la relativité générale 11 .<br />

11 L’affirmation que la relativité générale n’est contredite par aucun test ne signifie pas que cette théorie ne<br />

rencontre aucune difficulté. C’est ainsi que l’anomalie Pioneer n’a pas reçu d’interprêtation faisant consensus,<br />

et que la cosmologie dresse plusieurs défis. Mais aucun <strong>de</strong> ces problèmes ne peut être pour le moment considéré<br />

comme un test.<br />

111


Chapitre 10<br />

La relativité générale<br />

Dans le chapitre 7, nous avons formulé un cadre général définissant ce qu’on appelle les<br />

théories métriques <strong>de</strong> la gravitation. Nous avons souligné que la <strong>de</strong>scription complète du champ<br />

<strong>de</strong> gravitation ne se réduisait pas nécessairement à une métrique lorentzienne. Il existe cependant<br />

une théorie dans laquelle le champ <strong>de</strong> gravitation est entièrement décrit par la métrique et<br />

qui est en bon accord avec l’expérience et avec la quasi totalité <strong>de</strong>s observations, c’est la relativité<br />

générale, certainement la plus élégante <strong>de</strong> toutes les théories ayant survécu aux différents<br />

tests que l’on a pu mener jusqu’ici. Nous exposons brièvement la démarche qui conduit aux<br />

équations d’Einstein, puis nous montrons comment on détermine la métrique <strong>de</strong> Schwarzschild<br />

et quelques unes <strong>de</strong> ses conséquences astronomiques.<br />

10.1 Les équations d’Einstein<br />

Pour construire une théorie purement métrique <strong>de</strong> la gravitation, il faut formuler <strong>de</strong>s<br />

équations <strong>de</strong> champ gouvernant les composantes gµν <strong>de</strong> la métrique. Nous allons nous laisser<br />

gui<strong>de</strong>r par la théorie newtonienne <strong>de</strong> la gravitation.<br />

Nous avons rappelé dans le chapitre 7 que le potentiel newtonien U d’une distribution <strong>de</strong><br />

matière <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> masse inertielle ρ(x,t) vérifie l’équation <strong>de</strong> Laplace<br />

à l’extérieur <strong>de</strong> la matière, et vérifie l’équation <strong>de</strong> Poisson<br />

∆2U = 0 (10.1)<br />

∆2U = −4πGρ(x,t) (10.2)<br />

à l’intérieur <strong>de</strong>s masses, ∆2U étant l’opérateur laplacien défini par<br />

∆2U = ∂2 U<br />

(∂x 1 ) 2 + ∂2 U<br />

(∂x 2 ) 2 + ∂2 U<br />

(∂x 3 ) 2 = δij ∂iU∂jU , (10.3)<br />

où les coordonnées x i sont <strong>de</strong>s coordonnées cartésiennes orthonormées.<br />

Les équations aux dérivées partielles (10.1) et (10.2) sont du second ordre. Nous allons donc<br />

postuler que les équations satisfaites par la métrique sont aussi du second ordre.<br />

112


Du fait qu’il y a dix gµν indépendants 1 , il faut un système <strong>de</strong> dix équations aux dérivées<br />

partielles. Gouvernant un tenseur, ces équations doivent elles-mêmes être <strong>de</strong>s égalités <strong>de</strong> tenseurs.<br />

Ces tenseurs doivent être <strong>de</strong>ux fois contravariants (ou <strong>de</strong>ux fois covariants) et symétriques<br />

afin d’obtenir les dix relations souhaitées. Il est donc légitime <strong>de</strong> supposer que les équations<br />

cherchées sont <strong>de</strong> la forme<br />

S µν (g,∂g,∂ 2 g) = κT µν , (10.4)<br />

où S µν (g,∂g,∂ 2 g) est un tenseur construit uniquement avec les gµν, leurs dérivées premières et<br />

leurs dérivées secon<strong>de</strong>s, κ est une constante <strong>de</strong> couplage et T µν est un tenseur qui décrit les<br />

sources du champ gravitationnel.<br />

En observant le second membre <strong>de</strong> l’équation <strong>de</strong> Poisson (10.2), on pourrait penser que T µν<br />

doit être construit à partir <strong>de</strong> la <strong>de</strong>nsité <strong>de</strong> masse inertielle <strong>de</strong> la matière. Mais nous avons<br />

vu dans la section 7.2 qu’il y a <strong>de</strong> bonnes raisons d’admettre que non seulement la matière<br />

constituée d’atomes ou <strong>de</strong> particules, mais également toutes les autres formes d’énergie sont <strong>de</strong>s<br />

sources du champ <strong>de</strong> gravitation. En particulier, une distribution d’énergie électromagnétique<br />

telle qu’un faisceau lumineux par exemple doit créer un champ <strong>de</strong> gravitation.<br />

La relativité restreinte établit aussi que l’énergie divisée par c et la quantité <strong>de</strong> mouvement<br />

(ou impulsion) d’une particule constituent les composantes d’un quadrivecteur appelé<br />

le quadrivecteur impulsion-énergie. On peut montrer qu’on peut définir un quadrivecteur <strong>de</strong>nsité<br />

d’impulsion-énergie pour un champ quelconque (champ scalaire, champ électromagnétique,<br />

etc.). Il est donc naturel <strong>de</strong> penser que les composantes <strong>de</strong> l’impulsion <strong>de</strong> la matière et <strong>de</strong>s<br />

autres distributions d’énergie doivent aussi contribuer au champ <strong>de</strong> gravitation.<br />

Les raisons énumérées ci-<strong>de</strong>ssus conduisent à postuler que T µν doit être l’extension à un<br />

espace-temps muni d’une métrique douée <strong>de</strong> courbure <strong>de</strong> ce qu’on appelle un tenseur impulsionénergie<br />

en relativité restreinte. Nous nous contenterons d’indiquer ici que pour un flui<strong>de</strong> parfait 2<br />

<strong>de</strong> <strong>de</strong>nsité propre 3 d’énergie µc 2 et <strong>de</strong> pression p, le tenseur impulsion-énergie est <strong>de</strong> la forme<br />

où u µ est le quadrivecteur vitesse unitaire du flui<strong>de</strong> défini par<br />

T µν = (µc 2 + p)u µ u ν − pg µν , (10.5)<br />

u µ = dxµ<br />

ds<br />

, (10.6)<br />

les dérivées dx µ étant prises le long <strong>de</strong> la ligne d’univers <strong>de</strong> chaque particule du flui<strong>de</strong>. On<br />

notera que le vecteur u µ est tangent à la ligne d’univers d’une particule du flui<strong>de</strong>. En outre, u µ<br />

est unitaire car on a<br />

gµνu µ u ν dx<br />

= gµν<br />

µ dx<br />

ds<br />

ν<br />

ds = gµνdx µ dxν ds2 = ds2<br />

= 1. (10.7)<br />

ds2 Dans certains cas, on peut au moins en première approximation négliger la pression du<br />

flui<strong>de</strong>. Le tenseur impulsion-énergie (10.5) se réduit alors à<br />

T µν = µc 2 u µ u ν . (10.8)<br />

1 Ne pas oublier que les gµν sont symétriques.<br />

2 Un flui<strong>de</strong> est dit parfait lorsqu’on peut négliger les forces <strong>de</strong> frottement internes (viscosité) et les échanges<br />

<strong>de</strong> chaleur entre ses différentes parties. Le mouvement d’un flui<strong>de</strong> parfait est donc adiabatique.<br />

3 Par définition, la <strong>de</strong>nsité propre d’une quantité est la valeur <strong>de</strong> cette quantité par unité <strong>de</strong> volume dans le<br />

référentiel comouvant avec le flui<strong>de</strong>.<br />

113


On dit que (10.8) décrit un schéma matière pure ou incohérente.<br />

On peut aussi construire <strong>de</strong>s tenseurs impulsion-énergie décrivant un flui<strong>de</strong> avec courant<br />

d’entropie, un plasma, un champ électromagnétique, un champ scalaire, etc.<br />

On postule enfin que les dix composantes du tenseur impulsion-énergie figurant dans le<br />

second membre <strong>de</strong> (10.4) doivent satisfaire les quatre équations suivantes :<br />

∇µT µν = 0, (10.9)<br />

qui sont appelées équations <strong>de</strong> conservation. Ces quatre équations qu’il faut ajouter aux dix<br />

équations du champ (10.4) sont les équations du mouvement <strong>de</strong>s sources du champ <strong>de</strong> gravitation.<br />

Pour être compatible avec les équations <strong>de</strong> conservation (10.9), le tenseur S µν doit satisfaire<br />

les quatre équations<br />

∇µS µν = 0 (10.10)<br />

quelle que soit la métrique g, que cette métrique soit solution <strong>de</strong>s équations du champ (10.4)<br />

ou non. Autrement dit, les équations (10.10) doivent être <strong>de</strong>s i<strong>de</strong>ntités. Or, on démontre que<br />

les tenseurs S µν symétriques que l’on peut construire uniquement avec gµν, ∂αgλρ et ∂α∂βgστ et<br />

qui vérifient les i<strong>de</strong>ntités (10.10) sont nécessairement <strong>de</strong> la forme<br />

S µν = G µν − Λg µν , (10.11)<br />

où G µν est le tenseur d’Einstein défini par l’équation (C.68) <strong>de</strong> l’annexe C et Λ est une constante<br />

arbitraire. Rappelons que l’expression du tenseur d’Einstein est donnée par la formule<br />

où<br />

et<br />

G µν = R µν − 1<br />

2 Rgµν , (10.12)<br />

R µν = g µα g νβ Rαβ<br />

(10.13)<br />

R = g αβ Rαβ, (10.14)<br />

les quantités Rαβ étant les composantes covariantes du tenseur <strong>de</strong> Ricci explicitées par les<br />

équations (C.65) <strong>de</strong> l’annexe C.<br />

Les hypothèses faites ci-<strong>de</strong>ssus nous amènent donc au postulat fondamental suivant, énonçant<br />

les célèbres équations d’Einstein.<br />

Postulat 10.1.1 (Équations d’Einstein)<br />

a) Dans les régions <strong>de</strong> l’espace-temps balayées par une distribution <strong>de</strong> matière ou d’énergie<br />

décrite par un tenseur impulsion-énergie T µν , les potentiels <strong>de</strong> gravitation gµν sont solutions<br />

<strong>de</strong>s équations dites du cas intérieur<br />

G µν ≡ R µν − 1<br />

2 Rgµν = κT µν + Λg µν . (10.15)<br />

b) Dans les régions ne contenant aucune distribution <strong>de</strong> matière ou d’énergie, les potentiels<br />

<strong>de</strong> gravitation sont solutions <strong>de</strong>s équations dites du cas extérieur<br />

G µν ≡ R µν − 1<br />

2 Rgµν = Λg µν . (10.16)<br />

114


Dans les équations (10.15) et (10.16), κ est une constante <strong>de</strong> couplage gravitationnel définie<br />

par<br />

κ = 8πG<br />

c4 (10.17)<br />

et Λ est une constante appelée constante cosmologique.<br />

La formule (10.17) donnant la valeur <strong>de</strong> la constante <strong>de</strong> couplage κ est déterminée par la<br />

nécessité <strong>de</strong> retrouver la loi <strong>de</strong> gravitation newtonienne à l’approximation <strong>de</strong>s champs faibles.<br />

En revanche, la constante cosmologique Λ n’est actuellement reliée à aucune autre constante<br />

<strong>de</strong> la physique. La seule certitu<strong>de</strong> est que sa valeur est extrêmement faible et la rend <strong>de</strong> ce fait<br />

négligeable en <strong>de</strong>hors du contexte cosmologique. Son existence paraît liée à ce qu’on appelle<br />

l’énergie du vi<strong>de</strong> telle que la conçoit la théorie quantique <strong>de</strong>s champs, mais le problème majeur<br />

est que la valeur <strong>de</strong> Λ <strong>de</strong>vrait être énorme, au lieu d’être très faible. L’existence et la valeur<br />

phénoménologique <strong>de</strong> Λ constituent l’une <strong>de</strong>s gran<strong>de</strong>s énigmes <strong>de</strong> la physique théorique et <strong>de</strong> la<br />

cosmologie contemporaines (nature <strong>de</strong> énergie noire provoquant l’accélération <strong>de</strong> l’expansion).<br />

En notant que g µρ gµν = δ ρ ν entraîne g µν gµν = 4, on voit facilement que les équations d’Einstein<br />

peuvent encore s’écrire comme l’indique la proposition ci-<strong>de</strong>ssous.<br />

Proposition 10.1.1<br />

a) Dans le cas intérieur, les équations d’Einstein (10.15) sont équivalentes à<br />

R µν <br />

= κ T µν − 1<br />

2 Tgµν<br />

<br />

− Λg µν<br />

b) Dans le cas extérieur, les équations (10.16) sont équivalentes à<br />

(10.18)<br />

R µν = −Λg µν . (10.19)<br />

Les dix équations d’Einstein ne permettent pas à elles seules <strong>de</strong> résoudre un problème <strong>de</strong><br />

gravitation. Il faut impérativement leur ajouter les quatre équations du mouvement (10.9),<br />

qui peuvent être considérées comme <strong>de</strong>s conditions d’intégrabilité. Mais cette adjonction n’est<br />

elle-même pas suffisante. Il faut également écrire les relations entre les variables <strong>de</strong> champ<br />

définissant les sources (par ex. une équation d’état µ = f(p) pour un flui<strong>de</strong> parfait), ainsi que<br />

l’ensemble <strong>de</strong>s conditions aux limites nécessaires pour qu’une métrique solution <strong>de</strong>s équations<br />

d’Einstein ait un sens physique.<br />

10.2 La métrique <strong>de</strong> Schwarzschild extérieure<br />

Nous allons chercher les solutions <strong>de</strong>s équations d’Einstein à l’extérieur d’un corps massif<br />

à symétrie sphérique. Nous supposons que les solutions sont statiques, i.e. indépendantes du<br />

temps. En outre, nous négligeons la constante cosmologique. Enfin, nous supposons que la<br />

métrique tend à coïnci<strong>de</strong>r avec la métrique <strong>de</strong> Minkowski lorsqu’on s’éloigne indéfiniment du<br />

corps central. On dit que la métrique doit être asymptotiquement plate à l’infini spatial.<br />

115


Il est commo<strong>de</strong> d’exprimer la métrique dans un système <strong>de</strong> coordonnées locales sphériques<br />

(ρ,θ,ϕ). On peut montrer par <strong>de</strong>s arguments <strong>de</strong> symétrie que ces coordonnées peuvent toujours<br />

être choisies <strong>de</strong> telle sorte que la métrique ne contienne que <strong>de</strong>ux potentiels inconnus et s’écrive<br />

sous la forme<br />

ds 2 = e ν(ρ) (dx 0 ) 2 − e λ(ρ) dρ 2 − ρ 2 (dθ 2 + sin 2 θdϕ 2 ). (10.20)<br />

En un point infiniment éloigné <strong>de</strong> la source du champ, la métrique (10.20) doit coïnci<strong>de</strong>r<br />

avec la métrique <strong>de</strong> Minkowski écrite en coordonnées sphériques usuelles, c’est-à-dire :<br />

ds 2 = (dx 0 ) 2 − dρ 2 − ρ 2 (dθ 2 + sin 2 θdϕ 2 ). (10.21)<br />

Cette condition se traduit par les conditions aux limites<br />

lim ν(ρ) = 0, lim λ(ρ) = 0. (10.22)<br />

ρ→∞ ρ→∞<br />

Le calcul <strong>de</strong>s composantes contravariantes du tenseur d’Einstein correspondant à la métrique<br />

(10.20) s’effectue à partir <strong>de</strong>s expressions explicites <strong>de</strong> R µν et <strong>de</strong> R fournies par les équations<br />

(10.13) et (10.14) du présent chapitre et par les équations (C.65) <strong>de</strong> l’annexe C. Un calcul assez<br />

long mais sans difficulté particulière montre que les seules composantes contravariantes du<br />

tenseur d’Einstein correspondant à la métrique (10.20) non i<strong>de</strong>ntiquement nulles sont données<br />

par :<br />

G 00 = e−ν(ρ)<br />

ρ 2<br />

G 11 = e−λ(ρ)<br />

ρ 2<br />

G 22 = e−λ(ρ)<br />

ρ 2<br />

<br />

1 − e −λ(ρ) (1 − ρλ ′ ) <br />

, (10.23)<br />

<br />

e −λ(ρ) (1 + ρν ′ ) − 1 <br />

, (10.24)<br />

ν ′ − λ ′<br />

2ρ<br />

ν′′<br />

+<br />

2 + ν′ − λ ′<br />

2<br />

ν ′<br />

<br />

, (10.25)<br />

2<br />

G 33 ≡ 1<br />

sin 2 θ G22 , (10.26)<br />

où f ′ désigne la dérivée d’une fonction f(ρ) par rapport à ρ.<br />

Compte tenu <strong>de</strong> (10.23)-(10.26), le système <strong>de</strong>s équations d’Einstein du vi<strong>de</strong> (G µν = 0) se<br />

réduit aux trois équations suivantes :<br />

1 − e −λ(ρ) (1 − ρλ ′ ) = 0, (10.27)<br />

e −λ(ρ) (1 + ρν ′ ) − 1 = 0, (10.28)<br />

2(ν ′ − λ ′ ) + 2ρν ′′ + ρ(ν ′ − λ ′ )ν ′ = 0. (10.29)<br />

On vérifie facilement que (10.29) est conséquence <strong>de</strong> (10.27) et (10.28). L’équation (10.27)<br />

peut s’écrire sous la forme<br />

d <br />

e<br />

dρ<br />

−λ(ρ) ρ <br />

= 1. (10.30)<br />

L’intégration <strong>de</strong> (10.30) donne immédiatement e−λ(ρ) ρ = ρ + C, C étant une constante<br />

arbitraire. Il s’ensuit que<br />

e −λ(ρ) = 1 + C<br />

. (10.31)<br />

ρ<br />

116


Maintenant, additionnons membre à membre (10.27) et (10.28). Il vient :<br />

ν ′ + λ ′ = 0. (10.32)<br />

L’unique solution <strong>de</strong> (10.32) compatible avec les conditions aux limites (10.22) est<br />

On déduit <strong>de</strong> (10.31) et <strong>de</strong> (10.33) que<br />

ν + λ = 0 ⇐⇒ ν = −λ . (10.33)<br />

e ν(ρ) = e −λ(ρ) = 1 + C<br />

. (10.34)<br />

ρ<br />

Or, nous avons vu qu’on doit avoir g00 ≈ 1 − 2U/ρ loin <strong>de</strong> la masse centrale <strong>de</strong> manière à<br />

retrouver la loi <strong>de</strong> Newton en première approximation. Du fait qu’on a U ≈ GM/ρ pour un<br />

corps attractif <strong>de</strong> masse M à symétrie sphérique, il faut donc poser<br />

C = −2m , avec m = GM<br />

c 2 . (10.35)<br />

En substituant (10.35) dans (10.34), on voit que la solution à symétrie sphérique statique<br />

<strong>de</strong>s équations d’Einstein du vi<strong>de</strong> sans constante cosmologique s’écrit<br />

ds 2 <br />

= 1 − 2m<br />

<br />

(dx<br />

ρ<br />

0 ) 2 − dρ2<br />

1 − 2m<br />

ρ<br />

− ρ 2 (dθ 2 + sin 2 θdϕ 2 ). (10.36)<br />

Cette solution est célèbre : on l’appelle la métrique <strong>de</strong> Schwarzschild extérieure.<br />

Lorsqu’on ne néglige pas la constante cosmologique, les solutions <strong>de</strong>s équations d’Einstein<br />

du vi<strong>de</strong> G µν = Λg µν s’écrivant sous la forme (10.20) sont données par<br />

ds 2 =<br />

<br />

1 − 2m<br />

ρ<br />

Λ<br />

−<br />

3 ρ2<br />

<br />

(dx 0 ) 2 −<br />

1 − 2m<br />

ρ<br />

dρ 2<br />

− Λ<br />

3 ρ2 − ρ2 (dθ 2 + sin 2 θdϕ 2 ), (10.37)<br />

où m est une constante arbitraire que l’on peut encore interpréter comme un terme <strong>de</strong> masse<br />

centrée sur l’origine ρ = 0.<br />

On peut voir que Λ > 0 correspond à une force répulsive proportionnelle à ρ en première approximation,<br />

tandis que Λ < 0 correspond à une force attractive. Dans ce qui suit, on supposera<br />

Λ = 0.<br />

10.3 Forme isotropique <strong>de</strong> la métrique <strong>de</strong> Schwarzschild<br />

Il est possible d’écrire la métrique <strong>de</strong> Schwarzschild sous une forme isotropique (voir chapitre<br />

8) en effectuant le changement <strong>de</strong> coordonnée radiale défini par<br />

<br />

ρ = r 1 + m<br />

2 2r<br />

117<br />

= r + m + m2<br />

. (10.38)<br />

4r


On trouve<br />

ds 2 =<br />

<br />

m 1 − 2r<br />

1 + m<br />

2 (dx<br />

2r<br />

0 ) 2 <br />

−<br />

1 + m<br />

2r<br />

Un développement en puissances <strong>de</strong> m/r donne<br />

1 − m<br />

2r<br />

<br />

1 + m<br />

2r<br />

1 + m<br />

2r<br />

2<br />

4<br />

= 1 − 2m<br />

r<br />

= 1 + 2m<br />

r<br />

4 <br />

dr 2 + r 2 (dθ 2 + sin 2 θdϕ 2 ) <br />

. (10.39)<br />

+ 2m2 + ..., (10.40)<br />

r2 + 3<br />

2<br />

m2 + ... (10.41)<br />

r2 La comparaison <strong>de</strong>s développements (10.40) et (10.41) avec les développements postnewtoniens<br />

(8.21) montre immédiatement que γ = 1 et β = 1. On en conclut que la métrique <strong>de</strong><br />

Schwarzschild est en excellent accord avec les tests classiques. On notera par ailleurs que le<br />

paramètre postpostnewtonien δ = 1, ce qui est intéressant pour la théorie <strong>de</strong>s rayons lumineux<br />

à l’approximation dite 2PN.<br />

Nous allons maintenant montrer que ces valeurs <strong>de</strong> γ et β peuvent également s’obtenir en<br />

calculant directement la déflexion d’un rayon lumineux et l’avance séculaire du périhélie par<br />

<strong>de</strong>s intégrations approchées <strong>de</strong>s équations <strong>de</strong>s géodésiques <strong>de</strong> la métrique <strong>de</strong> Schwarzschild. On<br />

verra que les calculs sont beaucoup plus simples avec la forme (10.36) que les calculs effectués<br />

au chapitre 9 avec la forme isotropique <strong>de</strong> la métrique.<br />

10.4 Géodésiques <strong>de</strong> la métrique <strong>de</strong> Schwarzschild<br />

La fonction <strong>de</strong> Lagrange L correspondant à la métrique (10.36) a pour expression<br />

<br />

2L = 1 − 2m<br />

<br />

( ˙x<br />

ρ<br />

0 ) 2 −<br />

˙ρ2<br />

1 − 2m<br />

ρ<br />

− ρ 2 ˙ θ 2 − ρ 2 sin 2 θ ˙ϕ 2 , (10.42)<br />

où on utilise la notation ˙x = dx/dλ, λ étant un paramètre affine arbitraire <strong>de</strong> la géodésique.<br />

L’intégrale première 2L = K = const. s’écrit alors<br />

<br />

1 − 2m<br />

<br />

( ˙x<br />

ρ<br />

0 ) 2 −<br />

˙ρ2<br />

1 − 2m<br />

ρ<br />

− ρ 2 ˙ θ 2 − ρ 2 sin 2 θ ˙ϕ 2 = K , (10.43)<br />

avec K > 0 pour une géodésique du genre temps, K = 0 pour une géodésique isotrope et K < 0<br />

pour une géodésique du genre espace.<br />

Du fait que L ne dépend explicitement ni <strong>de</strong> x 0 ni <strong>de</strong> ϕ, il existe <strong>de</strong>ux autres intégrales<br />

premières :<br />

<br />

∂L<br />

≡ 1 −<br />

∂ ˙x 0 2m<br />

<br />

˙x<br />

ρ<br />

0 = E , (10.44)<br />

∂L<br />

∂ ˙ϕ ≡ −ρ2 sin 2 θ ˙ϕ = −L, (10.45)<br />

118


où E et L sont <strong>de</strong>s constantes d’intégration. Notons que E correspond à l’intégrale <strong>de</strong> l’énergie<br />

conservée et que L correspond au moment cinétique conservé en mécanique newtonienne.<br />

Pour obtenir un système complet d’équations du mouvement, il suffit d’ajouter l’équation<br />

d’Euler-Lagrange pour la variable θ :<br />

d<br />

dλ (−ρ2 ˙ θ) + ρ 2 sin θ cos θ ˙ϕ 2 = 0. (10.46)<br />

On peut montrer que le mouvement s’effectue dans un plan fixe passant par l’origine O en<br />

raison <strong>de</strong> la symétrie sphérique. Il est alors possible <strong>de</strong> choisir les axes <strong>de</strong> telle sorte que la<br />

géodésique étudiée soit dans le plan équatorial d’équation<br />

θ = π<br />

. (10.47)<br />

2<br />

Avec ce choix, on a ˙ θ = 0 et les géodésiques sont alors déterminée par le système <strong>de</strong>s trois<br />

intégrales premières<br />

et<br />

<br />

1 − 2m<br />

<br />

0 2<br />

dx<br />

−<br />

ρ dλ<br />

1<br />

1 − 2m<br />

2 dρ<br />

− ρ<br />

dλ ρ<br />

2<br />

2 dϕ<br />

= K , (10.48)<br />

dλ<br />

<br />

1 − 2m<br />

<br />

0 dx<br />

= E , (10.49)<br />

ρ dλ<br />

ρ 2dϕ<br />

dλ<br />

= L. (10.50)<br />

De (10.49) et (10.50), on déduit respectivement<br />

dx 0<br />

dλ<br />

dϕ<br />

dλ<br />

= E<br />

1 − 2m<br />

ρ<br />

(10.51)<br />

L<br />

= . (10.52)<br />

ρ2 Substituons (10.51) et (10.52) dans (10.48), puis multiplions les <strong>de</strong>ux membres <strong>de</strong> l’équation<br />

. Il vient :<br />

obtenue par 1 − 2m<br />

r<br />

2 dρ<br />

= E<br />

dλ<br />

2 <br />

− 1 − 2m<br />

<br />

2 L<br />

+ K . (10.53)<br />

ρ ρ2 En éliminant dλ entre (10.51) et (10.53), on obtient<br />

<br />

dρ<br />

dx0 2 <br />

= 1 − 2m<br />

2 <br />

1 − 1 −<br />

ρ<br />

2m<br />

<br />

2 L<br />

ρ E2 Enfin, en éliminant dλ entre (10.52) et (10.53), il vient :<br />

1 K<br />

+<br />

ρ2 E2 <br />

(10.54)<br />

<br />

2 dϕ L<br />

ρ = 1 −<br />

dx0 E<br />

2m<br />

<br />

, (10.55)<br />

ρ<br />

119


équation qui est à comparer avec la loi <strong>de</strong>s aires en mécanique newtonienne.<br />

Les équations (10.53)-(10.55) déterminent entièrement les solutions comprises dans le plan<br />

θ = π/2. Ces trois équations sont du premier ordre à variables séparables. On peut donc<br />

exprimer leur solution générale par quadrature.<br />

On notera également que les équations (10.51), (10.52), (10.53) et dθ/dλ = 0 fournissent les<br />

composantes dx µ /dλ du vecteur tangent à la géodésique solution.<br />

Deux cas sont à distinguer.<br />

1. L = 0. Dans ce cas ˙ϕ = 0, ce qui entraîne ϕ = constante. La géodésique est dite radiale.<br />

Les équations (10.53) et (10.54) se réduisent alors au système<br />

2 dρ<br />

dλ<br />

= E 2 <br />

− K 1 − 2m<br />

<br />

,<br />

ρ<br />

(10.56)<br />

<br />

dρ<br />

dx0 2 =<br />

<br />

1 − 2m<br />

2 <br />

1 −<br />

ρ<br />

K<br />

E2 <br />

1 − 2m<br />

<br />

.<br />

ρ<br />

(10.57)<br />

Ces <strong>de</strong>ux équation du premier ordre à variables séparables permettent d’exprimer le paramètre<br />

affine λ et la coordonnée temporelle x 0 en termes <strong>de</strong> fonctions élémentaires <strong>de</strong> la<br />

variable radiale ρ.<br />

2. L = 0. Dans ce cas, on peut éliminer dλ entre (10.53) et (10.50), ce qui donne :<br />

2 dρ<br />

= ρ<br />

dϕ<br />

4<br />

<br />

2 E<br />

− 1 −<br />

L2 2m<br />

<br />

1 K<br />

+<br />

ρ ρ2 L2 <br />

. (10.58)<br />

Les équations (10.58), (10.54) et (10.55) déterminent complètement les géodésiques contenues<br />

dans le plan θ = π/2. Ces équations différentielles sont du premier ordre à variables<br />

séparables, tout comme dans le cas où L = 0. Toutefois, les intégrales obtenues par quadrature<br />

s’expriment maintenant en toute rigueur par <strong>de</strong>s fonctions elliptiques, plus compliquées à utiliser<br />

que les fonctions dites élémentaires. C’est pourquoi nous nous contenterons ici <strong>de</strong> solutions<br />

approchées qui ont été jusqu’ici suffisantes pour les vérifications expérimentales effectuées dans<br />

le système solaire.<br />

Pour étudier les courbes solutions, on utilisera 4<br />

u = m/ρ (10.59)<br />

comme fonction inconnue plutôt que ρ. En substituant ρ = m/u et dρ = −mu−2du dans (10.58),<br />

puis en multipliant les <strong>de</strong>ux membres par u4 , on obtient une équation qui peut s’écrire sous la<br />

forme : 2 du<br />

=<br />

dϕ<br />

m2 (E2 − K)<br />

L2 + 2Km2<br />

L2 u − u2 + 2u 3 . (10.60)<br />

Cette équation différentielle est elle aussi à variables séparables. En prenant la racine carrée<br />

<strong>de</strong> chaque membre <strong>de</strong> (10.60), on obtient l’équation<br />

dϕ = ±<br />

du<br />

<br />

m 2 E 2<br />

L 2 − (1 − 2u) <br />

u2 + K m2<br />

, (10.61)<br />

4 On ne confondra pas la fonction u ici définie avec la quantité u = m/r introduite dans la section 9.2.<br />

120<br />

L 2


qui permet d’exprimer ϕ en fonction <strong>de</strong> u par une quadrature.<br />

10.5 Déviation <strong>de</strong>s rayons lumineux<br />

On doit poser K = 0 dans le cas <strong>de</strong> la lumière. Pour les rayons lumineux non radiaux,<br />

l’équation (10.60) se réduit alors à<br />

2 du<br />

=<br />

dϕ<br />

m2E2 L2 − u2 + 2u 3 . (10.62)<br />

Considérons un rayon lumineux venant <strong>de</strong> l’infini, atteignant le point le plus proche <strong>de</strong><br />

l’origine (péricentre) lorsque ϕ = ϕp et repartant vers l’infini lorsque ϕ croît à partir <strong>de</strong> ϕp (cf.<br />

fig. 9.2, chap. 9). L’analyse du signe du trinôme du troisième <strong>de</strong>gré en u dans le second membre<br />

<strong>de</strong> (10.62) montre que cette configuration est réalisable lorsque ρp > 3m. Appelons ρp la valeur<br />

<strong>de</strong> ρ correspondant au péricentre et posons<br />

La fonction u atteint son maximum au péricentre. On a donc<br />

u = up =⇒<br />

Il en résulte que la constante m 2 E 2 /L 2 est donnée par<br />

m 2 E 2<br />

up = m<br />

. (10.63)<br />

ρp<br />

2 du<br />

= 0. (10.64)<br />

dϕ u=up<br />

L 2 = u2 p − 2u 3 p . (10.65)<br />

Dans le mouvement considéré, ρ est une fonction croissante <strong>de</strong> ϕ après le passage du rayon<br />

par le péricentre. On a alors du/dϕ < 0 sur cette partie <strong>de</strong> la trajectoire. L’intégration <strong>de</strong><br />

(10.52) par quadrature est immédiate. Compte tenu <strong>de</strong> (10.65), il vient :<br />

up<br />

ϕ(u) − ϕp =<br />

u<br />

du<br />

<br />

u2 p − u2 − 2u3 . (10.66)<br />

p + 2u3 Lorsque ρ → ∞, u → 0. L’angle ϕ tend alors vers la valeur ϕ∞ définie par l’intégrale :<br />

up<br />

ϕ∞ − ϕp =<br />

0<br />

du<br />

<br />

u2 p − u2 − 2u3 . (10.67)<br />

p + 2u3 La différence ϕ∞ − ϕp est l’angle que fait l’asymptote avec le rayon vecteur joignant le<br />

centre O au péricentre. Par raison <strong>de</strong> symétrie, l’angle total formé par les <strong>de</strong>ux asymptotes est<br />

2(ϕ∞ − ϕp). La déviation totale δ subie par le rayon lumineux entre −∞ et ∞ peut se définir<br />

comme la différence 2(ϕ∞ −ϕp)−π. Il en résulte que la déviation du rayon lumineux est donnée<br />

par<br />

up<br />

δ = 2(ϕ∞ − ϕp) − π = 2<br />

0<br />

121<br />

du<br />

<br />

u2 p − u2 − 2u3 − π . (10.68)<br />

p + 2u3


Cette formule est rigoureuse. Pour former un développement <strong>de</strong> δ en puissances entières <strong>de</strong><br />

up = m/ρp, notons que up est une racine du polynôme du troisième <strong>de</strong>gré en u sous le le radical<br />

puisqu’on a du/dϕ = 0 lorsque u = up. On voit aisément que<br />

u 2 p − u 2 − 2u 3 p + 2u 3 ≡ (up − u) <br />

up + u − 2(u 2 p + upu + u 2 ) <br />

Compte tenu <strong>de</strong> (10.69), l’expression (10.68) donnant δ s’écrit<br />

up<br />

δ = 2<br />

0<br />

Effectuons le changement <strong>de</strong> variable :<br />

Compte tenu <strong>de</strong>s égalités<br />

l’expression <strong>de</strong> δ <strong>de</strong>vient<br />

≡ (up − u) <br />

(1 − 2up)(up + u) − 2u 2<br />

. (10.69)<br />

du<br />

<br />

(up − u) [(1 − 2up)(up + u) − 2u 2 ]<br />

− π . (10.70)<br />

u = up cos 2ψ , 0 ≤ ψ ≤ π<br />

. (10.71)<br />

4<br />

up − u = 2up sin 2 ψ , up + u = 2up cos 2 ψ ,<br />

π<br />

δ = 4<br />

4<br />

0<br />

dψ<br />

<br />

1 − 2up cos 2ψ + 1<br />

2 cos−2 ψ − π . (10.72)<br />

A l’extérieur du Soleil, on a up ≤ 2, 13 × 10 −6 , la borne supérieure <strong>de</strong> cette inégalité correspondant<br />

à ρp = ρ⊙, ρ⊙ étant le rayon du Soleil en coordonnées (ρ,θ,ϕ). On se contentera ici<br />

<strong>de</strong> développer le terme sous le signe somme au premier ordre par rapport à up, ce qui donne<br />

soit tous calculs faits<br />

π <br />

4 δ = 4 1 + up cos 2ψ +<br />

0<br />

1<br />

2 cos−2 <br />

ψ + O(u 2 <br />

p) dψ − π (10.73)<br />

δ = 4up = 4GM<br />

c 2 ρp<br />

La déviation totale d’un rayon rasant la surface solaire vaut donc<br />

<br />

δ⊙ = 4GM⊙<br />

c 2 ρ⊙<br />

+ O<br />

G 2 M 2 ⊙<br />

c 4 ρ 2 ⊙<br />

+ O(u 2 p). (10.74)<br />

= 1, 75”. (10.75)<br />

Compte tenu <strong>de</strong> (10.38), l’équation (10.74) s’écrit en terme <strong>de</strong> coordonnée radiale isotrope<br />

δ = 4GM<br />

c 2 rp<br />

+ O(4). (10.76)<br />

En comparant l’expression (10.76) <strong>de</strong> la déviation avec la formule (9.65), on voit que la<br />

relativité générale prévoit<br />

γ = 1. (10.77)<br />

122


Valeur <strong>de</strong> δ au second ordre.— Le calcul <strong>de</strong> la déviation δ à l’approximation du second<br />

ordre est simple à partir <strong>de</strong> (10.72). On obtient :<br />

δ = 4GM<br />

c 2 ρp<br />

+<br />

15π<br />

16<br />

<br />

− 1<br />

2 2GM<br />

+ O<br />

c 2 ρp<br />

<br />

3 3 G M<br />

c 6 ρ 3 p<br />

. (10.78)<br />

Le terme du second ordre correspond à une déviation <strong>de</strong> l’ordre <strong>de</strong> 7 microsecon<strong>de</strong>s d’arc<br />

pour un rayon rasant le Soleil. Il faut toutefois noter que si la valeur totale <strong>de</strong> la déviation est<br />

inchangée par les transformations <strong>de</strong> coordonnées 5 , l’expression formelle du terme du second<br />

ordre est par contre très “sensible” au système <strong>de</strong> coordonnées utilisé car la valeur <strong>de</strong> la variable<br />

radiale correspondant au péricentre change lorsqu’on passe d’un système <strong>de</strong> coordonnées à<br />

l’autre. Ainsi, la déviation obtenue en intégrant les équations <strong>de</strong>s géodésiques isotropes <strong>de</strong> la<br />

métrique écrite sous la forme (10.39) est donnée par<br />

δ = 4GM<br />

c 2 rp<br />

+<br />

15π<br />

32<br />

<br />

− 1<br />

2 2GM<br />

+ O<br />

c 2 rp<br />

<br />

3 3 G M<br />

c 6 r 3 p<br />

. (10.79)<br />

On vérifie aisément l’équivalence <strong>de</strong>s relations (10.78) et (10.79) en écrivant que ρp et rp<br />

sont liés par l’équation (10.38).<br />

10.6 Avance séculaire du périhélie d’une planète<br />

Pour étudier le mouvement du périhélie d’une planète, on admet ici que la planète est<br />

assimilable à une particule d’épreuve, ce qui revient à négliger l’influence <strong>de</strong> sa structure interne<br />

sur son mouvement. En outre, on néglige l’influence <strong>de</strong>s autres planètes et on suppose que le<br />

Soleil est à symétrie sphérique.<br />

On peut toujours choisir les coordonnées <strong>de</strong> telle sorte que le mouvement <strong>de</strong> la planète<br />

soit situé dans le plan θ = π/2. L’orbite <strong>de</strong> la planète est alors solution <strong>de</strong> l’équation (10.60).<br />

Puisque la ligne d’univers <strong>de</strong> la planète est une géodésique du genre temps, on peut choisir<br />

l’abscisse curviligne s comme paramètre affine, ce qui entraîne<br />

<strong>de</strong> sorte que (10.60) s’écrit<br />

K = 1,<br />

2 du<br />

=<br />

dϕ<br />

m2 (E2 − 1)<br />

L2 + 2m2<br />

L2 u − u2 + 2u 3 . (10.80)<br />

Nous raisonnons sur la <strong>de</strong>mi-révolution comprise entre le passage au péricentre P1 <strong>de</strong> coordonnées<br />

polaires (ρp,ϕp) et le passage à l’apocentre A1 <strong>de</strong> coordonnées polaires (ρa,ϕa) (cf. fig.<br />

9.3, chap. 9). Le mouvement est supposé s’effectuer dans le sens direct. On pose :<br />

up = m<br />

, ua = m<br />

. (10.81)<br />

ρp<br />

5 l’angle <strong>de</strong> déviation entre −∞ et ∞ est en effet une gran<strong>de</strong>ur intrinsèque indépendante <strong>de</strong>s coordonnées<br />

utilisées pour repérer les événements.<br />

123<br />

ρa


Durant la <strong>de</strong>mi-pério<strong>de</strong> considérée, la fonction u(ϕ) est décroissante. On a donc pendant<br />

cette <strong>de</strong>mi-pério<strong>de</strong> :<br />

du<br />

dϕ = −<br />

. (10.82)<br />

m 2 (E 2 −1)<br />

L 2<br />

+ 2m2<br />

L 2 u − u 2 + 2u 3<br />

En conséquence, l’angle ϕa − ϕp balayé par le rayon vecteur est donné par l’intégrale<br />

ub<br />

ϕa − ϕp =<br />

ua<br />

m 2 (E 2 −1)<br />

L 2<br />

du<br />

+ 2m2<br />

L 2 u − u 2 + 2u 3<br />

. (10.83)<br />

Par raison <strong>de</strong> symétrie, l’angle balayé par le rayon vecteur entre <strong>de</strong>ux passages successifs par<br />

un péricentre (i.e. pendant une révolution complète) est égal à 2(ϕa − ϕp). Cet angle vaudrait<br />

2π en théorie newtonienne. L’avance relativiste ∆ϕp du péricentre par révolution est donc par<br />

définition<br />

∆ϕp = 2(ϕa − ϕp) − 2π . (10.84)<br />

Pour évaluer ϕa − ϕp, il faut factoriser le polynôme P(u) du troisième <strong>de</strong>gré en u figurant<br />

dans l’intégrale (10.83). Les quantités up et ua définies par (10.81) sont racines <strong>de</strong> ce polynôme<br />

puisqu’on doit avoir (du/dϕ) 2 p = (du/dϕ) 2 a = 0. En désignant par u3 la troisième racine <strong>de</strong> P(u),<br />

on peut donc écrire<br />

m 2 (E 2 − 1)<br />

L 2<br />

+ 2m2<br />

L 2 u − u2 + 2u 3 = 2(up − u)(u − ua)(u3 − u). (10.85)<br />

Développons le second membre <strong>de</strong> (10.83) et comparons avec le premier membre. Il vient :<br />

d’où après simplification par u 2<br />

2u 2 (up + ua + u3) = −u 2 .<br />

u3 = 1<br />

2 − (up + ua). (10.86)<br />

Substituons (10.86) dans (10.85). Il vient :<br />

m 2 (E 2 − 1)<br />

L 2<br />

+ 2m2<br />

L 2 u − u2 + 2u 3 = (up − u)(u − ua)[1 − 2(up + ua) − 2u]. (10.87)<br />

Compte tenu <strong>de</strong> (10.87) et <strong>de</strong> (10.83), l’expression (10.84) donnant l’avance du péricentre<br />

est<br />

ub<br />

du<br />

∆ϕp = 2 <br />

− 2π .<br />

ua (up − u)(u − ua)[1 − 2(up + ua) − 2u]<br />

(10.88)<br />

Cette formule est rigoureuse.<br />

À l’approximation 1PN, la formule (10.88) donne<br />

ub<br />

∆ϕp = 2<br />

ua<br />

1 + (up + ua) + u<br />

<br />

(up − u)(u − ua) du − 2π + O(m2 /r 2 p). (10.89)<br />

Le calcul <strong>de</strong>s intégrales figurant dans le second membre <strong>de</strong> (10.89) est élémentaire. On<br />

obtient :<br />

∆ϕp = 3π(up + ua) + O(m 2 /ρ 2 p). (10.90)<br />

124


Au cours du mouvement, la variable ρ va passer <strong>de</strong> sa valeur ρp au périhélie à sa valeur<br />

ρa à l’aphélie. On peut définir le <strong>de</strong>mi-grand axe a∗ et l’excentricité e∗ dans le système <strong>de</strong><br />

coordonnées (ρ,θ,ϕ) en posant :<br />

On a donc<br />

up + ua =<br />

ρp = a∗(1 − e∗), ρa = a∗(1 + e∗). (10.91)<br />

m<br />

a∗(1 − e∗) +<br />

m<br />

a∗(1 + e∗) =<br />

2m<br />

a∗(1 − e2 . (10.92)<br />

∗)<br />

En substituant (10.92) dans (10.90), on obtient l’expression suivante pour l’avance du<br />

péricentre par révolution<br />

∆ϕp = 6πGM<br />

c 2 a∗(1 − e 2 ∗) + O(m2 /a 2 ∗) rad/révolution. (10.93)<br />

D’après la formule <strong>de</strong> transformation (10.38), les valeurs <strong>de</strong> a∗ et e∗ coïnci<strong>de</strong>nt avec les<br />

valeurs <strong>de</strong> a et e définies par les équations (9.70) à <strong>de</strong>s termes d’ordre 1/c 2 près. En conséquence,<br />

la comparaison <strong>de</strong> l’expression <strong>de</strong> ∆ϕp donnée par (10.93) avec la formule (9.95) donne à<br />

nouveau<br />

β = 1 (10.94)<br />

lorsqu’on tient compte <strong>de</strong> γ = 1.<br />

10.7 Horizon et trou noir<br />

Effet Doppler gravitationnel.— Soit une source A au repos en un point <strong>de</strong> coordonnées<br />

(rA,θA,ϕA) émettant un signal périodique. Supposons que le signal émis par cette source soit<br />

reçu par un observateur B au repos en un point <strong>de</strong> coordonnées (rB,θB,ϕB). Un raisonnement<br />

analogue à celui que nous avons fait dans la section 7.4 montrerait que la fréquence νB du signal<br />

observé par B est reliée à la fréquence propre νA du signal émis par A selon la formule<br />

νB<br />

νA<br />

<br />

<br />

<br />

=<br />

(g00)A<br />

(g00)B<br />

(10.95)<br />

dans n’importe quel espace-temps statique. Dans l’espace-temps <strong>de</strong> Schwarzschild, on a g00 =<br />

1 − 2m/ρ, ce qui entraîne<br />

<br />

<br />

2m<br />

νB 1<br />

− ρA = <br />

νA 1 − 2m .<br />

ρB<br />

(10.96)<br />

On notera que les formules (10.95) et (10.96) sont rigoureuses sous les hypothèses faites. La<br />

relation (10.96) donne bien entendu en première approximation la formule (7.37), puisqu’on a<br />

évi<strong>de</strong>mment dans le cas <strong>de</strong> la symétrie sphérique<br />

<br />

<br />

2m<br />

1<br />

− ρA <br />

1 − 2m<br />

ρB<br />

<br />

1<br />

≈ 1 − m<br />

ρA<br />

U étant le potentiel newtonien du corps central.<br />

− 1<br />

<br />

≈ 1 −<br />

ρB<br />

UA − UB<br />

c2 ,<br />

125


Horizon. Trou noir.— Fixons ρB supposé > 2m dans la formule exacte (10.96). On voit<br />

que le rapport νB/νA tend vers 0 lorsque ρA → 2m. Ainsi, plus une source statique est située prés<br />

<strong>de</strong> l’hypersurface ρ = 2m, plus son spectre <strong>de</strong> fréquences est perçu comme décalé vers le rouge.<br />

Si ρA = 2m, le décalage spectral vers le rouge vu par n’importe quel observateur extérieur<br />

B est infini, ce qui revient à dire que la source A <strong>de</strong>vient inobservable. On appelle horizon<br />

toute hypersurface dont chaque point serait vu comme infiniment décalé vers le rouge par tout<br />

observateur extérieur. L’espace-temps <strong>de</strong> Schwarzschild admet donc l’hypersurface d’équation<br />

ρ = 2m comme horizon.<br />

Il résulte <strong>de</strong> qui vient d’être dit que les événements ayant lieu sur l’hypersurface ρ = 2m<br />

sont inobservables par <strong>de</strong>s observateurs <strong>de</strong> coordonnée radiale ρ > 2m (observateurs extérieurs).<br />

Cette conclusion est corroborée par l’analyse <strong>de</strong> la propagation d’un signal lumineux dans<br />

l’espace-temps <strong>de</strong> Schwarzshild. Pour simplifier, nous considérons uniquement le cas où le signal<br />

se propage radialement. On peut alors utiliser (10.57) avec K = 0, ce qui donne<br />

dx 0 = ± dρ<br />

1 − 2m<br />

ρ<br />

= ± ρdρ<br />

, (10.97)<br />

ρ − 2m<br />

le signe étant + si le rayon s’éloigne <strong>de</strong> l’origine (rayon “sortant”) et − si le rayon se rapproche<br />

du centre (rayon “entrant”). L’intégration <strong>de</strong> (10.97) est immédiate. Si le signal est au point<br />

<strong>de</strong> coordonnée radiale ρi à l’instant ti = x 0 i/c, l’équation horaire <strong>de</strong> son mouvement est<br />

si le rayon est sortant et<br />

x 0 − x 0 <br />

<br />

<br />

i = ρ − ρi + 2m ln <br />

<br />

x 0 − x 0 <br />

<br />

<br />

i = ρi − ρ − 2m ln <br />

<br />

<br />

ρ − 2m <br />

<br />

, (10.98)<br />

ρi − 2m<br />

<br />

ρ − 2m <br />

<br />

<br />

ρi − 2m<br />

(10.99)<br />

si le rayon est entrant.<br />

La formule (10.98) montre que x 0 − x 0 i → ∞ lorsque ρi → 2m. Un signal radial envoyé<br />

par une source ponctuelle située sur l’horizon atteindrait un observateur extérieur à l’instant<br />

t = x 0 /c = ∞. Autant dire qu’un tel signal ne peut atteindre aucun observateur extérieur.<br />

Il résulte <strong>de</strong> ce qui précè<strong>de</strong> qu’un objet à symétrie sphérique <strong>de</strong> masse M et <strong>de</strong> rayon<br />

ρg = 2m = 2GM/c 2 serait invisible pour tout observateur <strong>de</strong> coordonnée radiale ρ > 2m. C’est<br />

cette propriété qui est à l’origine <strong>de</strong> la notion <strong>de</strong> trou noir en relativité générale.<br />

Observateur en chute libre radiale.— L’existence d’un horizon ayant les propriétés ci<strong>de</strong>ssus<br />

est assez déroutante pour notre intuition courante relative au temps et à l’espace. Mais<br />

nous allons voir que nous ne sommes pas au bout <strong>de</strong> nos surprises en examinant maintenant le<br />

mouvement radial d’une particule d’épreuve matérielle accompagnée par une horloge standard<br />

comouvante. La ligne d’univers <strong>de</strong> cette particule est une géodésique radiale <strong>de</strong> genre temps.<br />

On peut poser K = 1 dans (10.56) et (10.57) à condition <strong>de</strong> choisir le paramètre affine λ <strong>de</strong><br />

telle sorte que dλ = ds. Les équations (10.56) et (10.57) s’écrivent alors sous la forme<br />

ds = ±<br />

ρdρ<br />

<br />

(E 2 − 1)ρ 2 + 2mρ<br />

126<br />

(10.100)


et<br />

dx 0 Eρ<br />

= ±<br />

2dρ <br />

(ρ − 2m)<br />

(E 2 − 1)ρ 2 + 2mρ<br />

. (10.101)<br />

On peut intégrer explicitement (10.100) et (10.101) pour une valeur arbitraire <strong>de</strong> E. Pour<br />

simplifier, nous allons nous contenter d’examiner le cas où E 2 = 1. La variable radiale peut<br />

aller jusqu’à l’infini, la quantité dρ/dx 0 tendant alors vers 0 d’après (10.101). On dit que<br />

le mouvement radial correspondant est parabolique. L’intégration <strong>de</strong> (10.101) donne avec <strong>de</strong>s<br />

notations déjà introduites pour les rayons lumineux<br />

x 0 − x 0 <br />

2<br />

i = ±<br />

3 √ 2m ρ3/2 + 1<br />

<br />

√ √<br />

√ ρ<br />

1/2 ρ + 2m<br />

<br />

2mρ − 2m ln <br />

2<br />

√<br />

√ <br />

ρ − 2m<br />

ρi<br />

, (10.102)<br />

le signe + <strong>de</strong>vant le crochet correspondant à une particule qui s’éloigne du centre (particule<br />

sortante) et le signe − à une particule qui se rapproche du centre (particule entrante). Pour<br />

une particule sortante, (10.102) montre que x 0 − x 0 i → ∞ si ρi → 2m. Ce comportement est<br />

analogue à ce que nous avions trouvé pour la lumière, ce qui n’est pas surprenant : un rayon<br />

lumineux est plus rapi<strong>de</strong> que toute particule douée <strong>de</strong> masse...<br />

La surprise se produit en revanche quand on intègre (10.100). On a pour E 2 = 1 :<br />

s − si = c(τ − τi) = ± 2<br />

3 √ <br />

2m<br />

ρ 3/2 − ρ 3/2<br />

i<br />

<br />

, (10.103)<br />

τ étant le temps propre <strong>de</strong> la particule.<br />

La formule (10.103) montre que le temps propre <strong>de</strong> la particule reste fini lorsque ρi → 2m.<br />

Cette propriété remarquable est en fait vraie pour toutes les particules matérielles en chute libre<br />

dans l’espace-temps <strong>de</strong> Schwarzschild, que ces particules aient un mouvement radial ou non,<br />

quelle que soit la valeur <strong>de</strong> la constante du mouvement E. En conséquence, pour un observateur<br />

tombant dans un trou noir <strong>de</strong> Schwarzschild, la traversée <strong>de</strong> l’horizon s’effectue à une date finie<br />

<strong>de</strong> son échelle <strong>de</strong> temps propre. On ne discutera pas ici du <strong>de</strong>stin ultérieur d’un observateur<br />

effectuant une telle traversée. On indiquera seulement que cette traversée sera sans retour vers<br />

l’univers extérieur...<br />

127


Annexe A<br />

Espaces affines. Espaces euclidiens<br />

Cette annexe est consacrée à quelques rappels concernant la notion d’espace ponctuel affine<br />

à n dimensions, qui constitue une extension naturelle <strong>de</strong> notre intuition <strong>de</strong> l’espace géométrique<br />

usuel.<br />

A.1 Espaces affines<br />

A.1.1 Définition d’un espace affine<br />

Les espaces <strong>de</strong> la géométrie ordinaire tels que la droite, le plan et l’espace usuel à trois<br />

dimensions ne sont pas donnés dans notre intuition comme <strong>de</strong>s espaces vectoriels, mais comme<br />

<strong>de</strong>s ensemble dont les éléments sont appelés <strong>de</strong>s points. Toutefois, on voit dès l’enseignement<br />

secondaire que ces ensembles sont structurés <strong>de</strong> telle sorte qu’à tout couple <strong>de</strong> points (A,B)<br />

on fasse correspondre un et un seul vecteur d’origine A et d’extrémité B, noté −→<br />

AB, la correspondance<br />

étant telle que soient satisfaites les relations vectorielles usuelles. Ces espaces sont<br />

appelés <strong>de</strong>s espaces affines (réels) <strong>de</strong> dimensions 1, 2 ou 3, selon les cas. En fait la notion<br />

d’espace affine1 est aisément généralisable en dimension n arbitraire, comme on va le voir avec<br />

les définitions qui suivent.<br />

Définition A.1.1 Soit En un espace vectoriel réel <strong>de</strong> dimension n. Un ensemble An est appelé<br />

un espace affine réel à n dimensions associé à l’espace vectoriel En si à tout couple (x,y)<br />

d’éléments <strong>de</strong> An on peut faire correspondre un et un seul vecteur <strong>de</strong> En noté −→ xy, la loi <strong>de</strong><br />

correspondance ayant les propriétés suivantes :<br />

a) −→ xy = − −→ yx;<br />

b) −→ xz = −→ xy + −→ yz (relation <strong>de</strong> Chasles);<br />

c) Pour tout o ∈ An et pour tout X ∈ En, il existe un et un seul élément x ∈ An tel que<br />

−→ox = X.<br />

1 Pour souligner que les éléments d’un espace affine sont <strong>de</strong>s points, la terminologie espace ponctuel affine est<br />

parfois utilisée.<br />

128


Les éléments <strong>de</strong> An sont appelés <strong>de</strong>s points. On omettra dorénavant l’épithète réel.<br />

Il résulte immédiatement <strong>de</strong> la propriété a) et <strong>de</strong>s propriétés élémentaires <strong>de</strong>s espaces vectoriels<br />

que −→ xx = 0 pour tout x ∈ An.<br />

Exemple d’espace affine réel.– Donnons-nous un espace vectoriel réel En <strong>de</strong> dimension n.<br />

L’ensemble IR n peut être muni d’une structure d’espace ponctuel affine associé à En, et ce d’une<br />

infinité <strong>de</strong> façons distinctes. Choisissons en effet une base arbitraire <strong>de</strong> En, que nous noterons ei.<br />

Étant donné <strong>de</strong>ux points <strong>de</strong> IR n , x = (x 1 ,x 2 ,....,x n ) et y = (y 1 ,y 2 ,....,y n ), posons en utilisant<br />

la convention d’Einstein<br />

−→xy = (y i − x i )ei. (A.1)<br />

On vérifie aisément que la correspondance (x,y) → −→ xy définie par (A.1) possè<strong>de</strong> les propriétés<br />

qui munissent IR n d’une structure d’espace ponctuel affine associé à En.<br />

En fait, on voit par la démonstration qui précè<strong>de</strong> qu’il existe sur IR n autant <strong>de</strong> structures<br />

d’espace ponctuel affine associé à un espace vectoriel donné En qu’il existe <strong>de</strong> bases distinctes<br />

<strong>de</strong> l’espace En. Mais ces structures sont toutes isomorphes et peuvent en conséquence être<br />

“i<strong>de</strong>ntifiées”. En outre tous les espaces vectoriels réels <strong>de</strong> dimension n sont isomorphes et<br />

peuvent s’i<strong>de</strong>ntifier à l’espace vectoriel usuel (IR n , +,.) ( 2 ). C’est pourquoi on peut par un<br />

léger abus <strong>de</strong> langage i<strong>de</strong>ntifier un espace ponctuel affine réel An défini in abstracto comme<br />

ci-<strong>de</strong>ssus avec l’espace IR n <strong>de</strong>s n-uplets <strong>de</strong> nombres réels associé à l’espace vectoriel (IR n , +,.)<br />

selon la loi <strong>de</strong> correspondance (8.15), où ei est la base canonique <strong>de</strong> (IR n , +,.) définie par<br />

e1 = (1, 0,..., 0),e2 = (1, 1,..., 0),...,en = (0, 0,..., 1).<br />

A.1.2 Repère d’un espace affine<br />

Définition A.1.2 Soit An un espace affine associé à un espace vectoriel En. Un repère affine<br />

(ou cartésien) <strong>de</strong> An est l’ensemble constitué par un point o <strong>de</strong> An et une base {e1,e2,...,en} =<br />

{ei} <strong>de</strong> l’espace vectoriel En. Un tel repère est noté (o, {e1,e2,...,en}) ou en abrégé (o, {ei}).<br />

Le point o est appelé l’origine du repère.<br />

Définition A.1.3 Soient (o, {ei}) un repère <strong>de</strong> l’espace affine An et x un point arbitraire <strong>de</strong><br />

An. On appelle coordonnées cartésiennes (ou affines) <strong>de</strong> x par rapport au repère (o, {ei}) les<br />

composantes x i du vecteur −→ ox par rapport à la base {ei}.<br />

Autrement dit, le n-uplet (x 1 ,x 2 ,...,x n ) constitue les coordonnées cartésiennes d’un point<br />

x par rapport au repère (o, {ei}) si et seulement si<br />

−→ox = x i ei. (A.2)<br />

Il résulte <strong>de</strong> la propriété c) dans la définition 1 que le n-uplet (x 1 ,x 2 ,...,x n ) constituant<br />

les coordonnées cartésiennes <strong>de</strong> x est unique et que réciproquement, la donnée d’un n-uplet<br />

2 On appelle ainsi l’ensemble IR n <strong>de</strong>s n-uplets <strong>de</strong> nombres réels x = (x 1 ,x 2 ,...,x n ) muni <strong>de</strong> la structure<br />

d’espace vectoriel obtenue en définissant la somme <strong>de</strong> <strong>de</strong>ux n-uplets x = (x 1 ,x 2 ,...,x n ) et y = (y 1 ,y 2 ,...,y n )<br />

par x + y = (x 1 + y 1 ,x 2 + y 2 ,...,x n + y n ) et la multiplication d’un n-uplet x par un scalaire réel λ en posant<br />

λ.x = (λx 1 ,λx 2 ,...,λx n ).<br />

129


(x 1 ,x 2 ,...,x n ) définit un et un seul point x <strong>de</strong> An. Un repère étant choisi, on peut donc “i<strong>de</strong>ntifier”<br />

un point et ses coordonnées cartésiennes comme on le fait d’habitu<strong>de</strong> en géométrie<br />

ordinaire. Pour abréger, nous désignerons par (x i ) le n-uplet (x 1 ,x 2 ,...,x n ) et nous poserons<br />

souvent x = (x i ).<br />

Considérons <strong>de</strong>ux points x et y <strong>de</strong> An, <strong>de</strong> coordonnées affines respectives x i et y i par rapport<br />

au repère (o, {ei}). Il vient en appliquant les propriétés a) et b) :<br />

−→xy = −→ xo + −→ oy = −→ oy − −→ ox.<br />

D’où, en tenant compte tenu <strong>de</strong> la définition <strong>de</strong>s coordonnées d’un point <strong>de</strong> An et en utilisant<br />

les règles <strong>de</strong> calcul sur les espaces vectoriels :<br />

−→xy = y i ei − x i ei = (y i − x i )ei. (A.3)<br />

Les composantes du vecteur −→ xy par rapport à la base ei sont donc les n quantités y i − x i .<br />

C’est pourquoi on note fréquemment y − x le vecteur −→ xy :<br />

Avec cette notation, la propriété a) s’écrit<br />

et la relation <strong>de</strong> Chasles b) <strong>de</strong>vient<br />

A.1.3 Changements <strong>de</strong> repères<br />

y − x = −→ xy . (A.4)<br />

y − x = −(x − y) (A.5)<br />

z − x = (z − y) + (y − x). (A.6)<br />

Cherchons les relations existant entre les coordonnées cartésiennes d’un point arbitraire x<br />

par rapport à <strong>de</strong>ux repères distincts (o, {ei}) et (o ′ , {ej ′}).<br />

Nous pouvons poser pour les <strong>de</strong>ux bases {ei} et {ej ′} :<br />

les coefficients Ai j ′ et Aj′ i étant reliés par les relations<br />

ei = A j′<br />

i ej ′, ej ′ = Ai j ′ei, (A.7)<br />

A j′<br />

i A k j ′ = δk i ⇐⇒ A i j ′Al′<br />

i = δ l′<br />

′. (A.8)<br />

Soient xi et xj′ les coordonnées respectives du point x par rapport aux repères (o, {ei}) et<br />

(o ′ , {ej ′}). On a<br />

−→<br />

o ′ x = x j′<br />

ej ′ . (A.9)<br />

Or, le premier membre <strong>de</strong> (A.9) peut s’écrire<br />

j<br />

−→<br />

o ′ x = −→ o ′ o + −→ ox . (A.10)<br />

130


On peut poser<br />

et exprimer −→ ox par rapport à la base {ej ′} :<br />

−→<br />

o ′ o = a j′<br />

ej ′ (A.11)<br />

−→ox = x i ei = x i A j′<br />

i ej ′ . (A.12)<br />

Substituons (A.11) et (A.12) dans (A.10) et i<strong>de</strong>ntifions le résultat obtenu avec le second<br />

membre <strong>de</strong> (A.9). Nous obtenons la formule <strong>de</strong> transformation <strong>de</strong> coordonnées cartésiennes :<br />

x j′<br />

= A j′<br />

i x i + a j′<br />

. (A.13)<br />

Il est bien entendu possible d’exprimer les coordonnées xi en fonction <strong>de</strong>s xj′ . Posons<br />

−→<br />

oo ′ = a i ei<br />

et échangeons le rôle joué par les <strong>de</strong>ux repères. Il vient :<br />

A.2 Espace euclidien<br />

A.2.1 Définition d’un espace euclidien<br />

(A.14)<br />

x i = A i j ′xj′ + a i . (A.15)<br />

Un espace vectoriel En est dit euclidien lorsqu’on a défini un produit scalaire g(X,Y ) <strong>de</strong><br />

<strong>de</strong>ux vecteurs arbitraires X et Y sur cet espace. Un tel espace est généralement noté (En,g).<br />

Nous sommes ainsi conduits à définir un espace euclidien comme suit.<br />

Définition A.2.1 On appelle espace euclidien <strong>de</strong> dimension n un espace affine An dont l’espace<br />

vectoriel associé En est muni d’un produit scalaire g. Cet espace ponctuel est noté (An,g).<br />

On notera qu’on <strong>de</strong>vrait en toute rigueur parler d’un espace affine euclidien, mais on abrège...<br />

Dans un espace euclidien (An,g), on peut définir ce que l’on appelle par abus <strong>de</strong> langage le<br />

carré d’une distance ou d’un intervalle sxy entre <strong>de</strong>ux points arbitraires x et y en posant<br />

s 2 xy = g( −→ xy, −→ xy) = g(y − x,y − x), (A.16)<br />

relation qu’on peut encore écrire en utilisant la notation g(X,Y ) = X.Y :<br />

s 2 xy = −→ xy. −→ xy = (y − x).(y − x) = (y − x) 2 . (A.17)<br />

Un repère (o, {ei}) quelconque étant choisi, soient x i et y i les coordonnées respectives <strong>de</strong> x<br />

et y. À condition <strong>de</strong> poser<br />

gij = g(ei,ej) = ei.ej,<br />

131


l’expression <strong>de</strong> l’intervalle (A.17) par rapport au repère (o, {ei}) est donnée par la formule<br />

fondamentale<br />

s 2 xy = gij(y i − x i )(y j − x j ). (A.18)<br />

Si y est infiniment proche <strong>de</strong> x, on peut poser y i = x i + dx i . Le “carré” <strong>de</strong> l’intervalle<br />

élémentaire entre les <strong>de</strong>ux points s’exprime alors par la forme quadratique <strong>de</strong> différentielles<br />

ds 2 = gijdx i dx j . (A.19)<br />

Le ds 2 (A.19) est appelée la métrique <strong>de</strong> l’espace euclidien (An,g).<br />

A.2.2 Espace euclidien rapporté à un repère orthonormé<br />

Un repère (o, {ei}) <strong>de</strong> l’espace euclidien (An,g) sera dit orthonormé (au sens du produit<br />

scalaire g) si la base {ei} est orthonormée au sens <strong>de</strong> g, i.e. si on a<br />

avec<br />

gij = ηij, (A.20)<br />

ηij = ǫi = ±1 si i = j, ηij = 0 si i = j. (A.21)<br />

On montre qu’il existe un entier p ≥ 0 dépendant uniquement du produit scalaire g tel<br />

qu’on ait dans tout repère orthonormé au sens <strong>de</strong> g) :<br />

1 ≤ i ≤ p =⇒ ǫi = 1, p + 1 ≤ i ≤ n =⇒ ǫi = −1. (A.22)<br />

Il en résulte que dans tout repère orthonormé, le carré <strong>de</strong> l’intervalle s 2 xy s’écrit sous la forme<br />

simple<br />

s 2 xy = ηij(y i − x i )(y j − x j )<br />

= (y 1 − x 1 ) 2 + ... + (y p − x p ) 2 − (y p+1 − x p+1 ) 2 − ... − (y n − x n ) 2<br />

expression qui <strong>de</strong>vient pour <strong>de</strong>s points x = (x i ) et y = (x i + dx i ) infiniment voisins<br />

ds 2 = ηijdx i dx j = (dx 1 ) 2 + ... + (dx p ) 2 − (dx p+1 ) 2 − ... − (dx n ) 2<br />

(A.23)<br />

(A.24)<br />

L’entier σ = 2p−n s’appelle la signature du produit scalaire g. Désormais, nous appellerons<br />

aussi σ la signature du carré <strong>de</strong> l’intervalle s 2 xy défini par (3.13) ou encore la signature <strong>de</strong> la<br />

métrique ds 2 définie par (3.41).<br />

Soulignons que dans tout système <strong>de</strong> coordonnées affines fixé, les gij sont <strong>de</strong>s quantités<br />

indépendantes <strong>de</strong>s x i , c’est-à-dire <strong>de</strong>s constantes.<br />

Deux types d’espace ponctuels euclidiens sont particulièrement importants en physique<br />

théorique : les espaces proprement euclidiens et les espaces lorentziens ou hyperboliques, qu’on<br />

appelle le plus souvent espaces-temps <strong>de</strong> Minkowski (<strong>de</strong> dimension n) (cf. sect. A.4, infra).<br />

132


A.3 Espace proprement euclidiens<br />

Si l’espace vectoriel euclidien (En,g) associé à An est proprement euclidien (i.e. si g(X,X)<br />

est ¿ 0 pour tout vecteur X <strong>de</strong> En non nul), l’espace (An,g) est également dit proprement<br />

euclidien. La quantité s 2 xy définie par (A.16) ou (3.13) est alors strictement positive si les points<br />

x et y sont distincts. La racine carrée <strong>de</strong> s 2 xy définit en conséquence une distance au sens usuel<br />

entre les points x et y.<br />

Dans n’importe quel repère orthonormé <strong>de</strong> l’espace (An,g), l’expression (A.23) s’écrit<br />

s 2 xy = (y 1 − x 1 ) 2 + (y 2 − x 2 ) 2 + ... + (y n − x n ) 2 . (A.25)<br />

Cette expression est l’extension à n dimensions du théorème <strong>de</strong> Pythagore qui fon<strong>de</strong> la<br />

géométrie métrique ordinaire en coordonnées cartésiennes orthonormées. Le carré <strong>de</strong> la distance<br />

entre <strong>de</strong>ux points infiniment voisins est alors donné par<br />

où les quantités δij sont définies par<br />

ds 2 = δijdx i dx j = (dx 1 ) 2 + (dx 2 ) 2 + ... + ((dx n ) 2 . (A.26)<br />

δij = 1 si i = j, δij = 0 si i = j. (A.27)<br />

A.4 Espace-temps <strong>de</strong> Minkowski <strong>de</strong> dimension n<br />

Définition A.4.1 On appelle espace-temps <strong>de</strong> Minkowski <strong>de</strong> dimension n un espace euclidien<br />

à n dimensions muni d’une métrique η <strong>de</strong> signature 2 − n. La métrique η est appelée métrique<br />

<strong>de</strong> Minkowski.<br />

Un tel espace peut être noté (Mn,η), ou simplement (IR n ,η), selon le léger abus <strong>de</strong> langage<br />

signalé dans la sous-section 1.1. Les points d’un espace-temps <strong>de</strong> Minkowski <strong>de</strong> dimension 4<br />

sont souvent appelés points-événements pour une raison évi<strong>de</strong>nte.<br />

Dans un repère orthonormé arbitraire <strong>de</strong> (Mn,η), le carré <strong>de</strong> l’intervalle entre <strong>de</strong>ux points<br />

arbitraires x et y s’exprime sous la forme<br />

s 2 xy = (y 0 − x 0 ) 2 − (y 1 − x 1 ) 2 − ... − (y n−1 − x n−1 ) 2<br />

(A.28)<br />

en raison <strong>de</strong> la signature 2 − n. Pour insister sur le fait que la combinaison (A.28) ne contient<br />

qu’un signe +, on numérote <strong>de</strong> 0 à n−1 les indices relatifs aux coordonnées et aux composantes<br />

<strong>de</strong> vecteurs ou <strong>de</strong> tenseurs (au lieu <strong>de</strong> 1 à n, comme on le fait dans les autres espaces). On note<br />

que le numéro 0 correspond à la coordonnée “temporelle” et que les coordonnées x 1 ,x 2 ,...,x n−1<br />

sont “spatiales”. La métrique <strong>de</strong> l’espace-temps <strong>de</strong> Minkowski (Mn,η) s’écrit alors sous la forme<br />

ds 2 = (dx 0 ) 2 − (dx 1 ) 2 − ... − (dx n−1 ) 2 . (A.29)<br />

De plus, nous nous conformerons à l’usage consistant à représenter les indices susceptibles <strong>de</strong><br />

varier <strong>de</strong> 0 à n −1 par <strong>de</strong>s lettres grecques minuscules telles que α,β,γ,δ,λ,µ,ν,ρ,σ, etc. Ainsi<br />

133


x α signifie que l’on doit considérer l’ensemble <strong>de</strong>s n coordonnées x 0 ,x 1 ,...,x n−1 . En revanche,<br />

les indices susceptibles <strong>de</strong> prendre les valeurs 1, 2,...,n − 1 seront représentés par <strong>de</strong>s lettres<br />

latines minuscules telles que i,j,k,l,m,n, etc.<br />

Avec ces conventions, le carré <strong>de</strong> l’intervalle entre <strong>de</strong>ux points arbitraires x et y s’écrit par<br />

rapport à un repère orthonormé quelconque sous la forme particulièrement con<strong>de</strong>nsée<br />

où les coefficients ηαβ sont donnés par<br />

s 2 xy = ηαβ(y α − x α )(y β − x β ), (A.30)<br />

η00 = 1, η0i = ηi0 = 0, ηij = −δij. (A.31)<br />

La métrique <strong>de</strong> Minkowski (A.29) se réduit alors à l’expression<br />

comme on l’a vu en cours.<br />

ds 2 = ηαβdx α dx β , (A.32)<br />

134


Annexe B<br />

Analyse tensorielle<br />

B.1 Caractère non intrinsèque <strong>de</strong> la dérivation partielle<br />

usuelle<br />

Donnons-nous un champ <strong>de</strong> vecteurs contravariants arbitraire V , défini sur une région <strong>de</strong> la<br />

variété V4 ou sur V4 toute entière. On vérifie sans peine que les quantités ∂V µ /∂x α ne sont pas<br />

les composantes d’un tenseur mixte une fois covariant et une fois contravariant. Effectuons en<br />

effet une transformation <strong>de</strong> coordonnées arbitraire xα → xβ′ . Du fait que les V µ se transforment<br />

selon la loi<br />

les quantités ∂V ν′ /∂xγ′ sont données par<br />

V ν′<br />

∂V ν′<br />

∂x γ′ = ∂xα<br />

∂x γ′<br />

= ∂xν′<br />

∂x µ V µ ,<br />

∂<br />

∂xα <br />

ν ∂x ′ <br />

µ<br />

V . (B.1)<br />

∂x µ<br />

D’où la formule <strong>de</strong> transformation <strong>de</strong>s dérivées partielles <strong>de</strong>s composantes <strong>de</strong> V<br />

∂V ν′<br />

∂xγ′ = ∂xα<br />

∂xγ′ ∂xν′ ∂x µ<br />

∂V µ ∂xα<br />

+<br />

∂xα ∂xγ′ ∂ 2 x ν′<br />

∂x α ∂x µ V µ , (B.2)<br />

Lorsqu’on les compare aux équations (32) du chapitre précé<strong>de</strong>nt, les équations (B.2) montrent<br />

que les quantités ∂V µ /∂xα ne se transforment pas en général comme les composantes d’un ten-<br />

ν1...νl<br />

seur mixte <strong>de</strong> type (1, 1). Plus généralement, si Tµ1...µk<br />

est un tenseur <strong>de</strong> type (k,l), les<br />

ν1...νl<br />

quantités ∂Tµ1...µk<br />

/∂xα ne définissent pas un champ <strong>de</strong> tenseurs <strong>de</strong> type (k + 1,l). Un<br />

constat <strong>de</strong> même nature vaut pour les dérivées partielles ordinaires d’ordre supérieur à un.<br />

Il résulte <strong>de</strong> ce qui vient dit qu’on ne peut généralement pas considérer comme exprimant<br />

une loi physique <strong>de</strong>s équations égalant une dérivée partielle ordinaire d’un tenseur avec un autre<br />

tenseur. Supposons par exemple qu’on veuille formuler une loi sous la forme<br />

∂E µν<br />

∂x µ = Jν , (B.3)<br />

où E µν est un champ <strong>de</strong> tenseurs <strong>de</strong>ux fois contravariants représentant un champ physique<br />

créé par une source décrite par un vecteur contravariant J ν . Il est clair d’après ce qui a été<br />

135


dit plus haut que si l’équation (B.3) était satisfaite dans un système <strong>de</strong> coordonnées locales x α<br />

donné, elle ne pourrait l’être en général dans un autre système <strong>de</strong> coordonnées puisque le second<br />

membre se transforme comme les composantes d’un vecteur contravariant alors que le premier<br />

membre se transforme selon la formule (B.2). C’est pourquoi on ne peut retenir <strong>de</strong>s équations du<br />

type (B.3). On résout cette difficulté en définissant une nouvelle opération <strong>de</strong> dérivation partielle<br />

par rapport à x α qui donne un tenseur p +1 fois covariant et q fois contravariant lorsqu’elle est<br />

appliquée à un tenseur p fois covariant et q fois contravariant. Une telle opération est appelée<br />

une dérivation partielle covariante.<br />

B.2 Dérivation covariante<br />

Introduisons d’abord une notation très commo<strong>de</strong>. Soit Φ une fonction différentiable <strong>de</strong>s<br />

coordonnées xα . On posera<br />

∂µΦ = ∂Φ<br />

(B.4)<br />

pour désigner la dérivée partielle usuelle <strong>de</strong> Φ par rapport à x µ , et plus généralement, si Φ<br />

admet <strong>de</strong>s <strong>de</strong>rivées partielles d’ordre k :<br />

∂µ1...∂µkΦ =<br />

∂x µ<br />

∂x<br />

∂ k Φ<br />

µ1...∂x µk<br />

. (B.5)<br />

Définition B.2.1 Une dérivation partielle covariante par rapport à xα est une opération sur<br />

les champs <strong>de</strong> tenseurs notée ∇α possédant les propriétés suivantes :<br />

1) A tout champ <strong>de</strong> tenseurs k fois covariants et l fois contravariants <strong>de</strong> composantes<br />

ν1...νl Tµ1...µk<br />

, ∇α fait correspondre un champ <strong>de</strong> tenseurs k + 1 fois covariants et l fois contra-<br />

ν1...νl<br />

variants dont les composantes sont notées ∇αTµ1...µk<br />

.<br />

2) Si T et U sont tous <strong>de</strong>ux <strong>de</strong>s champs <strong>de</strong> tenseurs <strong>de</strong> type (k,l),<br />

<br />

<br />

ν1...νl ν1...νl<br />

ν1...νl<br />

ν1...νl<br />

∇α T + U = ∇αT + ∇αUµ1...µk<br />

. (B.6)<br />

µ1...µk<br />

µ1...µk<br />

µ1...µk<br />

3) ∇α obéit à la règle <strong>de</strong> Leibniz, i.e. si T et U sont <strong>de</strong>s champs <strong>de</strong> tenseurs <strong>de</strong> types<br />

respectifs (k,l) et (r,s), alors<br />

<br />

<br />

ν1...νl σ1...σs<br />

∇α Tµ1...µk<br />

.Uρ1...ρr<br />

<br />

<br />

ν1...νl<br />

σ1...σs<br />

= T ∇αU + <br />

<br />

ν1...νl σ1...σs<br />

∇αT U . (B.7)<br />

µ1...µk<br />

ρ1...ρr<br />

µ1...µk<br />

4) Pour toute fonction différentiable f sur Vn, ∇α se réduit à la dérivée partielle ordinaire<br />

par rapport à x α :<br />

∇αf = ∂αf. (B.8)<br />

5) Pour un champ <strong>de</strong> vecteurs contravariants arbitraire V µ , ∇αV µ est un champ <strong>de</strong> tenseurs<br />

mixtes <strong>de</strong> type (1,1) <strong>de</strong> la forme<br />

ρ1...ρr<br />

∇αV µ = ∂αV µ + Γ µ<br />

αβ V β , (B.9)<br />

où les coefficients Γ µ<br />

αβ constituent un système <strong>de</strong> n3 quantités dépendant uniquement <strong>de</strong>s coordonnées<br />

locales.<br />

136


Notons que les propriétés 3) et 4) entraînent que ∇α est un opérateur linéaire. En effet, si T<br />

et U sont tous <strong>de</strong>ux <strong>de</strong>s tenseurs <strong>de</strong> type (k,l) et si λ et µ sont <strong>de</strong>s constantes, on a en raison<br />

<strong>de</strong> la règle <strong>de</strong> Leibniz et <strong>de</strong> ∇αλ = ∇αµ = 0 :<br />

<br />

<br />

ν1...νl<br />

ν1...νl<br />

ν1...νl<br />

ν1...νl<br />

∇α λ T + µ U = λ ∇αT + µ ∇αUµ1...µk<br />

. (B.10)<br />

µ1...µk<br />

µ1...µk<br />

µ1...µk<br />

B.3 Expression explicite <strong>de</strong> la dérivée covariante d’un<br />

champ <strong>de</strong> tenseurs arbitraire<br />

Les propriétés ci-<strong>de</strong>ssus suffisent pour donner l’expression explicite <strong>de</strong> la dérivée covariante<br />

<strong>de</strong> n’importe quel champ <strong>de</strong> tenseurs.<br />

Dérivée covariante d’un champ <strong>de</strong> vecteurs covariants.— Soit Wµ un champ <strong>de</strong><br />

vecteurs covariants. Si V µ est un champ <strong>de</strong> vecteurs contravariants arbitraire, on peut écrire<br />

en appliquant les règles 3) et 5) :<br />

∇α(V µ Wµ) = V µ ∇αWµ + (∇αV µ )Wµ = V µ ∇αWµ + Wµ(∂αV µ + Γ µ<br />

αβ V β ). (B.11)<br />

Mais l’expression contractée V µ Wµ est une fonction scalaire sur la variété V4. En conséquence,<br />

on peut écrire d’après la propriété 4) :<br />

∇α(V µ Wµ) = ∂α(V µ Wµ) = V µ ∂αWµ + Wµ∂αV µ . (B.12)<br />

En comparant les troisièmes membres <strong>de</strong> (B.11) et (B.12), on voit qu’on a<br />

V µ ∇αWµ = V µ (∂αWµ − Γ ρ αµWρ)<br />

pour tout champ <strong>de</strong> vecteurs V µ . Il en résulte immédiatement que ∇αWµ est donnée par la<br />

relation<br />

∇αWµ = ∂αWµ − Γ ρ αµWρ . (B.13)<br />

Dérivée covariante d’un champ <strong>de</strong> tenseurs d’ordre <strong>de</strong>ux.— Soit T µν un champ <strong>de</strong><br />

tenseurs <strong>de</strong>ux fois contravariants. La multiplication contractée <strong>de</strong> ce champ <strong>de</strong> tenseurs par un<br />

champ <strong>de</strong> vecteurs covariants Wµ arbitraire fournit un champ <strong>de</strong> vecteurs covariants T µν Wµ<br />

dont on sait maintenant former la dérivation covariante par rapport à x α . Un raisonnement en<br />

tout point analogue à celui que nous avons fait ci-<strong>de</strong>ssus nous conduit à l’expression suivante :<br />

∇αT µν = ∂αT µν + Γ µ<br />

αβ T βν + Γ ν αβT µβ . (B.14)<br />

De même, on trouve pour un champ <strong>de</strong> tenseurs <strong>de</strong>ux fois covariants Tµν :<br />

Enfin, pour un champ <strong>de</strong> tenseurs mixtes T ν<br />

µ :<br />

∇αTµν = ∂αTµν − Γ ρ αµTρν − Γ ρ ανTµρ. (B.15)<br />

∇αT ν<br />

µ = ∂αT ν<br />

µ + Γ ν αβT β<br />

µ − Γ ρ αµT ν<br />

ρ . (B.16)<br />

Plus généralement, on a le théorème fondamental qui suit.<br />

137


Théorème B.3.1 La dérivée covariante d’un champ <strong>de</strong> tenseurs k fois covariants et l fois<br />

contravariants T ν1ν2...νl arbitraire a pour expression en coordonnées locales :<br />

∇αT<br />

µ1µ2...µk<br />

ν1ν2...νl<br />

µ1µ2...µk<br />

+Γ ν1<br />

= ∂αT<br />

σν2...νl<br />

ασTµ1µ2...µk<br />

ν1ν2...νl<br />

µ1µ2...µk<br />

+ Γ ν2<br />

ν1σ...νl<br />

ασTµ1µ2...µk<br />

+ ... + Γ νl<br />

ν1ν2...σ<br />

ασTµ1µ2...µk<br />

−Γ ρ αµ1T ν1ν2...νl<br />

ρµ2...µk − Γ ρ αµ2T ν1ν2...νl<br />

µ1ρ...µk − ... − Γ ρ αµkT ν1ν2...νl<br />

µ1µ2...ρ . (B.17)<br />

On notera le signe + chaque fois que l’indice <strong>de</strong> contraction dans les composantes <strong>de</strong> T est<br />

contravariant et le signe − chaque fois que l’indice <strong>de</strong> contraction est covariant.<br />

Remarque.— Il faut impérativement gar<strong>de</strong>r l’ordre <strong>de</strong>s indices dans les formules explicitant<br />

les dérivées covariantes. Ainsi, on n’a pas le droit d’écrire<br />

∇αV µ = ∂αV µ + Γ µ<br />

βα V β ,<br />

hormis dans le cas où Γ µ<br />

αβ = Γµ βα (cas d’une connexion symétrique, voir ci-<strong>de</strong>ssous, sect. 3).<br />

Corollaire B.3.1 La dérivée covariante du champ <strong>de</strong> tenseurs <strong>de</strong> Kronecker δ ν µ est nulle :<br />

En effet, (B.16) et ∂αδ ν µ = 0 entraînent que<br />

∇αδ ν µ = 0. (B.18)<br />

∇αδ ν µ = Γ ν αβδ β<br />

µ − Γ ρ αµδ ν<br />

ρ = Γ ν αµ − Γ ν αµ = 0, CQFD.<br />

Il résulte du corollaire B.3.1 et <strong>de</strong> la règle <strong>de</strong> Leibniz que l’opérateur <strong>de</strong> dérivation covariante<br />

∇α est “perméable” pour le tenseur <strong>de</strong> Kronecker. Ainsi, on a par ex. pour tout tenseur<br />

ν1...νq Tµ1...µp<br />

:<br />

<br />

∇α δ σ <br />

ν1...νq<br />

ρ T = δ σ ν1...νq<br />

ρ ∇αTµ1...µp<br />

. (B.19)<br />

µ1...µp<br />

B.4 Connexion linéaire<br />

Définition B.4.1 L’ensemble <strong>de</strong>s n3 quantités Γ µ<br />

αβ entrant dans l’expression d’une dérivation<br />

covariante définit une connexion linéaire sur la variété différentielle V4.<br />

Se donner une loi <strong>de</strong> dérivation covariante sur une variété équivaut donc à se donner une<br />

connexion linéaire. Pour cette raison, on donne aux fonctions Γ µ<br />

αβ (xρ ) le nom <strong>de</strong> coefficients<br />

<strong>de</strong> la connexion linéaire dans le système <strong>de</strong> coordonnées locales xρ . Bien entendu, il ne faut<br />

jamais perdre <strong>de</strong> vue que ces coefficients sont liés à la dérivation covariante ∇α utilisée : une<br />

dérivation covariante ∇α différente <strong>de</strong> ∇α induit <strong>de</strong>s coefficients <strong>de</strong> connexion Γ µ<br />

αβ (xρ ) différents<br />

<strong>de</strong>s Γ µ<br />

αβ (xρ ).<br />

138


par changement <strong>de</strong> coordonnées locales.—<br />

Les quantités ∇αV µ doivent se transformer comme les composantes d’un tenseur mixte <strong>de</strong> type<br />

(1, 1) lorqu’on effectue la transformation <strong>de</strong> coordonnées locales xα → xβ′ . Cette condition<br />

détermine complètement la loi <strong>de</strong> transformation <strong>de</strong>s coefficients Γ µ<br />

αβ , qui est donnée par le<br />

théorème qui suit.<br />

Transformation <strong>de</strong>s coefficients Γ µ<br />

αβ<br />

Théorème B.4.1 Lors d’une transformation <strong>de</strong> coordonnées xα → xβ′ , les coefficients Γ µ<br />

αβ se<br />

transforment selon la loi<br />

Γ ν′<br />

γ ′ ∂xα<br />

ǫ ′ =<br />

∂xγ′ qui peut encore s’écrire sous la forme<br />

Γ ν′<br />

γ ′ ∂xα<br />

ǫ ′ =<br />

∂xγ′ ∂x β<br />

∂x ǫ′<br />

∂x β<br />

∂x ǫ′<br />

∂xν′ ∂xα<br />

Γµ<br />

∂x µ αβ −<br />

∂xγ′ ∂x β<br />

∂x ǫ′<br />

∂xν′ Γµ<br />

∂x µ αβ + ∂2xρ ∂xγ′ ∂xǫ′ ∂2xν′ ∂xα , (B.20)<br />

∂xβ ∂xν′ . (B.21)<br />

∂xρ En échangeant le rôle joué par les coordonnées locales xα et xγ′ , les formules (B.20) et (B.21)<br />

donnent évi<strong>de</strong>mment les formules <strong>de</strong> transformation<br />

et<br />

Γ µ ∂xγ′<br />

αβ =<br />

∂xα Γ µ ∂xγ′<br />

αβ =<br />

∂xα ∂x ǫ′<br />

∂x β<br />

∂x ǫ′<br />

∂x β<br />

∂x µ<br />

∂xν′ Γ ν′<br />

γ ′ ∂xγ′<br />

ǫ ′ −<br />

∂xα ∂x ǫ′<br />

∂x β<br />

∂x µ<br />

∂x ν′ Γ ν′<br />

γ ′ ǫ ′ + ∂2 x σ′<br />

∂x α ∂x β<br />

∂ 2 x µ<br />

∂x γ′ ∂x ǫ′<br />

(B.22)<br />

∂x µ<br />

∂x σ′ . (B.23)<br />

Démonstration.– La dérivation partielle covariante d’un vecteur contravariant <strong>de</strong>vant définir<br />

un tenseur mixte <strong>de</strong> type (1, 1), les coefficients Γ µ<br />

αβ doivent se transformer <strong>de</strong> telle sorte que les<br />

relations<br />

ν′<br />

∂γ ′V + Γ ν′<br />

γ ′ δ′<br />

δ ′V = ∂xα<br />

∂xγ′ ∂xν′ ∂x µ<br />

<br />

∂αV µ + Γ µ<br />

αβV β<br />

(B.24)<br />

soint satisfaites pour un vecteur V µ arbitraire. Substituons la loi <strong>de</strong> transformation (B.2) dans<br />

l’éq. (B.24). Il vient :<br />

∂x α<br />

∂x γ′<br />

∂x ν′<br />

∂x µ ∂αV µ + ∂xα<br />

∂x γ′<br />

= ∂xα<br />

∂x γ′<br />

∂ 2 x ν′<br />

∂xα∂x µ V µ + Γ ν′<br />

γ ′ δ′<br />

δ ′V<br />

∂xν′ ∂x µ ∂αV µ + ∂xα<br />

∂xγ′ ∂xν′ Γµ<br />

∂x µ αβV β ,<br />

soit après simplification et changement <strong>de</strong> certains indices muets<br />

Γ ν′<br />

γ ′ δ′<br />

δ ′V = ∂xα<br />

∂xγ′ ∂xν′ Γµ<br />

∂x µ αβV β − ∂xα<br />

∂xγ′ Substituons maintenant V δ′<br />

tisfaite pour tout vecteur V β , on a nécessairement<br />

∂ 2 x ν′<br />

∂x α ∂x β V β . (B.25)<br />

= ∂xδ′ /∂xβV β dans (B.25). L’égalité obtenue <strong>de</strong>vant être sa-<br />

∂xδ′ Γν′<br />

∂xβ γ ′ ∂xα<br />

δ ′ =<br />

∂xγ′ ∂xν′ ∂xα<br />

Γµ<br />

∂x µ αβ −<br />

∂xγ′ 139<br />

∂2xν′ ∂xα . (B.26)<br />

∂xβ


Effectuons la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (B.26) par ∂xβ /∂xǫ′ . Compte<br />

tenu <strong>de</strong>s formules (19) du chapitre précé<strong>de</strong>nt, on obtient la loi <strong>de</strong> transformation (B.20).<br />

On peut écrire (B.20) sous une forme légèrement différente. La relation<br />

donne en effet par différentiation :<br />

∂<br />

∂xα <br />

β ∂x<br />

∂xǫ′ ∂x β<br />

∂x ǫ′<br />

∂xν′ ∂xβ <br />

≡ ∂xβ<br />

∂xǫ′ ∂xν′ = δν′<br />

∂xβ ǫ ′<br />

∂ 2 x ν′<br />

∂x α ∂x β + ∂2 x β<br />

∂x α ∂x ǫ′<br />

d’où on déduit après multiplication contractée par ∂x α /∂x γ′<br />

∂x α<br />

∂x γ′<br />

∂x β<br />

∂x ǫ′<br />

∂2xν′ ∂xα ∂xα<br />

= −<br />

∂xβ ∂xγ′ ∂ 2 x β<br />

∂x α ∂x ǫ′<br />

∂xν′ = 0,<br />

∂xβ ∂x ν′<br />

∂x β = − ∂2 x ρ<br />

∂x γ′ ∂x ǫ′<br />

∂xν′ . (B.27)<br />

∂xρ Compte tenu <strong>de</strong> (B.27), la formule <strong>de</strong> transformation (B.20) prend la forme (B.21). C.Q.F.D.<br />

B.5 Conséquences fondamentales <strong>de</strong>s formules <strong>de</strong> transformation<br />

<strong>de</strong>s coefficients <strong>de</strong> connexion<br />

1) Les formules <strong>de</strong> transformation obtenues dans la section précé<strong>de</strong>nte montrent qu’il suffit<br />

<strong>de</strong> se donner n3 fonctions arbitraires Γ µ<br />

αβ (x) dans un système <strong>de</strong> coordonnées locales lui-même<br />

arbitrairement choisi pour définir une connexion sur V4. En effet, les lois <strong>de</strong> transformation (B.20<br />

ou (B.21) permettent le calcul explicite <strong>de</strong>s coefficients <strong>de</strong> la connexion dans <strong>de</strong>s coordonnées<br />

locales xβ′ si on connaît explicitement les xβ′ en fonction <strong>de</strong>s xα . De plus, nous n’avons trouvé<br />

aucune contrainte sur les fonctions Γ µ<br />

αβ (x) <strong>de</strong> départ. Il en résulte qu’il existe une infinité <strong>de</strong><br />

connexions distinctes sur une variété donnée.<br />

2) Les coefficients Γ µ<br />

αβ ne se transforment pas comme les composantes d’un tenseur une fois<br />

contravariant et <strong>de</strong>ux fois covariant lors d’une transformation générale <strong>de</strong> coordonnées locales.<br />

On notera toutefois que les relations (B.21)-(B.23) se réduisent aux règles <strong>de</strong> transformation<br />

tensorielles lorsque les coordonnées xγ′ sont <strong>de</strong>s fonctions affines <strong>de</strong>s xα , i.e. lorsque<br />

les quantités Aγ′ α et bγ′ équivalentes aux relations<br />

qui entraînent<br />

d’après (B.23).<br />

x γ′<br />

= A γ′<br />

α x α + b γ′<br />

, (B.28)<br />

étant <strong>de</strong>s constantes arbitraires. Les équations (B.28) sont en effet<br />

Γ µ ∂xγ′<br />

αβ =<br />

∂xα ∂2xσ′ ∂xα = 0<br />

∂xβ ∂x ǫ′<br />

∂x β<br />

140<br />

∂x µ<br />

∂x ν′ Γ ν′<br />

γ ′ ǫ ′


3) La différence <strong>de</strong>s coefficients <strong>de</strong> <strong>de</strong>ux connexions est toujours un tenseur une fois contravariant<br />

et <strong>de</strong>ux fois covariant. On formera donc n’importe quelle connexion sur V4 en ajoutant<br />

un tenseur une fois contravariant et <strong>de</strong>ux fois covariant arbitraire à une connexion elle-même<br />

arbitrairement choisie. On retrouve ainsi qu’il existe une infinité <strong>de</strong> connexions linéaires sur une<br />

variété.<br />

4) L’égalité Γ µ<br />

αβ<br />

= Γµ<br />

βα<br />

entraîne Γν′ γ ′ ǫ ′ = Γν′ ǫ ′ γ ′. On dit qu’une connexion linéaire possédant<br />

cette propriété est symétrique. On dit encore pour <strong>de</strong>s raisons que nous n’expliciterons pas ici<br />

que cette connexion est sans torsion (ou <strong>de</strong> torsion nulle). Cette propriété est importante car<br />

nous verrons que la connexion utilisée dans les théories métriques est un connexion symétrique<br />

particulière (connexion dite riemannienne, définie dans le chapitre suivant).<br />

Les connexions symétriques vérifient l’important théorème suivant.<br />

Théorème B.5.1 Soient Γ µ<br />

αβ les coefficients d’une connexion symétrique arbitraire et x0 un<br />

point arbitrairement fixé sur la variété. Il est toujours possible <strong>de</strong> choisir un système <strong>de</strong> coordonnées<br />

locales xβ′ <br />

au voisinage <strong>de</strong> x0 tel que tous les coefficients <strong>de</strong> la connexion<br />

symétrique considérée soient nuls au point x0.<br />

<br />

Γ ν′<br />

γ ′ ǫ ′<br />

Démonstration.— Soit xα un système <strong>de</strong> coordonnées locales arbitraire au voisinage du point<br />

x0. Dans ce système, les coefficients <strong>de</strong> la connexion symétrique Γ prennent les valeurs <br />

Γ µ<br />

<br />

αβ<br />

0<br />

au point x0 = (xα 0). Effectuons la transformation <strong>de</strong> coordonnées définie par<br />

En raison <strong>de</strong> la symétrie <strong>de</strong> <br />

Γ µ<br />

αβ<br />

d’où on déduit : ∂ 2 x ν ′<br />

En outre, on a d’après (B.30) :<br />

ce qui entraîne <br />

α ∂x<br />

<br />

Γ µ<br />

<br />

αβ (x<br />

x0<br />

α′<br />

− x α )(x β′<br />

− x β ). (B.29)<br />

x µ′<br />

= x µ + 1<br />

2<br />

<br />

par rapport à α et β, on a :<br />

∂x γ′<br />

0<br />

∂xν′ ∂xβ = δν β + <br />

Γ ν<br />

<br />

λβ (x<br />

x0<br />

λ − x λ 0), (B.30)<br />

x0<br />

∂x α ∂x β<br />

<br />

x0<br />

<br />

µ ∂x ′ <br />

∂x ρ<br />

= δ α γ ′ ,<br />

x0<br />

= <br />

Γ ν<br />

<br />

αβ<br />

x0<br />

x0<br />

. (B.31)<br />

= δ µ ρ , (B.32)<br />

<br />

β ∂x<br />

∂x ǫ′<br />

x0<br />

= δ β<br />

ǫ ′ . (B.33)<br />

Substituons (B.31) et (B.33) dans la loi <strong>de</strong> transformation (B.20) écrite en x0 pour la<br />

connexion Γ. Il vient<br />

<br />

Γ ν′<br />

γ ′ ǫ ′<br />

<br />

= δ<br />

x0<br />

α γ δ β ǫ δ ν µ<br />

<br />

Γ µ<br />

<br />

αβ − δ<br />

x0<br />

α γ δ β ǫ<br />

141<br />

<br />

Γ ν<br />

<br />

αβ = 0, (B.34)<br />

x0


ce qui achève la démonstration.<br />

On notera que la transformation <strong>de</strong> coordonnées (B.29) ne change pas la valeur numérique<br />

<strong>de</strong>s composantes <strong>de</strong>s tenseurs au point x0 puisque les coefficients <strong>de</strong> transformation en ce point<br />

sont donnés par les éléments <strong>de</strong> matrice (B.32) et (B.33). On remarquera également que l’on a<br />

xα′ 0 = xα 0.<br />

La dérivée covariante partielle <strong>de</strong>s tenseurs en x0 associée à la connexion Γ possè<strong>de</strong> une<br />

expression particulièrement simple dans le système <strong>de</strong> coordonnées locales x µ′ défini par (B.29).<br />

Compte tenu <strong>de</strong> (B.34), il vient en effet pour un tenseur <strong>de</strong>ux fois contravariant par exemple<br />

<br />

∇α ′T µ′ ν ′<br />

x0<br />

= <br />

∂α ′T µ′ ν ′<br />

x0<br />

. (B.35)<br />

L’égalité <strong>de</strong> la dérivation covariante avec la dérivation partielle usuelle est très utile pour<br />

démontrer certaines i<strong>de</strong>ntités tensorielles. Toutefois, on se gar<strong>de</strong>ra bien entendu d’écrire que les<br />

équations (B.35) sont vraies dans un système <strong>de</strong> coordonnées locales arbitraire !<br />

B.6 Dérivée covariante totale le long d’une courbe<br />

Dans <strong>de</strong> nombreuses applications physiques (dynamique <strong>de</strong>s particules, mécanique <strong>de</strong> flui<strong>de</strong>s,<br />

relativité, ...), on a besoin <strong>de</strong> la dérivée totale d’un champ <strong>de</strong> vecteurs ou <strong>de</strong> tenseurs le long<br />

d’une courbe paramétrée. L’exemple le plus simple est le vecteur accélération d’une particule<br />

qu’on définit comme la dérivée covariante totale du vecteur vitesse le long <strong>de</strong> la ligne d’univers<br />

<strong>de</strong> la particule paramétrée par le temps propre.<br />

La dérivée totale doit être caractérisée d’une manière intrinsèque. C’est pourquoi on adopte<br />

la définition suivante, qui généralise la dérivée totale usuelle d’une fonction le long d’une courbe.<br />

Définition B.6.1 Soit C une courbe différentiable λ → C(λ) d’équations paramétriques<br />

x α = x α (λ). (B.36)<br />

Soit ˙x α = dxα /dλ le vecteur tangent à la courbe C. On appelle dérivée covariante totale d’un<br />

champ <strong>de</strong> tenseurs T <strong>de</strong> type (k,l) le long <strong>de</strong> C le tenseur <strong>de</strong> type (k,l) noté ∇<br />

dλ T ν1ν2...νl<br />

µ1µ2...µk<br />

et défini en chaque point x(λ) <strong>de</strong> C par les équations<br />

∇<br />

dλ T<br />

ν1ν2...νl<br />

µ1µ2...µk<br />

= ˙x α ν1ν2...νl<br />

∇αTµ1µ2...µk<br />

. (B.37)<br />

ν1ν2...νl<br />

Les quantités ∇αTµ1µ2...µk<br />

sont données par le second membre <strong>de</strong> la formule (B.17).<br />

Les composantes du champ <strong>de</strong> tenseurs T sur la courbe C peuvent être considérées comme<br />

<strong>de</strong>s fonctions du paramètre λ que l’on supposera toujours différentiables. On peut alors poser<br />

˙x α ∂αT<br />

ν1ν2...νl<br />

µ1µ2...µk<br />

= d<br />

dλ T<br />

ν1ν2...νl<br />

µ1µ2...µk , (B.38)<br />

la dérivée totale figurant dans le second membre étant prise le long <strong>de</strong> la courbe C. Il écoule<br />

alors <strong>de</strong> (B.38) et <strong>de</strong> (B.17) que si <strong>de</strong>ux champs <strong>de</strong> tenseurs du même type T et U coïnci<strong>de</strong>nt<br />

sur la courbe C, alors<br />

∇<br />

dλ T<br />

ν1ν2...νs<br />

µ1µ2...µr = ∇<br />

dλ U<br />

ν1ν2...νs<br />

µ1µ2...µr<br />

(B.39)<br />

142


en tout point <strong>de</strong> C. En d’autres termes, la dérivée covariante totale d’un champ <strong>de</strong> tenseurs T<br />

le long d’une courbe C ne dépend que <strong>de</strong>s valeurs <strong>de</strong> T sur la courbe C.<br />

Il résulte <strong>de</strong> (B.38) qu’on peut définir la dérivée covariante totale d’un tenseur qui est<br />

donné seulement sur une courbe paramétrée. Ainsi, par exemple, S µν étant un tenseur <strong>de</strong>ux fois<br />

contravariant défini en chaque point <strong>de</strong> C, on pose<br />

∇S µν<br />

dλ<br />

= dSµν<br />

dλ<br />

Pour un champ <strong>de</strong> vecteurs contravariants, on a simplement :<br />

relation que l’on peut encore écrire sous la forme :<br />

+ <br />

Γ µ<br />

αβ Sβν + Γ ν αβS µβ<br />

˙x α . (B.40)<br />

∇V µ<br />

dλ ≡ ˙xα ∇αV µ = ˙x α ∂αV µ + Γ µ<br />

αβ ˙xα V β , (B.41)<br />

∇V µ<br />

dλ<br />

= dV µ<br />

dλ<br />

+ Γµ<br />

αβ ˙xα V β . (B.42)<br />

La relation (B.42) fournit également la dérivée covariante totale d’un vecteur contravariant<br />

V que l’on a seulement défini sur C.<br />

Pour un champ <strong>de</strong> vecteurs covariants φ :<br />

∇φµ<br />

dλ ≡ ˙xα ∇αφµ = ˙x α ∂αφµ − Γ ρ αµ ˙x α φρ, (B.43)<br />

soit encore<br />

∇φµ dφµ<br />

=<br />

dλ dλ − Γραµ ˙x α φρ. (B.44)<br />

Cette <strong>de</strong>rnière relation donne aussi la dérivée covariante totale d’un vecteur covariant seulement<br />

défini sur C.<br />

B.7 Transport par parallélisme le long d’une courbe<br />

La notion <strong>de</strong> dérivée covariante totale d’un tenseur permet <strong>de</strong> définir le transport par parallélisme<br />

d’un champ <strong>de</strong> tenseurs le long d’une courbe. Nous allons nous restreindre au cas <strong>de</strong>s<br />

champs <strong>de</strong> vecteurs, le plus souvent rencontré.<br />

Cas <strong>de</strong>s vecteurs contravariants.— Pour les vecteurs contravariants, la définition du<br />

transport par parallélisme s’énonce comme suit.<br />

Définition B.7.1 Un champ <strong>de</strong> vecteurs contravariants V est dit transporté par parallélisme<br />

le long <strong>de</strong> la courbe C si sa dérivée covariante totale le long <strong>de</strong> C est nulle, i.e. si<br />

en chaque point <strong>de</strong> C.<br />

∇V µ<br />

dλ ≡ ˙xα ∇αV µ = 0 (B.45)<br />

143


D’après ce que nous avons vu dans la section 4, la condition <strong>de</strong> transport par parallélisme<br />

d’un vecteur contravariant V le long <strong>de</strong> la courbe C s’exprime par le système d’équations<br />

différentielles suivant :<br />

dV µ<br />

dλ<br />

+ Γµ<br />

αβ ˙xα V β = 0. (B.46)<br />

Cas <strong>de</strong>s vecteurs covariants.– La transposition aux vecteurs covariants est immédiate.<br />

Définition B.7.2 Un champ <strong>de</strong> vecteurs covariants φ est dit transporté par parallélisme le long<br />

<strong>de</strong> la courbe C si sa dérivée covariante totale le long <strong>de</strong> C est nulle, i.e. si<br />

en chaque point <strong>de</strong> C.<br />

∇φµ<br />

dλ ≡ ˙xα ∇αVµ = 0 (B.47)<br />

La condition <strong>de</strong> transport par parallélisme d’un vecteur covariant φ le long <strong>de</strong> C est donc<br />

donnée par le système d’équations différentielles<br />

que l’on comparera au système (B.46).<br />

dφµ<br />

dλ − Γρ αµ ˙x α φρ = 0, (B.48)<br />

B.8 Courbes autoparallèles d’une connexion<br />

La notion <strong>de</strong> tranport par parallélisme permet d’associer à chaque connexion une famille <strong>de</strong><br />

courbes appelées courbes autoparallèles, qui constituent la généralisation <strong>de</strong> la ligne droite <strong>de</strong> la<br />

géométrie affine usuelle. De ce fait, elles sont les candidates les plus naturelles pour s’i<strong>de</strong>ntifier<br />

aux lignes d’univers <strong>de</strong>s particules en chute libre dans un champ <strong>de</strong> gravitation.<br />

Définition B.8.1 Une courbe C : λ → C(λ) est dite autoparallèle si son vecteur tangent<br />

˙x α = dx α /dλ est tranporté par parallélisme le long d’elle-même, i.e. si les fonctions x α (λ)<br />

sont solution <strong>de</strong>s équations différentielles<br />

∇ ˙x µ<br />

dλ ≡ d2x µ dx<br />

+ Γµ<br />

dλ2 αβ<br />

α dx<br />

dλ<br />

β<br />

dλ<br />

= 0. (B.49)<br />

On voit immédiatement sur les éqs. (B.49) que les courbes autoparallèles sont déterminées<br />

uniquement par la partie symétrique <strong>de</strong> la connexion définie par<br />

puisqu’on a <strong>de</strong> manière évi<strong>de</strong>nte<br />

Γ µ<br />

αβ = 1 <br />

Γ<br />

2<br />

µ<br />

<br />

αβ + Γµ βα<br />

Γ µ<br />

αβ ˙xα ˙x β ≡ Γ µ<br />

αβ ˙x α ˙x β .<br />

Il s’ensuit immédiatement le théorème suivant.<br />

144<br />

(B.50)


Théorème B.8.1 Deux connexions linéaires ayant la même partie symétrique ont <strong>de</strong>s courbes<br />

autoparallèles i<strong>de</strong>ntiques.<br />

Il est équivalent <strong>de</strong> dire que les courbes autoparallèles d’une connexion sont déterminées uniquement<br />

par la partie symétrique <strong>de</strong> cette connexion (ou encore que la torsion d’une connexion<br />

n’a aucun influence sur ses courbes autoparallèles). Cette propriété joue un rôle fondamental<br />

dans le choix <strong>de</strong> connexion que l’on fait habituellement pour décrire l’influence <strong>de</strong> la gravitation<br />

sur une particule en chute libre.<br />

145


Annexe C<br />

Connexion et courbure sur une variété<br />

riemannienne<br />

Dans le chapitre précé<strong>de</strong>nt, nous avons exposé les bases <strong>de</strong> l’analyse tensorielle sur une<br />

variété V4 sans faire intervenir la notion <strong>de</strong> métrique qui avait été introduite dans le premier<br />

chapitre. Ici au contraire, nous supposons <strong>de</strong> façon essentielle que V4 est une variété munie<br />

d’une métrique g. On se souvient que le doublet (V4,g) est appelé une variété riemannienne.<br />

L’importance <strong>de</strong> ces espaces est primordiale en physique puisque les espaces-temps utilisés en<br />

relativité sont <strong>de</strong>s variétés riemanniennes particulières, dites lorentziennes.<br />

C.1 Connexion riemannienne<br />

Nous allons tout d’abord énoncer et démontrer le théorème d’existence et d’unicité qui<br />

“légitime” en quelque sorte les théories métriques <strong>de</strong> la gravitation.<br />

Théorème C.1.1 Sur une variété riemannienne (V4,g), il existe une et une seule connexion<br />

linéaire qui soit symétrique et qui préserve la valeur du produit scalaire <strong>de</strong> <strong>de</strong>ux vecteurs V et<br />

W transportés par parallélisme le long d’une courbe différentiable arbitraire. Les coefficients <strong>de</strong><br />

cette connexion s’écrivent en coordonnées locales<br />

où les quantités { ρ µν} sont définies par :<br />

Γ ρ µν = { ρ µν}, (C.1)<br />

{ ρ µν} = 1<br />

2 gρσ (∂µgνσ + ∂νgσµ − ∂σgµν). (C.2)<br />

La connexion déterminée par (C.1) et (C.2) s’appelle la connexion riemannienne <strong>de</strong> l’espacetemps<br />

(V4,g).<br />

Démonstration.— Supposons qu’une connexion Γ soit symétrique et vérifie la condition1 ∀V µ ∀W ν<br />

∇V µ<br />

ν <br />

∇W<br />

= 0 et = 0 =⇒<br />

dλ dλ d<br />

dλ (gµνV µ W ν <br />

) = 0 (C.3)<br />

1 Une connexion qui possè<strong>de</strong> la propriété (C.3) est appelée une connexion métrique. La connexion riemannienne<br />

est donc l’unique connexion qui soit à la fois métrique et symétrique.<br />

146


le long <strong>de</strong> n’importe quelle courbe C définie par les équations paramétriques<br />

x α = x α (λ) (C.4)<br />

en coordonnées locales xρ . Du fait que gµνV µ W ν est une quantité scalaire, sa dérivée totale<br />

usuelle peut être remplacée par sa dérivée covariante totale. Il vient donc en tenant compte <strong>de</strong><br />

(C.3) :<br />

d<br />

dλ (gµνV µ W ν ) = ∇<br />

dλ (gµνV µ W ν ) = ˙x λ ∇λgµνV µ W ν = 0. (C.5)<br />

L’équation (C.5) <strong>de</strong>vant être vali<strong>de</strong> quels que soient ˙x λ , V µ et W ν , il faut que les équations<br />

soient satisfaites en tout point. On a donc nécessairement<br />

∇λgµν = 0 (C.6)<br />

∇λgµν − ∇µgνλ − ∇νgλµ = 0. (C.7)<br />

Explicitons les relations (C.7) en utilisant l’équation (15) du chapitre II. Il vient, en tenant<br />

compte <strong>de</strong>s symétries <strong>de</strong> gµν et <strong>de</strong> Γ σ µν par rapport aux indices µ et ν :<br />

∇λgµν − ∇µgνλ − ∇νgλµ = ∂λgµν − Γ σ λµgσν − Γ σ λνgµσ − ∂µgνλ + Γ σ µνgσλ + Γ σ µλgνσ<br />

La <strong>de</strong>rnière ligne <strong>de</strong> (C.8) s’écrit encore<br />

−∂ν + Γ σ νλgσµ + Γ σ νµgλσ<br />

= 2Γ σ µνgλσ + ∂λgµν − ∂µgνλ − ∂νgλµ = 0. (C.8)<br />

Γ σ µνgλσ = 1<br />

2 (∂µgνλ + ∂νgλµ − ∂λgµν) . (C.9)<br />

La multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (C.9) par g λρ donne finalement, compte<br />

tenu <strong>de</strong> g λρ gλσ = δ ρ σ :<br />

Γ ρ µν = 1<br />

2 gρσ (∂µgνσ + ∂νgσµ − ∂σgµν) ≡ { ρ µν}. (C.10)<br />

Nous venons <strong>de</strong> démontrer l’unicité <strong>de</strong> la connexion riemannienne. Réciproquement, il est<br />

aisé <strong>de</strong> vérifier que la connexion définie par (C.10) vérifie (C.6). En utilisant l’équation (C.10)<br />

et la formule (15) du chapitre II, on obtient en effet les i<strong>de</strong>ntités :<br />

ce qui achève la démonstration.<br />

∂λgµν − { ρ<br />

λµ }gρν − { ρ<br />

λν }gµρ ≡ 0, (C.11)<br />

Les quantités { ρ µν} sont les symboles <strong>de</strong> Christoffel <strong>de</strong> <strong>de</strong>uxième espèce associés à la métrique<br />

g. C’est cette connexion qui est utilisée dans les théories métriques. Désormais, nous utiliserons<br />

seulement la connexion riemannienne et nous la désignerons indistinctement soit par Γ ρ µν soit<br />

par { ρ µν}.<br />

147


Théorème C.1.2 La dérivée covariante ∇λ associée à la connexion riemannienne sur (V4,g)<br />

est telle que<br />

∇λgµν = 0 (C.12)<br />

et<br />

en tout point x ∈ V4.<br />

∇λg ρσ = 0 (C.13)<br />

Démonstration.— Nous avons déjà montré l’équation (C.12) en établissant le théorème 1.<br />

Cette équation est souvent appelé le théorème <strong>de</strong> Ricci. Pour démontrer l’équation (C.13),<br />

appliquons la dérivation covariante riemannienne au produit contracté gµνg ρµ . En utilisant<br />

l’équation (62) du chapitre I et l’équation (18) du chapitre II, on obtient<br />

∇λ (gµνg ρµ ) = ∇λδ ρ ν = 0.<br />

D’où en utilisant la règle <strong>de</strong> Leibniz qui est satisfaite par toute dérivation covariante :<br />

Or, ∇λgµν = 0. On a donc<br />

∇λgµνg ρµ + gµν∇λg ρµ = 0.<br />

Effectuons le produit contracté <strong>de</strong> (C.14) par g νσ . Il vient :<br />

C.Q.F.D.<br />

gµν∇λg ρµ = 0. (C.14)<br />

g νσ gµν∇λg ρµ = δ σ µ∇λg ρµ = ∇λg ρσ = 0<br />

Enfin, nous citerons <strong>de</strong>ux autres propriétés importantes que possè<strong>de</strong> la connexion riemannienne<br />

:<br />

Propriété 1.— Un vecteur V subissant un transport parallèle défini par la connexion riemannienne<br />

gar<strong>de</strong> une norme constante.<br />

Propriété 2.— Le transport parallèle défini par la connexion riemannienne conserve la<br />

valeur <strong>de</strong> l’angle formé par <strong>de</strong>ux vecteurs. En particulier, <strong>de</strong>ux vecteurs V et W initialement<br />

orthogonaux restent orthogonaux lors d’un transport par parallélisme.<br />

Ces propriétés découlent immédiatement du théorème 1. Elles sont d’un grand intérêt en<br />

physique théorique. Il résulte en effet <strong>de</strong> la propriété 1 qu’une connexion métrique permet<br />

<strong>de</strong> comparer <strong>de</strong>s étalons <strong>de</strong> longueur situés en <strong>de</strong>s points voisins. La propriété 2 permet <strong>de</strong><br />

réaliser en chaque point x d’une courbe C un repère orthonormé simplement en transportant<br />

par parallélisme un repère orthonormé construit en un point fixé <strong>de</strong> C.<br />

148


C.2 Géodésiques d’une variété riemannienne<br />

Définition C.2.1 Soit (V4,g) une variété riemannienne <strong>de</strong> dimension 4. Étant donnés <strong>de</strong>ux<br />

points x1 et x2 <strong>de</strong> V4, on appelle arc géodésique joignant x1 et x2 tout arc <strong>de</strong> courbe différentiable<br />

Γ12 d’équations paramétriques xα = xα (λ) satisfaisant aux conditions :<br />

où ˙x µ est défini par<br />

λ2<br />

δ gµν(x<br />

λ1<br />

α (λ)) ˙x µ ˙x ν dλ = 0, x α (λ1) = x α 1 , x α (λ2) = x α 2 , (C.15)<br />

˙x µ = dxµ<br />

. (C.16)<br />

dλ<br />

D’après cette définition, les géodésiques d’une variété riemannienne (V4,g) sont les courbes<br />

paramétrées xα = xα (λ) solutions <strong>de</strong>s équations d’Euler-Lagrange<br />

<br />

associées au lagrangien<br />

d<br />

dλ<br />

∂L<br />

∂ ˙x µ<br />

− ∂L<br />

= 0 (C.17)<br />

∂x µ<br />

L(x α , ˙x µ ) = 1<br />

2 gµν(x α ) ˙x µ ˙x ν . (C.18)<br />

On en déduit le théorème qui suit.<br />

Théorème C.2.1 Les géodésiques d’une variété riemannienne (V4,g) sont les courbes d’équations<br />

paramétriques x α = x α (λ) solutions du système différentiel<br />

d<br />

dλ (gµν ˙x ν ) = 1<br />

2 ∂µgρσ ˙x ρ ˙x σ . (C.19)<br />

Démonstration.— Pour établir les équations (C.19), calculons d’abord le moment conjugué<br />

∂L/∂ ˙x µ associé à chaque coordonnée x µ :<br />

Compte tenu <strong>de</strong><br />

on peut écrire<br />

∂L 1<br />

=<br />

∂ ˙x µ 2<br />

∂<br />

∂ ˙x µ(gρσ ˙x ρ ˙x σ ). (C.20)<br />

∂ ˙x ρ<br />

∂ ˙x µ = δρ µ , (C.21)<br />

∂<br />

∂ ˙x µ(gρσ ˙x ρ ˙x σ ) = gρσδ ρ µ ˙x σ + gρσ ˙x ρ δ σ µ = 2gµν ˙x ν . (C.22)<br />

Substituons (C.22) dans (C.20). Il vient :<br />

∂L<br />

∂ ˙x µ = gµν ˙x ν . (C.23)<br />

Par ailleurs, on peut évi<strong>de</strong>mment écrire :<br />

∂L 1<br />

=<br />

∂x µ 2 ∂µgρσ ˙x ρ ˙x σ . (C.24)<br />

La substitution <strong>de</strong> (C.23) et <strong>de</strong> (C.24) dans (C.17) donne immédiatement les équations<br />

d’Euler-Lagrange sous la forme (C.19). C.Q.F.D.<br />

149


Théorème C.2.2 Les équations (C.19) déterminent le paramétrage <strong>de</strong>s courbes géodésiques à<br />

une transformation affine arbitraire près.<br />

Démonstration.— Considérons une courbe paramétrée x α = x α (λ) solution <strong>de</strong>s équations<br />

(C.19) et effectuons un changement <strong>de</strong> paramétrage en posant<br />

λ = f(ζ), (C.25)<br />

f étant par hypothèse une fonction <strong>de</strong>ux fois continûment différentiable dont la dérivée première<br />

f ′ (ζ) ne s’annule pas sur l’intervalle <strong>de</strong> variation <strong>de</strong> λ. Les équations (C.19) s’écrivent alors sous<br />

la forme<br />

1<br />

f ′ d<br />

(ζ) dζ<br />

1<br />

f ′ (ζ) gµν<br />

dxν <br />

=<br />

dζ<br />

1<br />

2<br />

soit après multiplication <strong>de</strong>s <strong>de</strong>ux membres par f ′ (ζ)<br />

<br />

d dx<br />

gµν<br />

dζ<br />

ν<br />

<br />

−<br />

dζ<br />

f ′′ (ζ)<br />

f ′ (ζ) gµν<br />

dxν dζ<br />

1<br />

f ′2<br />

dx<br />

∂µgρσ<br />

(ζ) ρ dx<br />

dζ<br />

σ<br />

dζ<br />

1<br />

=<br />

2 ∂µgρσ<br />

dxρ dx<br />

dζ<br />

σ<br />

dζ<br />

(C.26)<br />

Les équations (C.26) ont la même forme que les équations (C.19) si et seulement si f ′′ (ζ) = 0,<br />

i.e. si et seulement si<br />

λ = aζ + b, (C.27)<br />

où a et b sont <strong>de</strong>s constantes arbitraires. C.Q.F.D.<br />

Le théorème 4 explique pourquoi on appelle paramètre affine <strong>de</strong> la géodésique considérée le<br />

paramètre λ impliqué dans le principe variationnel (C.15) ou , ce qui est équivalent, dans les<br />

équations (C.19).<br />

Étant un sytème d’équations <strong>de</strong> Lagrange, le système différentiel (C.19) est en pratique celui<br />

qui est le plus commo<strong>de</strong> pour étudier les géodésiques d’une variété riemannienne. Il existe toutefois<br />

une autre forme <strong>de</strong>s équations différentielles satisfaites par une géodésique qu’il importe<br />

<strong>de</strong> connaître. La dérivée totale par rapport à λ <strong>de</strong>s moments conjugués gµν ˙x ν peut s’écrire<br />

d<br />

dλ (gµν ˙x ν ) = gµν ¨x ν + ˙x ρ ∂ρgµν ˙x ν = gµν ¨x ν + 1<br />

2 (∂ρgσµ + ∂σgµρ) ˙x ρ ˙x σ . (C.28)<br />

Substituons (C.28) dans les équations <strong>de</strong>s géodésiques (C.19). Il vient :<br />

gµν ¨x ν + 1<br />

2 (∂ρgσµ + ∂σgµρ − ∂µgρσ) ˙x ρ ˙x σ = 0. (C.29)<br />

Effectuons la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (C.29) par g µα . Compte tenu<br />

<strong>de</strong> gµνg µα = δ α ν , <strong>de</strong> la définition (C.2) <strong>de</strong>s symboles <strong>de</strong> Christoffel <strong>de</strong> <strong>de</strong>uxième espèce et <strong>de</strong><br />

(C.16), les équations (C.29) s’écrivent sous la forme<br />

d2xα dλ2 + {αρσ} dxρ dx<br />

dλ<br />

σ<br />

= 0.<br />

dλ<br />

Compte tenu <strong>de</strong> la formule (71) du chap. I, le système (C.30) s’écrit encore<br />

(C.30)<br />

<br />

α ∇ dx<br />

= 0.<br />

dλ dλ<br />

(C.31)<br />

Réciproquement, il est aisé <strong>de</strong> vérifier que les équations (C.31) entraînent les équations <strong>de</strong><br />

Lagrange (C.19). On peut donc formuler le théorème qui suit.<br />

150


Théorème C.2.3 Une courbe Γ d’équations paramétriques x α = x α (λ) est une géodésique<br />

<strong>de</strong> paramètre affine λ si et seulement si le vecteur tangent ˙x α = dx α /dλ est transporté par<br />

parallélisme le long <strong>de</strong> Γ.<br />

Le théorème 5 revient à énoncer que les géodésiques sont les courbes auto-parallèles <strong>de</strong> la<br />

connexion riemannienne.<br />

Nous allons maintenant établir un théorème très utile quand on cherche à intégrer les<br />

équations différentielles <strong>de</strong>s géodésiques.<br />

Théorème C.2.4 Toute géodésique paramétrée par un paramètre affine λ arbitraire admet<br />

l’intégrale première<br />

2L(x α , ˙x µ ) = K = const (C.32)<br />

L(x α , ˙x µ ) étant le lagrangien défini par (C.18).<br />

Démonstration.— L’existence d’une intégrale première telle que (C.32) vient <strong>de</strong> la propriété<br />

<strong>de</strong> la fonction <strong>de</strong> Lagrange L <strong>de</strong> ne pas dépendre explicitement du paramètre λ. Pour le voir,<br />

calculons la dérivée totale <strong>de</strong> L(x α , ˙x µ ) par rapport à λ le long d’une courbe différentiable<br />

arbitraire. On obtient l’équation :<br />

dL<br />

dλ<br />

∂L<br />

=<br />

∂x µ ˙xµ + ∂L<br />

∂ ˙x µ ¨xµ = ∂L<br />

∂x µ ˙xµ + d<br />

<br />

∂L<br />

˙xµ −<br />

dλ ∂ ˙x µ d<br />

<br />

∂L<br />

dλ ∂ ˙x µ<br />

<br />

d’où on déduit immédiatement :<br />

<br />

dL d ∂L<br />

− ˙xµ ≡<br />

dλ dλ ∂ ˙x µ d<br />

<br />

L −<br />

dλ<br />

∂L<br />

<br />

˙xµ<br />

∂ ˙x µ<br />

Or, d’après (C.23), on peut écrire<br />

Substituons (C.34) dans (C.33). Il vient<br />

=<br />

<br />

∂L d ∂L<br />

−<br />

∂x µ dλ ∂ ˙x µ<br />

<br />

˙x µ ,<br />

˙x µ . (C.33)<br />

L − ∂L<br />

∂ ˙x µ ˙xµ = L − gµν ˙x ν ˙x µ = L − 2L = −L. (C.34)<br />

dL<br />

dλ =<br />

<br />

d ∂L<br />

dλ ∂ ˙x µ<br />

<br />

− ∂L<br />

∂x µ<br />

<br />

˙x µ . (C.35)<br />

Les termes entre crochets sont nuls quand les équations d’Euler-Lagrange (C.19) sont satisfaites.<br />

On a donc<br />

dL<br />

= 0<br />

dλ<br />

le long <strong>de</strong> toute solution <strong>de</strong>s équations (C.17) ou (C.19). La quantité L(x α , ˙x µ ) est donc<br />

constante le long d’une géodésique. D’où le théorème.<br />

L’intégrale première (C.32) montre qu’on a<br />

ds 2 = Kdλ 2<br />

151<br />

(C.36)


pour <strong>de</strong>ux points infiniment voisins appartenant à la même géodésique. Il en résulte qu’il existe<br />

trois types <strong>de</strong> géodésiques :<br />

a) Si K > 0, ds 2 > 0 ;<br />

b) Si K = 0, ds 2 = 0 ;<br />

c) Si K < 0, ds 2 < 0 .<br />

Nous retrouverons bien sûr cette classification en relativité. Avec notre convention d’écrire<br />

les métriques relativistes avec un signe + <strong>de</strong>vant c 2 dt 2 , une géodésique telle que ds 2 > 0 est dite<br />

du genre temps et une géodésique telle que ds 2 < 0 est dite du genre espace. Une géodésique<br />

telle que ds 2 = 0 est dite isotrope.<br />

Pour finir, nous noterons que l’intégrale première (C.32) s’avèrera précieuse quand on cherchera<br />

à intégrer les équations (C.17) ou (C.19). Voir exemple les chapitres 9 et 10.<br />

Pour clore cette section sur les géodésiques, nous énoncerons le théorème qui suit.<br />

Théorème C.2.5 Les géodésiques <strong>de</strong> genre temps sont les courbes <strong>de</strong> genre temps qui satisfont<br />

la condition d’extremum<br />

<br />

δ<br />

où ℓ est un paramètre arbitraire.<br />

<br />

ds = δ<br />

<br />

gµν(xα (ℓ)) dxµ dx<br />

dℓ<br />

ν<br />

dℓ = 0, (C.37)<br />

dℓ<br />

Démonstration.— Partons <strong>de</strong> la fonction lagrangienne qui figure sous le signe intégral dans<br />

le second membre <strong>de</strong> (C.37) :<br />

où ˙x µ désigne maintenant<br />

L(x α , ˙x µ ) =<br />

<br />

gµν(x α ) ˙x µ ˙x ν , (C.38)<br />

˙x µ = dxµ<br />

, (C.39)<br />

dℓ<br />

ℓ étant, répétons-le, un paramètre arbitraire. Les équations d’Euler-Lagrange associées sont<br />

et<br />

Définissons F en posant<br />

On a L = √ 2F. En conséquence :<br />

<br />

d ∂L dℓ ∂ ˙x µ<br />

<br />

= d<br />

<br />

1<br />

√2F<br />

dℓ<br />

<br />

d ∂L dℓ ∂ ˙x µ<br />

<br />

− ∂ L<br />

= 0. (C.40)<br />

∂x µ<br />

2F(x α , ˙x µ ) = gµν(x α ) ˙x µ ˙x ν . (C.41)<br />

∂ L 1<br />

= √<br />

∂x µ 2F<br />

∂F<br />

∂ ˙x µ<br />

<br />

= 1<br />

√<br />

2F<br />

152<br />

∂F<br />

∂x µ<br />

<br />

d ∂F<br />

dℓ ∂ ˙x µ<br />

<br />

− 1 dF<br />

2F dℓ<br />

(C.42)<br />

∂F<br />

∂ ˙x µ<br />

<br />

. (C.43)


Substituons (C.42) et (C.43) dans (C.40) et multiplions les <strong>de</strong>ux membres par √ 2F. Nous<br />

obtenons les équations : <br />

d ∂F<br />

dℓ ∂ ˙x µ<br />

<br />

− ∂F 1 dF ∂F<br />

− = 0.<br />

∂x µ 2F dℓ ∂ ˙x µ (C.44)<br />

On voit que les équations (C.44) se réduisent aux équations d’Euler-Lagrange pour la fonction<br />

<strong>de</strong> Lagrange L(x α , ˙x µ ) = F(x α , ˙x µ ) à condition <strong>de</strong> choisir le paramètre ℓ <strong>de</strong> telle sorte que<br />

dF/dℓ = 0 le long <strong>de</strong> chaque courbe solution. Mais d’après (C.41), la condition dF/dℓ = 0 n’est<br />

autre que l’intégrale première<br />

2F ≡ gµν(x α ) ˙x µ ˙x ν = K ′ , (C.45)<br />

où K ′ est une constante arbitraire > 0. L’équation (C.45) montre qu’imposer la relation dF/dℓ =<br />

0 équivaut à choisir ℓ <strong>de</strong> telle sorte que dℓ = ±K ′−1/2 ds, ce qui équivaut encore à ds 2 = K ′ dℓ 2 .<br />

La comparaison <strong>de</strong> cette condition avec (C.36) montre que ℓ s’i<strong>de</strong>ntifie avec un paramètre affine<br />

d’une géodésique du genre temps au sens défini au début <strong>de</strong> la section 2. Avec le choix <strong>de</strong> ℓ<br />

correspondant à K ′ = K, F(x α , ˙x µ ) s’i<strong>de</strong>ntifie avec le lagrangien (C.18), ce qui démontre le<br />

théorème.<br />

On notera que les équations d’Euler-Lagrange correspondant à (C.38) sont définies uniquement<br />

pour les arcs <strong>de</strong> géodésiques le long <strong>de</strong>squels F gar<strong>de</strong> un signe constant et ne peut prendre<br />

la valeur 0. Ces équations ne peuvent donc pas décrire les géodésiques isotropes, puisqu’on a<br />

pour ces <strong>de</strong>rnières L = 0.<br />

C.3 Tenseur <strong>de</strong> courbure<br />

En géométrie euclidienne usuelle à <strong>de</strong>ux ou trois dimensions, un vecteur qui est transporté<br />

par parallélisme le long d’un contour fermé (ou lacet) vient coïnci<strong>de</strong>r avec le vecteur initial<br />

lorsqu’il a effectué un tour complet. Il est cependant facile <strong>de</strong> voir que cette propriété n’est<br />

plus vraie sur la sphère S2 munie <strong>de</strong> la métrique gs induite par son plongement dans l’espace<br />

proprement euclidien à trois dimension. On dit que le plan euclidien ordinaire est un espace<br />

plat, tandis que la sphère (S2,gs) est un espace courbe.<br />

La généralisation aux variétés riemanniennes <strong>de</strong> dimension 4 est évi<strong>de</strong>mment possible.<br />

Considérons d’abord le cas simple <strong>de</strong>s espaces plats, dont la définition est la suivante :<br />

Définition C.3.1 On appelle espace plat <strong>de</strong> dimension 4 la variété IR 4 munie d’une métrique<br />

ayant la forme<br />

ds 2 3<br />

= ǫα(dx α ) 2 , (C.46)<br />

α=0<br />

où ǫ = 1 ou −1 selon les valeurs <strong>de</strong> l’indice α.<br />

Les symboles <strong>de</strong> Christoffel exprimés dans les coordonnées locales x α sont partout nuls<br />

puisque les gµν sont <strong>de</strong>s constantes. Un vecteur transporté par parallélisme le long d’un contour<br />

fermé arbitraire viendra donc coïnci<strong>de</strong>r avec sa position initiale lorsqu’il aura effectué un tour<br />

complet.<br />

Plus généralement, introduisons les espaces localement plats, définis comme suit :<br />

153


Définition C.3.2 Une variété riemannienne (V4,g) est un espace localement plat si au voisinage<br />

<strong>de</strong> chacun <strong>de</strong> ses points, il existe un système <strong>de</strong> coordonnées locales xα tel que la métrique<br />

s’écrive sous la forme<br />

ds 2 3<br />

= ǫα(dx α ) 2 . (C.47)<br />

α=0<br />

On peut montrer que là encore, un vecteur quelconque transporté par parallélisme le long<br />

d’un contour fermé arbitraire viendra coïnci<strong>de</strong>r avec sa position initiale lorsqu’il aura effectué<br />

un tour complet.<br />

La propriété que nous venons d’énoncer admet une réciproque. Nous n’allons pas démontrer<br />

ici cette réciproque en toute rigueur, mais nous allons indiquer la démarche qui permet <strong>de</strong><br />

l’établir.<br />

On part du théorème suivant, que nous nous contenterons d’énoncer sans expliciter les<br />

calculs.<br />

Théorème C.3.1 Soit C un lacet d’origine x0 défini par les équations paramétriques<br />

où le paramètre λ est choisi <strong>de</strong> telle sorte que<br />

x α = x α 0 + ǫξ α (λ) 0 ≤ λ ≤ 1, (C.48)<br />

ǫξ α (0) = ǫξ α (1) = 0, (C.49)<br />

et ǫ est un paramètre sans dimension tel que |ǫ|


D’où :<br />

∇µ∇νW ρ − ∇ν∇µW ρ<br />

= ∂µ(∇νW ρ ) − ∂ν(∇µW ρ ) + Γ ρ µσ∇νW σ − Γ ρ νσ∇µW σ . (C.53)<br />

Le calcul se poursuit en explicitant les dérivées covariantes figurant dans le second membre<br />

<strong>de</strong> (C.53). Il vient ainsi<br />

∇µ∇νW ρ − ∇ν∇µW ρ = <br />

∂µΓ ρ νσ − ∂νΓ ρ µσ + Γ ρ µτΓ τ νσ − Γ ρ ντΓ τ <br />

µσ W σ . (C.54)<br />

D’après le critère <strong>de</strong> tensorialité énoncé dans le chapitre I, les quantités entre parenthèses<br />

dans le second membre <strong>de</strong> (C.54) constituent les composantes d’un champ <strong>de</strong> tenseurs <strong>de</strong> type<br />

(3,1). Nous sommes dès lors conduits au théorème suivant.<br />

Théorème C.3.2 Sur une variété riemannienne (V4,g), les dérivées covariantes secon<strong>de</strong>s d’un<br />

champ <strong>de</strong> vecteurs arbitraire W ρ satisfont l’i<strong>de</strong>ntité<br />

∇µ∇νW ρ − ∇ν∇µW ρ = R ρ σµν W σ , (C.55)<br />

où R ρ σµν est un champ <strong>de</strong> tenseurs <strong>de</strong> type (3,1) dont les composantes en coordonnées locales<br />

sont données par<br />

R ρ σµν = ∂µΓ ρ νσ − ∂νΓ ρ µσ + Γ ρ µτΓ τ νσ − Γ ρ ντΓ τ µσ. (C.56)<br />

D’après ce théorème, la formule (C.50) peut s’écrire<br />

(Wσ) x0 ∆V σ = ǫ2<br />

4<br />

<br />

W σ R ρ <br />

σµν<br />

x0<br />

V (in)<br />

<br />

ρ ξ<br />

C<br />

µdξν<br />

dλ<br />

<br />

dξµ<br />

− ξν dλ + O(ǫ<br />

dλ<br />

3 ) (C.57)<br />

En considérant le passage à la limite ǫ → 0, on voit que si l’accroissement ∆V σ d’un vecteur<br />

arbitraire V ρ transporté par parallélisme le long d’un lacet arbitraire est nul en tout point <strong>de</strong><br />

V4, alors<br />

R ρ σµν = 0<br />

partout.<br />

Le champ <strong>de</strong> tenseurs défini par les éqs. (C.56) est appelé le tenseur <strong>de</strong> courbure (ou encore<br />

tenseur <strong>de</strong> Riemann-Christoffel) <strong>de</strong> la variété riemannienne 2 . Cette dénomination est justifiée<br />

par le théorème fondamental que nous allons énoncer maintenant, sans le démontrer.<br />

Théorème C.3.3 Une variété riemannienne dont le tenseur <strong>de</strong> courbure est partout nul est<br />

un espace localement plat.<br />

Ce théorème et l’équation (C.57) entraînent immédiatement la proposition qui suit :<br />

Théorème C.3.4 Une variété riemannienne est localement plate si le transport par parallélisme<br />

d’un vecteur quelconque le long d’un lacet arbitraire fait revenir ce vecteur dans sa position initiale.<br />

2 Dans la plupart <strong>de</strong>s traités <strong>de</strong> géométrie différentielle actuels, on définit le tenseur <strong>de</strong> courbure d’une<br />

connexion à partir <strong>de</strong> la relation (C.55). Pour notre part, nous avons préféré introduire ce tenseur à partir <strong>de</strong><br />

la formule géométrique (C.50), comme on le faisait dans les anciens traités, car cette manière <strong>de</strong> procé<strong>de</strong>r nous<br />

paraît beaucoup plus “parlante”<br />

155


Le théorème C.3.4 est la réciproque dont nous parlions plus haut.<br />

En général, dans une variété (V4,g) donné, le transport par parallélisme le long d’une courbe<br />

fermée défini par la connexion riemannienne ne ramènera pas un vecteur dans sa position<br />

initiale. On dira alors que la variété riemannienne est douée <strong>de</strong> courbure ou plus simplement<br />

est courbe.<br />

C.4 Propriétés du tenseur <strong>de</strong> courbure<br />

Selon un formalisme étudié dans la section 10 du premier chapitre, on définit les composantes<br />

quatre fois covariantes du tenseur <strong>de</strong> courbure en posant<br />

Rρσµν = gλρR λ σµν. (C.58)<br />

Il est bien entendu possible <strong>de</strong> calculer les composantes mixtes R λ σµν à partir <strong>de</strong>s composantes<br />

covariantes. En effectuant la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (C.58) par<br />

g ρτ , il vient en effet :<br />

g ρτ Rρσµν = g ρτ gλρR λ σµν = δ τ λR λ σµν = R τ σµν. (C.59)<br />

L’introduction <strong>de</strong>s composantes covariantes du tenseur <strong>de</strong> courbure est commo<strong>de</strong> pour<br />

énoncer les propriétés fondamentales qui suivent.<br />

Propriétés <strong>de</strong> symétrie et d’antisymétrie du tenseur <strong>de</strong> courbure.— On vérifie<br />

aisément à partir <strong>de</strong> (C.56) et <strong>de</strong> (C.58) que les quantités Rρσµν possè<strong>de</strong>nt les propriétés <strong>de</strong><br />

symétrie ou d’antisymétrie suivantes :<br />

et<br />

Rρσµν = Rµνρσ<br />

(C.60)<br />

Rρσµν = −Rσρµν = −Rρσνµ. (C.61)<br />

I<strong>de</strong>ntités satisfaites par le tenseur <strong>de</strong> courbure.— Le tenseur <strong>de</strong> courbure <strong>de</strong> la<br />

connexion riemannienne Γ ρ µν = { ρ µν} satisfait <strong>de</strong>ux i<strong>de</strong>ntités, dites i<strong>de</strong>ntités <strong>de</strong> Bianchi, que<br />

nous énonçons sans démonstration :<br />

R ρ<br />

λµν + Rρµνλ<br />

+ Rρνλµ<br />

= 0, (C.62)<br />

∇λR ρ σµν + ∇µR ρ<br />

σνλ<br />

+ ∇νR ρ<br />

σλµ<br />

= 0. (C.63)<br />

On notera que les indices λ, µ et ν sont permutés circulairement dans les formules (C.62)<br />

et (C.63).<br />

156


C.5 Tenseur <strong>de</strong> Ricci. Scalaire <strong>de</strong> courbure<br />

A partir du tenseur <strong>de</strong> courbure, on peut définir par contraction le tenseur <strong>de</strong> Ricci<br />

Rµν = R β<br />

µβν = gαβ Rαµβν. (C.64)<br />

L’expression du tenseur <strong>de</strong> Ricci se déduit immédiatement <strong>de</strong> (C.56) et <strong>de</strong> (C.64) :<br />

Rµν = ∂λΓ λ µν − ∂νΓ λ µλ + Γ ρ µνΓ λ ρλ − Γ ρ<br />

µλ Γλ ρν. (C.65)<br />

La multiplication contractée <strong>de</strong> g µν et <strong>de</strong> Rµν définit une quantité scalaire :<br />

appelée l’invariant <strong>de</strong> courbure scalaire.<br />

Les i<strong>de</strong>ntités (C.63) entraînent les i<strong>de</strong>ntités suivantes :<br />

∇ν<br />

R = g µν Rµν, (C.66)<br />

<br />

R µν − 1<br />

2 Rgµν<br />

<br />

= 0. (C.67)<br />

Ces quatre i<strong>de</strong>ntités, appelées i<strong>de</strong>ntités <strong>de</strong> conservation, jouent un rôle fondamental en<br />

relativité générale et dans les théories métriques <strong>de</strong> la gravitation. Le tenseur symétrique G µν<br />

défini par<br />

s’appelle le tenseur d’Einstein.<br />

G µν = R µν − 1<br />

R gµν<br />

2<br />

(C.68)<br />

C.6 Opérateurs différentiels sur une variété riemannienne<br />

Gradient d’une fonction.— Nous avons déjà vu que le gradient d’une fonction Φ(x) est<br />

un champ <strong>de</strong> vecteurs covariants. Sur un espace-temps (V4,g), on peut évi<strong>de</strong>mment définir les<br />

composantes contravariantes du vecteur gradΦ par les relations<br />

(gradΦ) α = g αβ ∂βΦ = g αβ ∇βΦ. (C.69)<br />

La (pseudo)-norme riemannienne du gradient est le paramètre différentiel <strong>de</strong> Beltrami du<br />

premier ordre défini par<br />

∆1Φ = g µν ∂µΦ∂νΦ. (C.70)<br />

Rotationnel d’un champ <strong>de</strong> vecteurs.— Étant donné un champ <strong>de</strong> vecteurs A <strong>de</strong><br />

composantes covariantes Aµ, on appelle tenseur rotationnel du vecteur A le tenseur <strong>de</strong>ux fois<br />

covariant défini par<br />

(rot A)µν = ∇νAµ − ∇µAν . (C.71)<br />

On a<br />

∇νAµ = ∂νAµ − { ρ νµ}Aρ , ∇µAν = ∂νAµ − { ρ νµ}Aρ . (C.72)<br />

157


En substituant les relations (C.72) dans (C.71), il vient<br />

(rotA)µν ≡ ∇νAµ − ∇µAν = ∂νAµ − ∂νAµ . (C.73)<br />

Les composantes du tenseur rotationnel d’un vecteur A s’expriment donc uniquement avec<br />

les dérivées partielles usuelles <strong>de</strong>s composantes covariantes <strong>de</strong> ce vecteur, exactement comme<br />

en géométrie vectorielle usuelle. Cette propriété permet <strong>de</strong> simplifier nombre <strong>de</strong> calculs en<br />

électromagnétisme, puisque le tenseur champ électromagnétique Fµν est au signe près le tenseur<br />

rotationnel du potentiel vecteur Aµ.<br />

Divergence d’un champ <strong>de</strong> vecteurs.— Donnons-nous un champ <strong>de</strong> vecteurs V <strong>de</strong><br />

composantes contravariantes V ρ . La divergence du champ V est la fonction divV définie par<br />

On a donc<br />

divV = ∇µV µ . (C.74)<br />

divV = ∂µV µ + { µ µν}V ν . (C.75)<br />

On peut donner une expression bien plus commo<strong>de</strong> du second membre <strong>de</strong> (C.75). On déduit<br />

<strong>de</strong> (C.10) :<br />

{ µ µν} = 1<br />

2 gµσ (∂µgνσ + ∂νgσµ − ∂σgµν). (C.76)<br />

Mais en vertu <strong>de</strong> la symétrie <strong>de</strong>s gµν<br />

En conséquence, (C.76) se réduit à<br />

1<br />

2 gµσ (∂µgνσ − ∂σgµν) = 1<br />

2 gµσ ∂µgνσ − 1<br />

2 gσµ ∂σgνµ = 0.<br />

{ µ µν} = 1<br />

2 gρσ ∂νgρσ . (C.77)<br />

Lorsqu’on tient compte <strong>de</strong> la définition <strong>de</strong>s g µν , le second membre <strong>de</strong> (C.77) est proportionnel<br />

à la dérivée par rapport à x ν du déterminant g <strong>de</strong> la matrice (gµν). On a d’après la théorie <strong>de</strong>s<br />

déterminants :<br />

gδ ρ ν = gµν∆ µρ , g = dét (gµν),<br />

où ∆ µρ est le cofacteur <strong>de</strong> gµρ. Cette relation entraîne<br />

g =<br />

3<br />

gµν∆ µν ∀ν = 0, 1, 2, 3, (C.78)<br />

µ=0<br />

où il n’y a pas sommation sur l’indice répété ν. Puisque ∆ µν ne contient pas le terme gµν, on<br />

déduit <strong>de</strong> (C.78) que<br />

∂g<br />

= ∆ µν . (C.79)<br />

D’où<br />

∂ρg ≡ ∂g<br />

∂gµν<br />

∂gµν<br />

∂ρgµν = ∆ µν ∂ρgµν , (C.80)<br />

158


soit, compte tenu <strong>de</strong> ∆ µν = gg µν :<br />

On a donc<br />

∂ρg = gg µν ∂ρgµν . (C.81)<br />

{ µ µν} = 1 ∂νg<br />

2 g<br />

<br />

∂ν |g|<br />

= . (C.82)<br />

|g|<br />

Substituons (C.82) dans (C.75). Il vient après un changement d’indice muet :<br />

divV = 1<br />

<br />

|g| ∂µ<br />

<br />

|g| V µ<br />

<br />

. (C.83)<br />

Cette formule s’avère très commo<strong>de</strong> dans le calcul <strong>de</strong>s divergences, car elle dispense <strong>de</strong><br />

calculer les symboles <strong>de</strong> Christoffel.<br />

On retiendra que (C.81) peut encore s’écrire sous la forme suivante :<br />

g µν ∂ρgµν = ∂ρg<br />

g<br />

d’où on déduit, en tenant compte <strong>de</strong> g µν gµν = 4 :<br />

gµν∂ρg µν = − ∂ρg<br />

g<br />

Les relations (C.84) et (C.85) sont extrêmement utiles en pratique.<br />

<br />

|g|<br />

= 2∂ρ , (C.84)<br />

|g|<br />

<br />

|g|<br />

= −2∂ρ . (C.85)<br />

|g|<br />

Laplacien d’une fonction.— On appelle laplacien ou encore paramètre différentiel <strong>de</strong><br />

Beltrami du <strong>de</strong>uxième ordre <strong>de</strong> Φ la fonction scalaire<br />

De ce qui précè<strong>de</strong>, on déduit :<br />

D’où, compte tenu <strong>de</strong> (C.82) :<br />

∆2Φ = div ( grad Φ) = g µν ∇µ∇νΦ. (C.86)<br />

∆2Φ = ∇µ (g µν ∂νΦ) = ∂µ (g µν ∂νΦ) + { µ µρ}g ρν ∂νΦ.<br />

∆2Φ = 1<br />

<br />

|g| ∂µ<br />

<br />

|g|g µν <br />

∂νΦ . (C.87)<br />

Cette expression du laplacien est très pratique dans bon nombre <strong>de</strong> calculs, y compris<br />

ceux qui sont effectués sur l’espace euclidien usuel. Il est par exemple à peu près immédiat<br />

<strong>de</strong> déterminer l’opérateur laplacien dans le cas <strong>de</strong>s métriques écrites sous forme diagonale (un<br />

exemple est donné dans la section 3.8).<br />

159


C.7 Quelques relations utiles<br />

Divergence d’un tenseur antisymétrique.— Soit Fµν un tenseur antisymétrique arbitraire.<br />

Montrer qu’on peut écrire<br />

∇µF µν = 1<br />

<br />

|g| ∂µ<br />

<br />

|g| F µν<br />

<br />

. (C.88)<br />

En déduire que tout tenseur Fµν antisymétrique satisfait l’i<strong>de</strong>ntité<br />

∇µ∇νF µν = 0. (C.89)<br />

Solution.— On explicite ∇µF µν grâce à la formule <strong>de</strong> dérivation covariante (B.14), les<br />

coefficients <strong>de</strong> connexion étant donnés par (C.1) et (C.2). La formule (C.88) résulte alors<br />

immédiatement <strong>de</strong> l’antisymétrie <strong>de</strong> Fµν en appliquant (C.82).<br />

La démonstration <strong>de</strong> (C.89) est tout aussi aisée. Les quantités ∇νF µν constituent les composantes<br />

contravariantes d’un vecteur. Il en résulte que ∇µ∇νF µν est la divergence d’un vecteur.<br />

Nous pouvons donc appliquer la relation (C.83). Compte tenu <strong>de</strong> (C.88), il vient :<br />

∇µ∇νF µν = 1<br />

<br />

|g| ∂µ<br />

⎡<br />

<br />

⎣<br />

|g| 1<br />

<br />

|g| ∂µ<br />

Or, le caractère antisymétrique <strong>de</strong> Fµν entraîne l’i<strong>de</strong>ntité<br />

1<br />

<br />

|g| ∂µ∂ν<br />

<br />

|g|F µν<br />

<br />

≡ 0.<br />

<br />

|g| F µν<br />

⎤<br />

⎦.<br />

On a donc la relation (C.89). Cette relation est fondamentale en électromagnétisme, puisqu’elle<br />

assure la conservation <strong>de</strong> la charge électrique totale comme conséquence <strong>de</strong>s équations<br />

<strong>de</strong> Maxwell.<br />

Divergence d’un tenseur symétrique.— Soit T un tenseur d’ordre 2 symétrique : T µν =<br />

T νµ . Montrer que ses composantes mixtes satisfont la relation<br />

<br />

|g|T µ <br />

ν − 1<br />

2 ∂νgρσ T ρσ . (C.90)<br />

∇µT µ ν = 1<br />

<br />

|g| ∂µ<br />

Solution.— Le calcul est immédiat à partir <strong>de</strong> la formule (B.16) dans laquelle les Γ ρ µν sont<br />

remplacés par les expressions (C.2).<br />

L’expression (C.90) est commo<strong>de</strong> lorsqu’on veut expliciter la relation ∇µT µ ν = 0 exprimant<br />

le caractère conservatif du tenseur impulsion-énergie symétrique T décrivant la présence <strong>de</strong><br />

matière ou d’énergie (on dit encore que le tenseur impulsion-énergie est <strong>de</strong> divergence nulle).<br />

Exercice.— Montrer que<br />

g µν { ρ µν} = − 1<br />

<br />

|g| ∂σ<br />

<br />

|g| g ρσ<br />

<br />

. (C.91)<br />

160


Solution.— D’après (C.2), le premier membre <strong>de</strong> (C.91) s’écrit<br />

Compte tenu <strong>de</strong> g µν gνσ = δ µ σ, on a<br />

g µν { ρ µν} = 1<br />

2 gµν g ρσ (∂µgνσ + ∂νgσµ − ∂σgµν). (C.92)<br />

1<br />

2 gµνg ρσ ∂µgνσ = − 1<br />

2 gµνgνσ∂µg ρσ = − 1<br />

2 δµ σ ∂µg ρσ = − 1<br />

2<br />

et en échangeant les rôles joués par les indices µ et ν<br />

En outre, (C.84) donne immédiatement<br />

∂σg ρσ<br />

(C.93)<br />

1<br />

2 gµνg ρσ ∂νgσµ = − 1<br />

2 ∂σg ρσ . (C.94)<br />

1<br />

2 gµνg ρσ ∂σgµν = g ρσ∂σ<br />

<br />

<br />

|g|<br />

Substituons (C.93), (C.94) et (C.95) dans (C.92). Il vient<br />

g µν { ρ µν} = −∂σg ρσ − g ρσ∂σ<br />

<br />

<br />

|g|<br />

|g|<br />

|g|<br />

(C.95)<br />

1<br />

≡ − |g| ∂σ<br />

<br />

|g| g ρσ<br />

<br />

. (C.96)<br />

Le <strong>de</strong>rnier membre est bien l’expression donnée par (C.91). C.Q.F.D.<br />

La relation (C.96) est utile lorsqu’on introduit les coordonnées dites harmoniques (ces coordonnées<br />

permettent d’écrire les équations d’Einstein sous une forme remarquable).<br />

C.8 Applications à l’espace euclidien à 3 dimensions<br />

Les formules obtenues pour les opérateurs différentiels sont très utiles aussi en analyse<br />

vectorielle tridimensionnelle habituelle lorsqu’on veut faire <strong>de</strong>s calculs dans <strong>de</strong>s systèmes <strong>de</strong> coordonnées<br />

non cartésiens. Nous allons donner <strong>de</strong>ux exemples en supposant que l’espace est muni<br />

<strong>de</strong> la métrique euclidienne standard ds 2 = δijdx i dx j et rapporté à <strong>de</strong>s coordonnées sphériques<br />

(r,θ,ϕ) définies par<br />

x 1 = r sin θ cos ϕ, x 1 = r sin θ sin ϕ, x 3 = r cos θ . (C.97)<br />

Divergence d’un champ <strong>de</strong> vecteurs.— On se donne un champ <strong>de</strong> vecteurs V par ses<br />

composantes contravariantes V r ,V θ ,V ϕ dans le repère naturel associé aux coordonnées (r,θ,ϕ).<br />

Former l’expression <strong>de</strong> la divergence du champ V en coordonnées sphériques.<br />

Solution.— On vérifie facilement que la métrique euclidienne s’écrit sous la forme suivante<br />

en coordonnées sphériques :<br />

ds 2 = dr 2 + r 2 dθ 2 + r 2 sin 2 θdϕ 2 . (C.98)<br />

161


Dans le nouveau système <strong>de</strong> coordonnées, la métrique a une forme diagonale et les seules<br />

composantes non nulles du tenseur métrique sont<br />

On a donc<br />

grr = 1, gθθ = r 2 , gϕϕ = r 2 sin 2 θ . (C.99)<br />

et les expressions <strong>de</strong>s g ij non i<strong>de</strong>ntiquement nuls sont :<br />

g rr = 1<br />

grr<br />

D’après (C.83), on peut écrire<br />

divV =<br />

g = dét (1,r 2 ,r 2 sin 2 θ) = r 4 sin 2 θ (C.100)<br />

= 1, g θθ = 1<br />

gθθ<br />

= 1<br />

r 2 , gϕϕ = 1<br />

gϕϕ<br />

=<br />

1<br />

r2 sin2 . (C.101)<br />

θ<br />

1<br />

r2 <br />

∂ <br />

r<br />

sin θ ∂r<br />

2 sin θ V r<br />

+ ∂ <br />

r<br />

∂θ<br />

2 sin θ V θ<br />

+ ∂ <br />

r<br />

∂ϕ<br />

2 sin θ V ϕ<br />

. (C.102)<br />

On déduit immédiatement <strong>de</strong> (C.102) l’expression cherchée pour divV<br />

divV = 1<br />

r 2<br />

∂ <br />

r<br />

∂r<br />

2 V r<br />

+ 1<br />

sin θ<br />

∂ <br />

sin θ V<br />

∂θ<br />

θ<br />

+ ∂V ϕ<br />

. (C.103)<br />

∂ϕ<br />

Laplacien d’une fonction.— Former l’expression du laplacien d’une fonction Φ en coordonnées<br />

(r,θ,ϕ).<br />

Solution.— Les formules montrées dans l’exercice 1 et l’application <strong>de</strong> (C.87) conduisent<br />

immédiatement à l’expression bien connue du laplacien en coordonnées sphériques :<br />

∆2Φ = 1<br />

r 2<br />

<br />

∂<br />

r<br />

∂r<br />

2∂Φ<br />

<br />

+<br />

∂r<br />

1<br />

r2 sin θ<br />

<br />

∂<br />

sin θ<br />

∂θ<br />

∂Φ<br />

<br />

+<br />

∂θ<br />

1<br />

r 2 sin 2 θ<br />

∂2Φ . (C.104)<br />

∂ϕ2 Vérifier qu’on obtient également cette formule à partir <strong>de</strong> (C.103) à condition <strong>de</strong> remplacer<br />

V r ,V θ ,V ϕ par les composantes contravariantes du gradient <strong>de</strong> Φ correspondantes.<br />

L’expression (C.104) est très commo<strong>de</strong> en théorie newtonienne <strong>de</strong> la gravitation ainsi qu’en<br />

électromagnétisme et en théorie <strong>de</strong>s milieux continus.<br />

162


Annexe D<br />

Quantité <strong>de</strong> mouvement et énergie<br />

cinétique d’une particule isolée<br />

Nous allons montrer que les hypothèses “naturelles” faites dans la section 5.2 du chap. 5 sont<br />

suffisantes pour déterminer les fonctions universelles M(m,v 2 /c 2 ) et Ec(m,v 2 /c 2 ) simplement<br />

en considérant <strong>de</strong>s chocs élastiques <strong>de</strong> particules.<br />

Donnons-nous un référentiel galiléen S arbitraire et considérons la collision <strong>de</strong> <strong>de</strong>ux particules<br />

isolées a et b <strong>de</strong> masses ma et mb égales se mouvant sur une même droite ∆e avec <strong>de</strong>s<br />

vitesses va et vb opposées. Nous poserons :<br />

m = ma = mb, v = va = −vb, v = |va| = |vb|. (D.1)<br />

On suppose que ni le nombre ni la nature <strong>de</strong>s particules ne sont modifiés par la collision 1 .<br />

On a donc immédiatement après le choc <strong>de</strong>ux particules sortantes c et d <strong>de</strong> masses respectives<br />

mc et md égales à m, soit :<br />

mc = md = m. (D.2)<br />

Les vitesses <strong>de</strong>s particules c et d seront respectivement notées vc et vd. Pour alléger l’écriture,<br />

on posera<br />

β = |va| |vb| v<br />

= =<br />

c c c , βc = |vc|<br />

c , βd = |vd|<br />

. (D.3)<br />

d<br />

L’hypothèse centrale consiste à poser que la somme vectorielle <strong>de</strong>s quantités <strong>de</strong> mouvement<br />

et la somme <strong>de</strong>s énergies totales sont conservées au cours <strong>de</strong> la collision. Compte tenu <strong>de</strong>s<br />

relations (D.1) et (D.2), ces <strong>de</strong>ux lois <strong>de</strong> conservation s’écrivent dans le référentiel S<br />

et<br />

M(m,β 2 )va − M(m,β 2 )va = 0 = M(m,β 2 c)vc + M(m,β 2 d)vd<br />

(D.4)<br />

Ec(m,β 2 ) + Ec(m,β 2 ) = Ec(m,β 2 c) + Ec(m,β 2 d). (D.5)<br />

Du fait que la fonction M(m,v 2 /c 2 ) est toujours strictement positive d’après nos hypothèses<br />

générales, l’équation (D.4) entraîne que les vecteurs vitesses vc et vd sont colinéaires et <strong>de</strong> sens<br />

1 Le choc est alors dit parfaitement élastique.<br />

163


opposés. Les particules sortantes se déplacent donc sur une droite ∆s passant par le point <strong>de</strong><br />

collision O. Si on oriente cette droite, l’équation vectorielle (D.4) se traduit par l’équation<br />

M(m,β 2 c)¯vc + M(m,β 2 d)¯vd = 0<br />

où ¯vc et ¯vd sont les valeurs algébriques sur ∆s <strong>de</strong>s vitesses <strong>de</strong> c et d respectivement. On a donc<br />

M(m,β 2 c)vc = M(m,β 2 d)vd, (D.6)<br />

à condition <strong>de</strong> poser vc = |vc| et vd = |vd|. Or nous avons suppposé que la fonction M(m,v 2 /c 2 )v<br />

est strictement monotone. L’équation (D.6) entraîne donc<br />

Il en résulte que (D.5) peut s’écrire<br />

βc = βd. (D.7)<br />

2Ec(m,β 2 ) = 2Ec(m,β 2 c). (D.8)<br />

Mais nous avons supposé que la fonction Ec(m,v 2 /c 2 ) est elle aussi strictement monotone par<br />

rapport à v. Les relations (D.6) et (D.8) entraînent donc que<br />

βc = βd = β. (D.9)<br />

Il résulte <strong>de</strong> ce qui précè<strong>de</strong> que les particules sortantes se meuvent sur l’axe ∆s avec <strong>de</strong>s<br />

vecteurs vitesse opposés dont la valeur absolue commune est égale à la valeur absolue v :<br />

vd = −vc, avec vc = vd = va = v. (D.10)<br />

Nous allons supposer pour l’instant que l’angle θ entre ∆e et ∆s est tel que 0 < θ < π. Nous<br />

pouvons dès lors repérer les points <strong>de</strong> S par rapport à un trièdre orthonormé Ox 1 x 2 x 3 tel que<br />

l’axe Ox 1 soit porté par la droite ∆e et l’axe Ox 2 soit dans le plan défini par les droites ∆e et<br />

∆s. Les composantes <strong>de</strong>s vecteurs vitesses va et vb <strong>de</strong>s particules inci<strong>de</strong>ntes sont alors<br />

v 1 a = v, v 2 a = 0, v 3 a = 0, (D.11)<br />

v 1 b = −v, v 2 b = 0, v 3 b = 0, (D.12)<br />

tandis que les composantes <strong>de</strong>s vecteurs vitesse <strong>de</strong>s particules sortantes sont<br />

v 1 c = v cos θ, v 2 c = v sin θ, v 3 c = 0, (D.13)<br />

v 1 d = −v cos θ, v 2 d = −v sin θ, v 3 d = 0. (D.14)<br />

Considérons maintenant le référentiel galiléen S ′ comouvant avec la particule inci<strong>de</strong>nte a.<br />

Ce référentiel se déplace avec la vitesse va = v par rapport à S. Nous pouvons toujours choisir<br />

<strong>de</strong>s axes liés à S ′ <strong>de</strong> telle sorte que les coordonnées galiléennes dans S ′ s’expriment en fonction<br />

<strong>de</strong>s coordonnées galiléennes dans S par les transformations <strong>de</strong> Lorentz (4.22) écrites dans le<br />

chap. 4 dans lesquelles w est remplacée par la vitesse va.<br />

D’après la loi <strong>de</strong> composition <strong>de</strong>s vitesses (4.35), les composantes <strong>de</strong>s différents vecteurs<br />

vitesse par rapport à S ′ sont<br />

v 1′<br />

a = 0, v 2′<br />

a = 0, v 3′<br />

a = 0, (D.15)<br />

v 1′<br />

b = − 2cβ<br />

1 + β 2, v2 b = 0, v 3 b = 0, (D.16)<br />

164


et<br />

v 1′<br />

c = −<br />

v 1′<br />

d = −<br />

cβ(1 − cos θ)<br />

1 − β2 cosθ<br />

cβ(1 + cosθ)<br />

1 + β2 , v2′ d = −<br />

cos θ<br />

<br />

, v2′ c = 1 − β2 cβ sin θ<br />

<br />

1 − β 2 cos θ<br />

1 − β 2 cβ sin θ<br />

1 + β 2 cosθ<br />

, v3′<br />

c = 0, (D.17)<br />

, v3′<br />

d = 0, (D.18)<br />

On détermine immédiatement le carré <strong>de</strong>s vecteurs vitesses v ′ a, v ′ b, v ′ c et v ′ d à partir <strong>de</strong>s<br />

expessions (D.15)-(D.18). Il vient après division par c 2 :<br />

β ′ a<br />

2 v<br />

= ′ 2<br />

a<br />

c<br />

2 = 0,<br />

2<br />

4β 2<br />

(1 + β 2 ) 2,<br />

β ′ 2 v<br />

b = ′ b<br />

=<br />

c2 (D.19)<br />

β ′ 2 v<br />

c = ′ 2<br />

c<br />

c2 = β22(1 − cos θ) − β2 sin2 θ<br />

(1 − β2 cos θ) 2 , (D.20)<br />

β ′ 2 v<br />

d = ′ 2<br />

d<br />

c2 = β22(1 + cosθ) − β2 sin2 θ<br />

(1 + β2 cos θ) 2 . (D.21)<br />

D.1 Détermination <strong>de</strong> la fonction M <br />

m, v2<br />

c2 <br />

Ecrivons la conservation <strong>de</strong> la somme <strong>de</strong>s vecteurs quantités <strong>de</strong> mouvement dans le référentiel<br />

S ′ . Il vient<br />

M <br />

m,β ′ 2<br />

b<br />

2cβ<br />

1 + β2 = M(m,β′ 2 cβ(1 − cos θ)<br />

c )<br />

1 − β2 cos θ + M(m,β′ 2 cβ(1 + cosθ)<br />

d )<br />

1 + β2 , (D.22)<br />

cos θ<br />

en projetant sur l’axe O ′ x 1′<br />

et<br />

M(m,β ′ <br />

2<br />

c ) 1 − β2 cβ sin θ<br />

1 − β2 cos θ − M(m,β′ <br />

2<br />

d ) 1 − β2 cβ sin θ<br />

1 + β2 cos θ<br />

= 0 (D.23)<br />

en projetant sur O ′ x2′ . La projection sur l’axe O ′ x3′ se réduit évi<strong>de</strong>mment à l’égalité 0 = 0.<br />

La division <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (D.23) par cβ √ 1 − β2 sin θ donne la relation<br />

M(m,β ′ 2<br />

c )<br />

1 − β2 cos θ = M(m,β′ d<br />

2<br />

)<br />

1 + β2 . (D.24)<br />

cos θ<br />

Substituons (D.24) dans (D.22). L’équation obtenue se simplifie et <strong>de</strong>vient après division<br />

<strong>de</strong>s <strong>de</strong>ux membres par 2cβ :<br />

1<br />

M(m,β ′ 2<br />

b )<br />

1 + β2 = M(m,β′ c<br />

2<br />

)<br />

1 − β2 , (D.25)<br />

cos θ<br />

où β ′ b et β ′ c sont respectivement donnés par (D.19) et (D.20). Cette équation montre que la<br />

quantité M(m,β ′ 2 2 ′ 2<br />

c )/(1 − β cos θ) ne dépend pas <strong>de</strong> l’angle θ. Lorsque θ → 0, β c → 0. Du<br />

165


fait que nous avons postulé que M(m,β 2 ) est continue sur l’intervalle 0 ≤ β 2 < 1, on voit que<br />

(D.25) entraîne<br />

M(m,β ′ 2 1 + β<br />

b ) = M(m, 0) 2<br />

1 − β2. Or, la quantité β ′ 2<br />

b donnée par (D.19) peut encore s’écrire<br />

Il en résulte que<br />

β ′ 2 (1 − β<br />

b = 1 − 2 ) 2<br />

(1 + β2 ) 2.<br />

1 + β2 =<br />

1 − β2 1<br />

<br />

1 − β ′ 2<br />

b<br />

Substituons (D.28) dans (D.26). Nous obtenons :<br />

M(m,β ′ b<br />

2 ) = M(m, 0)<br />

(D.26)<br />

(D.27)<br />

. (D.28)<br />

1<br />

<br />

1 − β ′ 2<br />

b<br />

. (D.29)<br />

Cette relation est vali<strong>de</strong> pour tout β ′ b dans l’intervalle [0, 1[. Or, nous avons admis que<br />

M(m, 0) = 0 (voir éq. (5.8)). Il résulte donc <strong>de</strong> (D.29) que la fonction M(m,v 2 /c 2 ) cherchée<br />

s’écrit<br />

M<br />

<br />

m, v2<br />

c 2<br />

<br />

= m<br />

<br />

1 − v2<br />

c2 . (D.30)<br />

Cette relation conduit à l’expression relativiste <strong>de</strong> p donnée par (5.10).<br />

D.2 Détermination <strong>de</strong> la fonction Ec<br />

<br />

m, v2<br />

c 2<br />

La conservation <strong>de</strong> l’énergie totale dans le référentiel S ′ s’exprime par l’équation :<br />

E(m, 0) + E(m,β ′ 2 ′ 2 ′ 2<br />

b ) = E(m,β c ) + E(m,β d ). (D.31)<br />

Cette équation montre que la quantité E(m,β ′ 2 ′ 2<br />

c ) + E(m,β d ) ne dépend pas <strong>de</strong> l’angle θ. Si<br />

on pose<br />

u = cos θ,<br />

β ′ 2 ′ 2 ′ 2 ′ 2<br />

c et β d peuvent être considérés comme <strong>de</strong>s fonctions <strong>de</strong> u. Dès lors, E(m,β c ) + E(m,β d )<br />

doit être indépendant <strong>de</strong> u, ce qui se traduit par la condition<br />

∂ <br />

E(m,β<br />

∂u<br />

′ <br />

2 ′ 2<br />

c ) + E(m,β d ) = 0 (D.32)<br />

Pour abréger, désignons par E ′ (m,β 2 ) la dérivée partielle <strong>de</strong> la fonction E(m,β 2 ) :<br />

E ′ (m,β 2 ) = ∂<br />

∂β 2 E(m,β2 ).<br />

166


Compte tenu <strong>de</strong>s notations que nous venons d’introduire et <strong>de</strong>s relations<br />

∂β ′ 2<br />

c<br />

∂u = −2β2 (1 − β2 )<br />

(1 − β2 ,<br />

u) 3<br />

∂β ′ 2<br />

d<br />

∂u = 2β2 (1 − β2 )<br />

(1 + β2 ,<br />

u) 3<br />

l’équation (D.32) s’écrit après division <strong>de</strong>s <strong>de</strong>ux membres par 2β 2 (1 − β 2 ),<br />

1<br />

E ′ (m,β ′ 2<br />

c )<br />

(1 − β2u) 3 = E ′ (m,β ′ d<br />

2 1<br />

)<br />

(1 + β2u) 3.<br />

(D.33)<br />

Faisons tendre u vers 1, ce qui correspond à θ → 0. Alors β ′ 2 ′ 2 ′ 2<br />

c → 0 et β d → β b . L’équation<br />

(D.33) <strong>de</strong>vient après multiplication <strong>de</strong> ses <strong>de</strong>ux membres par (1 + β2 ) 3 :<br />

Posons<br />

On voit facilement que<br />

E ′<br />

<br />

L’équation (D.34) s’écrit donc<br />

m, 1 − (1 − β2 ) 2<br />

(1 + β 2 ) 2<br />

<br />

ζ = 1 − (1 − β2 ) 2<br />

(1 + β 2 ) 2.<br />

(1 + β2 ) 3<br />

(1 − β2 =<br />

) 3<br />

∂E ′ (m,ζ)<br />

∂ζ<br />

= E ′ (m, 0) (1 + β2 ) 3<br />

(1 − β 2 ) 3.<br />

1<br />

(1 − ζ) 3/2.<br />

= E ′ (m, 0)<br />

(1 − ζ) 3/2.<br />

(D.34)<br />

(D.35)<br />

(D.36)<br />

L’intégration <strong>de</strong> (D.36) est immédiate et donne la relation<br />

E(m,ζ) = 2E ′ <br />

1<br />

(m, 0) √ − 1 + E(m, 0). (D.37)<br />

1 − ζ<br />

Il s’ensuit que l’énergie totale d’une particule isolée <strong>de</strong> vitesse v est donnée par une relation<br />

<strong>de</strong> la forme <br />

E m, v2<br />

c2 <br />

= 2E ′ <br />

1<br />

(m, 0) √ − 1 + E(m, 0). (D.38)<br />

1 − β2 Il est clair que la partie entre crochets s’annule lorsque v = 0. On peut donc poser que la<br />

fonction universelle exprimant l’énergie cinétique d’une particule est donnée par<br />

<br />

Ec m, v2<br />

c2 ⎛<br />

1<br />

= CE<br />

⎝<br />

1 − v2<br />

c2 ⎞<br />

− 1⎠<br />

, (D.39)<br />

où CE est la constante 2E ′ (m, 0), tandis que le terme E(m, 0) peut être considéré comme l’énergie<br />

totale d’une particule <strong>de</strong> masse m au repos. Nous avons admis que l’énergie cinétique relativiste<br />

se comportait comme l’énergie cinétique en théorie newtonienne pour les vitesses très petites<br />

<strong>de</strong>vant c. Or, d’après (D.39), on a<br />

<br />

Ec m, v2<br />

c2 <br />

= 1<br />

2 CE<br />

v2 <br />

4 v<br />

+ O<br />

c2 c4 <br />

.<br />

La comparaison avec l’expression newtonienne 1<br />

2 mv2 <strong>de</strong> l’énergie cinétique montre qu’il faut<br />

poser<br />

CE = mc 2 .<br />

D’où la formule (5.11).<br />

167


Mathématiques<br />

Bibliographie sommaire<br />

Ouvrages correspondant au niveau <strong>de</strong> ce cours :<br />

J. HLADIK, Calcul tensoriel en physique. Masson, 1994.<br />

A. LICHNEROWICZ, Éléments <strong>de</strong> calcul tensoriel. Armand Colin.<br />

Ouvrages <strong>de</strong> niveau plus élevé :<br />

Y. CHOQUET-BRUHAT, Géométrie différentielle et systèmes extérieurs. Dunod, 1968.<br />

L. P. EISENHART, Riemannian Geometry. Princeton Yniversity Press, 1926. Réédité par<br />

Dover.<br />

Physique<br />

Ouvrages correspondant au niveau <strong>de</strong> ce cours :<br />

J. HLADIK, Introduction à la relativité restreinte. Dunod, 2001.<br />

J. HLADIK, Introduction à la relativité générale niveau M 1. Ellipses, 2006.<br />

R. D’INVERNO, Introducing Einstein’s Relativity. Oxford University Press, 1992.<br />

B. SCHUTZ, A First Course in General Relativity. Cambridge University Press, 1985.<br />

I. SIMON, Relativité restreinte : Cours et applications. Vuibert, 2004.<br />

P. TOURRENC, Gravitation et Relativité. Armand Colin, 1997. (Ouvrage épuisé).<br />

Quelques ouvrages fondamentaux :<br />

L. LANDAU & E. LIFCHITZ, Théorie <strong>de</strong>s champs. Ellipses, 1998.<br />

C. W. MISNER, K. S. THORNE & J. A. WHEELER, Gravitation. Freeman, 1973.<br />

R. M. WALD, General Relativity. University of Chicago Press, 1984.<br />

S. WEINBERG, Gravitation and Cosmology : Principles and Applications of the General<br />

Theory of Relativity. Wiley, 1972.<br />

C. WILL, Theory and Experiment in Gravitational Physics. 2nd edit., Cambridge University<br />

Press, 1993.<br />

Recueil <strong>de</strong> problèmes :<br />

A. P. LIGHTMAN, W. H. PRESS, R. H. PRICE & S. A. TEUKOLSKY, Problem Book in<br />

Relativity and Gravitation. Princeton University Press, 1975.<br />

168

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!