Polycopié de P. TEYSSANDIER. - Observatoire de Paris
Polycopié de P. TEYSSANDIER. - Observatoire de Paris
Polycopié de P. TEYSSANDIER. - Observatoire de Paris
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Master “Sciences <strong>de</strong> l’Univers et techniques spatiales”<br />
Niveau M1<br />
Introduction aux théories relativistes<br />
et à leurs applications<br />
Rédaction provisoire du cours <strong>de</strong> l’année 2008-2009<br />
Pierre Teyssandier<br />
<strong>Observatoire</strong> <strong>de</strong> <strong>Paris</strong>,<br />
Département SYRTE/CNRS-UMR 8630
Table <strong>de</strong>s matières<br />
1 Notions préliminaires 4<br />
1.1 Observateurs. Objets. Particules . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />
1.2 Événements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />
1.3 Notion <strong>de</strong> variété. Variété <strong>de</strong>s événements . . . . . . . . . . . . . . . . . . . . . 5<br />
1.4 Fonctions scalaires. Hypersurfaces . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />
1.5 Courbe différentiable sur une variété . . . . . . . . . . . . . . . . . . . . . . . . 9<br />
1.6 Coïnci<strong>de</strong>nce d’événements. Ordre temporel . . . . . . . . . . . . . . . . . . . . . 9<br />
1.7 Horloges standard. Temps propre. Ligne d’univers d’une particule . . . . . . . . 10<br />
2 Champs <strong>de</strong> vecteurs. Champs <strong>de</strong> tenseurs 12<br />
2.1 Champs <strong>de</strong> vecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />
2.2 Champs <strong>de</strong> vecteurs covariants . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />
2.3 Définition générale <strong>de</strong>s champs <strong>de</strong> tenseurs . . . . . . . . . . . . . . . . . . . . . 15<br />
2.4 Exemples <strong>de</strong> champs <strong>de</strong> tenseurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />
2.5 Addition et multiplication <strong>de</strong>s tenseurs . . . . . . . . . . . . . . . . . . . . . . . 18<br />
2.6 Contraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />
2.7 Critères <strong>de</strong> tensorialité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />
2.8 Tenseurs symétriques et tenseurs antisymétriques . . . . . . . . . . . . . . . . . 23<br />
2.9 Composantes covariantes et contravariantes . . . . . . . . . . . . . . . . . . . . . 23<br />
3 Espace-temps <strong>de</strong> Minkowski 28<br />
3.1 Principes fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />
3.2 Lois <strong>de</strong> transformation <strong>de</strong>s coordonnées galiléennes . . . . . . . . . . . . . . . . 30<br />
3.3 Mouvement relatif <strong>de</strong> <strong>de</strong>ux référentiels galiléens . . . . . . . . . . . . . . . . . . 32<br />
3.4 Intervalle entre <strong>de</strong>ux points-événements . . . . . . . . . . . . . . . . . . . . . . . 32<br />
3.5 Classification <strong>de</strong>s intervalles. Cône isotrope . . . . . . . . . . . . . . . . . . . . . 36<br />
3.6 Lignes d’univers du genre temps . . . . . . . . . . . . . . . . . . . . . . . . . . . 37<br />
3.7 Temps propre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
4 Cinématique relativiste 47<br />
4.1 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47<br />
4.2 Transformations spéciales <strong>de</strong> Lorentz . . . . . . . . . . . . . . . . . . . . . . . . 47<br />
4.3 Loi <strong>de</strong> composition relativiste <strong>de</strong>s vitesses . . . . . . . . . . . . . . . . . . . . . 51<br />
4.4 Aberration <strong>de</strong> la lumière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />
4.5 Effet Doppler-Fizeau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />
1
5 Dynamique relativiste (I) 62<br />
5.1 Principe d’équivalence <strong>de</strong>s référentiels galiléens . . . . . . . . . . . . . . . . . . . 62<br />
5.2 Quantité <strong>de</strong> mouvement et énergie cinétique d’une particule isolée . . . . . . . . 63<br />
5.3 Energie d’une particule. Inertie <strong>de</strong> l’énergie . . . . . . . . . . . . . . . . . . . . . 65<br />
5.4 Relations entre l’énergie et la quantité <strong>de</strong> mouvement d’une particule . . . . . . 67<br />
5.5 Particules <strong>de</strong> masse nulle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />
5.6 Loi fondamentale <strong>de</strong> la dynamique . . . . . . . . . . . . . . . . . . . . . . . . . 68<br />
5.7 Particule chargée dans un champ électromagnétique . . . . . . . . . . . . . . . . 71<br />
5.8 Un exemple : mouvement d’une charge dans un champ magnétique constant<br />
uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72<br />
6 Dynamique relativiste (II) 75<br />
6.1 Quadri-vecteur vitesse unitaire d’une particule . . . . . . . . . . . . . . . . . . . 75<br />
6.2 Quadrivecteur impulsion-énergie . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />
6.3 Quadrivecteur accélération . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />
6.4 Loi <strong>de</strong> la dynamique en formalisme quadridimensionnel . . . . . . . . . . . . . . 75<br />
6.5 Dynamique <strong>de</strong>s milieux continus . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />
7 Gravitation et relativité 76<br />
7.1 La théorie newtonienne <strong>de</strong> la gravitation . . . . . . . . . . . . . . . . . . . . . . 76<br />
7.2 Analyse critique <strong>de</strong> la théorie newtonienne . . . . . . . . . . . . . . . . . . . . . 79<br />
7.3 Introduction <strong>de</strong>s théories métriques . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />
7.4 Une conséquence <strong>de</strong> l’approximation newtonienne : l’effet Doppler gravitationnel 86<br />
7.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89<br />
8 Notion d’approximation postnewtonienne <strong>de</strong>s théories métriques 90<br />
8.1 Notion d’approximation postnewtonienne . . . . . . . . . . . . . . . . . . . . . . 90<br />
8.2 Quels termes faut-il retenir à l’approximation postnewtonienne ? . . . . . . . . . 92<br />
8.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />
9 Quelques effets classiques prévus par les théories métriques 95<br />
9.1 Temps <strong>de</strong> propagation d’un rayon lumineux entre <strong>de</strong>ux points . . . . . . . . . . 95<br />
9.2 Équations <strong>de</strong>s géodésiques d’une métrique à symétrie sphérique statique . . . . . 100<br />
9.3 Déviation <strong>de</strong> la lumière par une masse à symétrie sphérique . . . . . . . . . . . . 102<br />
9.4 Avance séculaire du périhélie d’une planète . . . . . . . . . . . . . . . . . . . . . 105<br />
9.5 Que faire pour aller plus loin ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />
10 La relativité générale 112<br />
10.1 Les équations d’Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112<br />
10.2 La métrique <strong>de</strong> Schwarzschild extérieure . . . . . . . . . . . . . . . . . . . . . . 115<br />
10.3 Forme isotropique <strong>de</strong> la métrique <strong>de</strong> Schwarzschild . . . . . . . . . . . . . . . . . 117<br />
10.4 Géodésiques <strong>de</strong> la métrique <strong>de</strong> Schwarzschild . . . . . . . . . . . . . . . . . . . . 118<br />
10.5 Déviation <strong>de</strong>s rayons lumineux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121<br />
10.6 Avance séculaire du périhélie d’une planète . . . . . . . . . . . . . . . . . . . . . 123<br />
10.7 Horizon et trou noir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125<br />
2
A Espaces affines. Espaces euclidiens 128<br />
A.1 Espaces affines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128<br />
A.1.1 Définition d’un espace affine . . . . . . . . . . . . . . . . . . . . . . . . . 128<br />
A.1.2 Repère d’un espace affine . . . . . . . . . . . . . . . . . . . . . . . . . . . 129<br />
A.1.3 Changements <strong>de</strong> repères . . . . . . . . . . . . . . . . . . . . . . . . . . . 130<br />
A.2 Espace euclidien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131<br />
A.2.1 Définition d’un espace euclidien . . . . . . . . . . . . . . . . . . . . . . . 131<br />
A.2.2 Espace euclidien rapporté à un repère orthonormé . . . . . . . . . . . . . 132<br />
A.3 Espace proprement euclidiens . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133<br />
A.4 Espace-temps <strong>de</strong> Minkowski <strong>de</strong> dimension n . . . . . . . . . . . . . . . . . . . . 133<br />
B Analyse tensorielle 135<br />
B.1 Caractère non intrinsèque <strong>de</strong> la dérivation partielle usuelle . . . . . . . . . . . . 135<br />
B.2 Dérivation covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136<br />
B.3 Expression explicite <strong>de</strong> la dérivée covariante d’un champ <strong>de</strong> tenseurs arbitraire . 137<br />
B.4 Connexion linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138<br />
B.5 Conséquences fondamentales <strong>de</strong>s formules <strong>de</strong> transformation <strong>de</strong>s coefficients <strong>de</strong><br />
connexion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140<br />
B.6 Dérivée covariante totale le long d’une courbe . . . . . . . . . . . . . . . . . . . 142<br />
B.7 Transport par parallélisme le long d’une courbe . . . . . . . . . . . . . . . . . . 143<br />
B.8 Courbes autoparallèles d’une connexion . . . . . . . . . . . . . . . . . . . . . . . 144<br />
C Connexion et courbure sur une variété riemannienne 146<br />
C.1 Connexion riemannienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146<br />
C.2 Géodésiques d’une variété riemannienne . . . . . . . . . . . . . . . . . . . . . . 149<br />
C.3 Tenseur <strong>de</strong> courbure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153<br />
C.4 Propriétés du tenseur <strong>de</strong> courbure . . . . . . . . . . . . . . . . . . . . . . . . . . 156<br />
C.5 Tenseur <strong>de</strong> Ricci. Scalaire <strong>de</strong> courbure . . . . . . . . . . . . . . . . . . . . . . . 157<br />
C.6 Opérateurs différentiels sur une variété riemannienne . . . . . . . . . . . . . . . 157<br />
C.7 Quelques relations utiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160<br />
C.8 Applications à l’espace euclidien à 3 dimensions . . . . . . . . . . . . . . . . . . 161<br />
D Quantité <strong>de</strong> mouvement et énergie cinétique d’une particule isolée 163<br />
D.1 Détermination <strong>de</strong> la fonction M <br />
m, v2<br />
c2 <br />
. . . . . . . . . . . . . . . . . . . . . . 165<br />
<br />
D.2 Détermination <strong>de</strong> la fonction Ec m, v2<br />
c2 <br />
. . . . . . . . . . . . . . . . . . . . . . . 166<br />
Bibliographie sommaire 168<br />
3
Chapitre 1<br />
Notions préliminaires<br />
Nous présentons dans ce chapitre un certain nombre <strong>de</strong> notions ou d’hypothèses fondamentales<br />
que l’on croit souvent spécifiques <strong>de</strong>s théories relativistes, alors qu’elles sont en réalité<br />
parfaitement applicables aux conceptions galiléennes ou newtoniennes. Il en est ainsi <strong>de</strong> notions<br />
comme celle <strong>de</strong> variété <strong>de</strong>s événements ou <strong>de</strong> temps propre 1 , par exemple.<br />
1.1 Observateurs. Objets. Particules<br />
Observateurs.— Toute science <strong>de</strong> la nature suppose l’existence d’observateurs. De prime<br />
abord, la notion d’observateur est anthropomorphique : elle correspond bien entendu à l’existence<br />
d’êtres humains capables <strong>de</strong> percevoir le mon<strong>de</strong> et <strong>de</strong> communiquer entre eux. Mais pour<br />
les besoins <strong>de</strong> la physique, on doit élargir cette notion et lui donner une assise plus objective en<br />
considérant comme observateur tout système physique très localisé dans l’espace susceptible <strong>de</strong><br />
détecter, <strong>de</strong> mesurer, d’enregistrer tel ou tel type <strong>de</strong> phénomènes ou encore d’émettre ou recevoir<br />
<strong>de</strong>s signaux. Un appareil photo, un spectroscope, un détecteur <strong>de</strong> particules, une antenne radio,<br />
etc. peuvent être regardés comme <strong>de</strong>s observateurs.<br />
Objets.— Les objets sont les entités qui servent <strong>de</strong> sources communes aux mesures ou aux<br />
observations <strong>de</strong> plusieurs observateurs. La réunion <strong>de</strong> tous les objets constitue l’univers objectif.<br />
Particules.— Un grand nombre d’objets étudiés en physique peuvent être considérés comme<br />
composés d’objets plus simples. Tel est le cas d’un noyau atomique, d’une planète, d’une étoile,<br />
etc. Il existe cependant <strong>de</strong>s situations dans lesquelles, au moins pour une certaine classe d’observateurs,<br />
les objets d’étu<strong>de</strong> n’ont pas besoin d’être analysés (ou ne sont pas analysables) en<br />
termes <strong>de</strong> composants. On dit que <strong>de</strong> tels objets sont <strong>de</strong>s particules pour cette classe d’observateurs.<br />
On notera qu’un même objet peut être perçu soit comme une particule soit comme un<br />
ensemble <strong>de</strong> constituants selon la catégorie d’observateurs à laquelle on se réfère dans les<br />
modélisations. Un cosmologiste, par exemple, considère une galaxie comme une particule du<br />
gaz cosmique, alors qu’un astrophysicien voit cette galaxie comme un ensemble constitué <strong>de</strong><br />
1 Ce qui ne signifie pas que la définition du temps propre soit la même en relativité et en théorie newtonienne.<br />
4
milliards d’étoiles. Cette absence d’objectivité <strong>de</strong> la notion <strong>de</strong> particule nous rappelle que la notion<br />
d’échelle d’observation et <strong>de</strong> <strong>de</strong>scription est un présupposé indispensable <strong>de</strong> toute démarche<br />
scientifique et que toute théorie est un schématisation dont la validité est limitée 2 .<br />
1.2 Événements<br />
Événements.— Nos perceptions nous montrent que <strong>de</strong>s changements se produisent dans<br />
l’univers objectif. Lorsque ces changements sont soudains et affectent <strong>de</strong>s objets d’extension spatiale<br />
négligeable, on parle d’événements. Là encore, l’échelle d’observation joue un rôle crucial.<br />
Un cosmologiste peut considérer l’explosion d’une supernova comme un événement, alors qu’un<br />
astrophysicien cherchant à modéliser la vie <strong>de</strong>s étoiles massives voit dans un tel phénomène un<br />
ensemble prodigieusement complexe d’événements nucléaires...<br />
Les changements affectant <strong>de</strong>s particules perçus comme parfaitement soudains peuvent<br />
être regardés comme <strong>de</strong>s événements ponctuels ou points-événements. Cette notion <strong>de</strong> pointévénement<br />
(ou événement en abrégé) est <strong>de</strong>venue centrale en physique avec l’avènement <strong>de</strong>s<br />
théories relativistes, et nous y ferons constamment appel dans ce cours.<br />
Selon notre intuition la plus banale, tout événement x peut se voir attribué une coordonnée<br />
“temporelle” ou date t et une localisation au moyen <strong>de</strong> trois coordonnées “spatiales”. Il est<br />
donc naturel <strong>de</strong> représenter tout événement par un point d’un espace mathématique à quatre<br />
dimensions que l’on désignera par V4.<br />
La modélisation la plus simple consisterait à poser que cet espace V4 est le produit cartésien<br />
d’une copie <strong>de</strong> IR représentant un axe <strong>de</strong> temps absolu par une copie d’un espace euclidien réel à<br />
trois dimensions E3 considéré comme l’espace physique universel, indépendant <strong>de</strong>s observateurs :<br />
V4 = IR×E3. Cependant, cette conception s’est avérée incompatible avec l’expérience et l’observation,<br />
et il a fallu l’abandonner. Aujourd’hui, on formule la physique relativiste sur <strong>de</strong>s espaces<br />
V4 qui ressemblent <strong>de</strong> manière seulement locale à l’espace ponctuel IR 4 . On bénéficie ainsi d’une<br />
généralité suffisante dans la construction tout en sauvegardant toutes les possibilités <strong>de</strong> l’analyse<br />
mathématique usuelle (dérivation, intégration, résolution <strong>de</strong> systèmes d’équations différentielles,<br />
champs <strong>de</strong> vecteurs, etc.). De tels espaces V4 sont appelés <strong>de</strong>s variétés différentielles réelles <strong>de</strong><br />
dimension 4.<br />
1.3 Notion <strong>de</strong> variété. Variété <strong>de</strong>s événements<br />
Nous ne chercherons pas ici à définir rigoureusement la notion <strong>de</strong> variété différentielle. Nous<br />
nous contenterons d’énoncer les propriétés d’une variété qu’il est indispensable <strong>de</strong> connaître<br />
pour comprendre la suite.<br />
La première propriété fondamentale est qu’à chaque point x0 ∈ V4 on peut associer un<br />
voisinage U <strong>de</strong> x0 qu’on peut “cartographier” sur l’espace IR 4 . On entend par là qu’il existe<br />
une bijection ϕ <strong>de</strong> U sur IR 4 . Ainsi, on peut attribuer à tout x <strong>de</strong> U un quadruplet et un<br />
seul <strong>de</strong> nombres réels ϕ(x) = (x 0 ,x 1 ,x 2 ,x 3 ) et réciproquement, à tout quadruplet <strong>de</strong> nombres<br />
2 Soulignons que les particules considérées ici comme <strong>de</strong>s objets sans structure discernable par une classe<br />
d’observateurs sont traités comme <strong>de</strong>s objets macroscopiques, et non comme <strong>de</strong>s objets <strong>de</strong> la microphysique.<br />
5
éels (x 0 ,x 1 ,x 2 ,x 3 ) correspond un et un seul point x <strong>de</strong> U, <strong>de</strong> sorte qu’on peut poser x =<br />
ϕ −1 (x 0 ,x 1 ,x 2 ,x 3 ). Le doublet (U,ϕ) constitué par le voisinage U et la bijection ϕ s’appelle une<br />
carte locale ou encore un système <strong>de</strong> coordonnées locales. U est appelé le domaine <strong>de</strong> la carte<br />
locale et les quatre nombres réels (x 0 ,x 1 ,x 2 ,x 3 ) sont les coordonnées locales du point x ∈ U.<br />
Pour abréger, on désignera désormais le quadruplet (x 0 ,x 1 ,x 2 ,x 3 ) par (x α ) (ou (x β ), ..., (x µ ),<br />
...), les indices grecs α, β, ..., µ, ... pouvant prendre les valeurs 0, 1, 2, 3.<br />
Voyons maintenant la secon<strong>de</strong> propriété fondamentale. Supposons que le point x considéré<br />
ci-<strong>de</strong>ssus appartienne également au domaine U ′ d’une autre carte locale (U ′ ,ϕ ′ ). Dans cette<br />
autre carte locale, x admet <strong>de</strong>s coordonnées locale ϕ ′ (x) = (x0′ ,x1′ ,x2′ ,x3′ ) = (xρ′ ) . Puisqu’il<br />
y a correspondance biunivoque entre un point et ses coordonnées locales dans une cartographie<br />
donnée, les coordonnées xρ′ sont <strong>de</strong>s fonctions <strong>de</strong>s coordonnées x µ et réciproquement les<br />
coordonnées x µ sont <strong>de</strong>s fonctions <strong>de</strong>s coordonnées xρ′ . On peut donc écrire<br />
et<br />
x ρ′<br />
= F ρ′<br />
(x 0 ,x 1 ,x 2 ,x 3 ) = F ρ′<br />
(x α ) (1.1)<br />
x µ = F µ (x 0′<br />
,x 1′<br />
,x 2′<br />
,x 3′<br />
) = F µ (x β′<br />
). (1.2)<br />
Les fonctions F ρ′ et F µ définissent ce qu’on appelle <strong>de</strong>s formules <strong>de</strong> transformation <strong>de</strong>s<br />
coordonnées locales.<br />
L’espace V4 est muni d’une structure <strong>de</strong> variété différentielle lorsque les fonctions F ρ′ (xα ) et<br />
F µ (xβ′ ) admettent <strong>de</strong>s dérivées partielles continues <strong>de</strong> n’importe quel ordre3 quelles que soient<br />
les cartes locales dont les domaines U et U ′ ont une intersection non vi<strong>de</strong>.<br />
Il faut noter que le caractère inversible <strong>de</strong>s fonctions F ρ′ et F µ nécessite en outre que<br />
les déterminants <strong>de</strong>s matrices jacobiennes ∂F ρ′ /∂x µ et ∂F µ /∂xρ′ soient = 0 en tout point <strong>de</strong><br />
l’intersection U ∩ U ′ . On supposera donc qu’en chaque point x ∈ U ∩ U ′<br />
ce qui équivaut à supposer<br />
dét<br />
dét<br />
<br />
ρ ∂F ′ <br />
∂x µ<br />
<br />
µ ∂F<br />
∂x σ′<br />
x<br />
x<br />
= 0, (1.3)<br />
= 0. (1.4)<br />
Désormais, nous supprimerons systématiquement le recours aux fonctions F µ et F ρ′ et nous<br />
écrirons les formules <strong>de</strong> transformation (1.1) et (1.2) sous la forme<br />
et<br />
Nous poserons en outre<br />
x ρ′<br />
∂xρ′ ρ′ ∂F<br />
= ,<br />
∂x µ ∂x µ<br />
= x ρ′<br />
(x µ ) (1.5)<br />
x µ = x µ (x ρ′<br />
). (1.6)<br />
∂x µ<br />
∂x σ′ =<br />
∂F µ<br />
∂x σ′ , (1.7)<br />
3 On dit que ces fonctions sont indéfiniment différentiables ou encore <strong>de</strong> classe C ∞ ). C’est pourquoi les<br />
variétés différentielles introduites ici <strong>de</strong>vraient être dites <strong>de</strong> classe C ∞ , mais nous omettrons systématiquement<br />
cette précision pour abréger.<br />
6
<strong>de</strong> sorte que les conditions (1.3) et (1.4) s’écrivent respectivement<br />
et<br />
dét<br />
dét<br />
<br />
ρ ∂x ′ <br />
∂x µ<br />
<br />
µ ∂x<br />
∂x σ′<br />
x<br />
x<br />
= 0 (1.8)<br />
= 0. (1.9)<br />
Les transformations <strong>de</strong> coordonnées indéfiniment différentiables vérifiant les conditions (1.3)-<br />
(1.4) ou (1.8)-(1.9) sont dites admissibles.<br />
La variété <strong>de</strong> dimension 4 la plus simple est évi<strong>de</strong>mment l’espace IR 4 muni <strong>de</strong> la carte<br />
locale (U,ϕ) dont le domaine U est IR 4 lui-même et ϕ est l’i<strong>de</strong>ntité. On parle toujours <strong>de</strong> cette<br />
structure lorsqu’on mentionne la variété IR 4 sans autre précision.<br />
Lorsque nous parlerons d’une variété V4 pour représenter l’espace <strong>de</strong>s points-événements,<br />
nous appellerons V4 une variété <strong>de</strong>s événements ou encore une variété fondamentale. L’espacetemps<br />
d’une théorie sera constitué par une telle variété munie d’une structure mathématique<br />
spécifique <strong>de</strong> la théorie considérée. Par exemple, l’espace-temps <strong>de</strong> la relativité restreinte est<br />
la variété IR 4 munie <strong>de</strong> la métrique <strong>de</strong> Minkowski. L’espace-temps générique <strong>de</strong> la relativité<br />
générale sera une variété V4 munie d’une métrique g dynamiquement liée au contenu énergétique<br />
<strong>de</strong> l’univers par les équations d’Einstein.<br />
1.4 Fonctions scalaires. Hypersurfaces<br />
En physique, il est indispensable <strong>de</strong> pouvoir utiliser <strong>de</strong>s fonctions. La définition et la manipulation<br />
<strong>de</strong>s fonctions sur une variété différentielle ne sont pas plus compliquées que sur l’espace<br />
géométrique usuel. Il faut simplement se souvenir que l’on procè<strong>de</strong> maintenant sur <strong>de</strong>s domaines<br />
<strong>de</strong> cartes locales, au lieu <strong>de</strong> l’espace tout entier. Cette remarque vaut pour toutes les notions<br />
que nous allons être amenés à définir ci-<strong>de</strong>ssous.<br />
Fonction scalaire.— Une fonction scalaire à valeurs réelles sur une variété différentielle<br />
V4 est une application f : V4 → IR. Très souvent, on se contentera d’appeler f une fonction<br />
(sur V4).<br />
Nous avons vu dans la section précé<strong>de</strong>nte qu’étant donné un point x arbitraire dans V4, il<br />
existe au moins une carte locale (U,ϕ) telle que x ∈ U. Soient (x 0 ,x 1 ,x 2 ,x 3 ) les coordonnées<br />
locales <strong>de</strong> x dans cette carte. Du fait que x = ϕ −1 (x 0 ,x 1 ,x 2 ,x 3 ), nous pouvons poser<br />
f(x) = f(ϕ −1 (x 0 ,x 1 ,x 2 ,x 3 )) = ¯ f(x α ). (1.10)<br />
L’étu<strong>de</strong> <strong>de</strong>s propriétés locales <strong>de</strong> la fonction f se ramène donc à l’étu<strong>de</strong> <strong>de</strong>s propriétés <strong>de</strong> la<br />
fonction <strong>de</strong> quatre variables réelles ¯ f(x α ). La fonction ¯ f est l’expression <strong>de</strong> f en coordonnées<br />
locales (x α ) 4 .<br />
4 Dans le langage <strong>de</strong> la théorie <strong>de</strong>s applications, on a ¯ f = f ◦ ϕ −1 .<br />
7
Bien entendu, si x appartient également au domaine U ′ d’une autre carte locale (U ′ ,ϕ ′ ), on<br />
pourra écrire aussi<br />
les x β′<br />
f(x) = ˆ f(x β′<br />
), (1.11)<br />
étant les coordonnées locales <strong>de</strong> x dans la carte locale (U ′ ,ϕ ′ ), et on aura bien entendu<br />
¯f(x α ) = ˆ f(x β′<br />
).<br />
Fonction différentiable.— Une fonction scalaire f est dite différentiable au point x <strong>de</strong><br />
coordonnées locales xα si son expression ¯ f(xα ) admet en x <strong>de</strong>s dérivées partielles par rapport<br />
à chacune <strong>de</strong>s variables xα .<br />
La fonction f est dite différentiable sur la variété V4 si elle est différentiable en chaque point<br />
x <strong>de</strong> V4. La règle <strong>de</strong> dérivation <strong>de</strong>s fonctions composées montre immédiatement que le caractère<br />
différentiable <strong>de</strong> f en chaque point x ne dépend pas du choix <strong>de</strong> carte locale.<br />
Pour ne pas nous encombrer <strong>de</strong> lettres surlignées ou surmontées d’un chapeau, nous poserons<br />
désormais <br />
∂f<br />
∂xα <br />
=<br />
x<br />
¯ f,xα(xµ ) (1.12)<br />
où ¯ f,x α est la dérivée partielle <strong>de</strong> ¯ f par rapport à x α . Bien entendu, on écrira aussi bien<br />
∂f<br />
∂x β′<br />
<br />
x<br />
= ˆ f ,xβ ′(xν′ ) (1.13)<br />
Le théorème <strong>de</strong> dérivation <strong>de</strong>s fonctions composées fournit immédiatement les relations<br />
∂f<br />
∂x β′<br />
qui peuvent bien entendu s’inverser :<br />
∂f<br />
∂x α<br />
<br />
<br />
x<br />
x<br />
=<br />
=<br />
3<br />
<br />
α ∂x<br />
α=0<br />
∂x β′<br />
3<br />
<br />
β ∂x ′ <br />
β ′ =0<br />
∂x α<br />
x<br />
x<br />
∂f<br />
∂x α<br />
∂f<br />
∂x β′<br />
<br />
<br />
x<br />
(1.14)<br />
. (1.15)<br />
x<br />
Hypersurface <strong>de</strong> V4.— Dans l’espace tridimensionnel usuel, on définit une surface par une<br />
équation du type<br />
f(x,y,z) = K,<br />
où K est une constante réelle. La généralisation <strong>de</strong> cette notion s’effectue sans difficulté.<br />
On appellera hypersurface <strong>de</strong> V4 l’ensemble <strong>de</strong>s points x tels que f(x) = K, f étant une<br />
fonction scalaire sur V4 et K une constante. En coordonnées locales x α , l’équation implicite <strong>de</strong><br />
l’hypersurface s’écrit<br />
¯f(x α ) = K. (1.16)<br />
L’hypersurface sera dite différentiable si f est différentiable.<br />
Le préfixe hyper traduit simplement le fait que l’ensemble <strong>de</strong>s points <strong>de</strong> V4 vérifiant la<br />
relation (1.16) est un espace <strong>de</strong> points tridimensionnel, au lieu d’être un espace bidimensionnel<br />
comme l’est une surface <strong>de</strong> l’espace usuel.<br />
8
1.5 Courbe différentiable sur une variété<br />
On appelle courbe paramétrée sur la variété V4 une application C : λ → C(λ) <strong>de</strong> IR dans V4.<br />
En coordonnées locales x µ , un point C(λ) est représenté par quatre nombres (C µ (λ)). On dit<br />
que les quatre équations<br />
x µ = C µ (λ) (1.17)<br />
constituent les équations paramétriques locales <strong>de</strong> la courbe C.<br />
La courbe C est dite différentiable si les fonctions C µ (λ) sont <strong>de</strong>s fonctions différentiables<br />
<strong>de</strong> λ.<br />
1.6 Coïnci<strong>de</strong>nce d’événements. Ordre temporel<br />
Après cet intermè<strong>de</strong> mathématique, revenons à la physique.<br />
Coïnci<strong>de</strong>nce d’événements.— Nous considérons comme primitive la notion <strong>de</strong> coïnci<strong>de</strong>nce<br />
<strong>de</strong> <strong>de</strong>ux événements : <strong>de</strong>ux événements a et b seront dits coïnci<strong>de</strong>r s’ils surviennent à la<br />
même place et au même moment. La notion <strong>de</strong> simultanéité impliquée dans cette définition est<br />
objective parce que a et b surviennent au même endroit. En revanche, il est impossible d’affirmer<br />
que <strong>de</strong>ux événements a et b se produisant en <strong>de</strong>ux lieux différents sont simultanés sans<br />
convention préalable.<br />
Ordre temporel.— Les notions <strong>de</strong> particules et <strong>de</strong> coïnci<strong>de</strong>nce d’événements permettent<br />
<strong>de</strong> définir indépendamment d’une convention ce que l’on doit entendre par l’affirmation “a<br />
précè<strong>de</strong> b 5 . Pour cela, adoptons comme axiome que les seuls événements susceptibles d’affecter<br />
une particule sont soit l’apparition <strong>de</strong> cette particule, soit sa disparition 6 . Cet axiome s’accor<strong>de</strong><br />
bien avec la notion <strong>de</strong> particule considérée comme une entité sans structure par une certaine<br />
classe d’observateurs.<br />
Nous pouvons maintenant définir la relation “a précè<strong>de</strong> b” comme signifiant qu’il existe une<br />
séquence <strong>de</strong> particules P1, P2, ..., Pn telle que a coïnci<strong>de</strong> avec l’apparition <strong>de</strong> P1, la disparition<br />
<strong>de</strong> P1 coïnci<strong>de</strong> avec l’apparition <strong>de</strong> P2, ..., la disparition <strong>de</strong> Pn coïnci<strong>de</strong> avec b. Autrement dit, a<br />
précè<strong>de</strong> b si et seulement si b est la disparition d’une chaîne ininterrompue <strong>de</strong> particules apparaissant<br />
en a (fig. 1.1). Cette définition implique évi<strong>de</strong>mment que l’apparition d’une particule<br />
précè<strong>de</strong> toujours sa disparition. Elle entraîne également <strong>de</strong> manière immédiate que la relation<br />
a précè<strong>de</strong> b est transitive : si a précè<strong>de</strong> b et b précè<strong>de</strong> c, alors a précè<strong>de</strong> c. La relation a précè<strong>de</strong><br />
b est donc une relation d’ordre, que nous noterons :<br />
a b ⇐⇒ a précè<strong>de</strong> b. (1.18)<br />
On peut bien entendu définir la relation “a précè<strong>de</strong> b au sens strict”, soit a ≺ b, par<br />
a ≺ b ⇐⇒ a b et a = b. (1.19)<br />
5 Voir par ex. S. A. Basri, A Deductive Theory of Space and Time (North-Holland, Amsterdam, 1966).<br />
6 Nous préférons les termes d’apparition et disparition plutôt que création et annihilation pour rester cohérents<br />
avec la vision essentiellement macroscopique adoptée ici.<br />
9
a<br />
P<br />
2<br />
P 1<br />
P<br />
3<br />
Fig. 1.1 – L’événement a précè<strong>de</strong> l’événement b.<br />
En nous inspirant d’une terminologie couramment employée en relativité, nous dirons qu’il<br />
existe une séparation du genre temps (ou encore temporelle) entre <strong>de</strong>ux points-événements a et b<br />
si a précè<strong>de</strong> b ou si b précè<strong>de</strong> a. Plus généralement, nous dirons qu’une courbe <strong>de</strong> l’espace-temps<br />
est du genre temps si quels que soient les points x et y <strong>de</strong> cette courbe infiniment voisins, x et<br />
y ont une séparation du genre temps.<br />
1.7 Horloges standard. Temps propre. Ligne d’univers<br />
d’une particule<br />
Horloges standard.— Du point <strong>de</strong> vue intuitif, une horloge est un système physique<br />
susceptible <strong>de</strong> délivrer localement un signal regardé comme rigoureusement périodique et <strong>de</strong><br />
compter les pério<strong>de</strong>s. Une horloge permet donc non seulement <strong>de</strong> déterminer <strong>de</strong>s intervalles<br />
<strong>de</strong> temps, mais aussi d’assigner <strong>de</strong>s dates à <strong>de</strong>s événements survenant à l’horloge elle-même, à<br />
condition bien entendu <strong>de</strong> prendre un événement <strong>de</strong> l’histoire <strong>de</strong> l’horloge comme origine du<br />
comptage <strong>de</strong>s pério<strong>de</strong>s.<br />
Pour être plus précis et faire le lien avec ce qui a été exposé plus haut, nous posons qu’une<br />
horloge H est un système physique très localisé qui génère et compte une séquence d’événements<br />
a1, a2, ..., an, ... ordonnés par la relation d’ordre ≺ : a1 ≺ a2 ≺ ... ≺ an ≺ .... Les horloges<br />
considérées ici sont <strong>de</strong>s idéalisations d’horloges réelles, dont l’exactitu<strong>de</strong> et la stabilité seraient<br />
tenues pour parfaites. De plus, nous supposons qu’elles sont toutes rigoureusement <strong>de</strong> même<br />
construction, et fondées sur le même type d’atomes s’il s’agit d’horloges atomiques, par exemple.<br />
Nous dirons que ces horloges sont <strong>de</strong>s horloges standards, dont l’ensemble sera noté Hs.<br />
Les intervalles <strong>de</strong> temps séparant <strong>de</strong>ux événements consécutifs ai, ai+1 sont alors regardés<br />
comme égaux par définition. On appelle pério<strong>de</strong> propre <strong>de</strong> l’horloge H la durée <strong>de</strong> ces intervalles<br />
<strong>de</strong> temps égaux. On définit une unité <strong>de</strong> temps propre comme la durée d’un nombre entier N<br />
10<br />
b<br />
P<br />
4<br />
P<br />
5
fixé <strong>de</strong> pério<strong>de</strong>s consécutives. L’entier N est appelé la fréquence propre <strong>de</strong> l’horloge. Mesurée<br />
avec l’unité <strong>de</strong> temps choisie, la valeur commune <strong>de</strong> toutes les pério<strong>de</strong>s est le nombre T donné<br />
par<br />
T = 1<br />
. (1.20)<br />
N<br />
Temps propre.— On admet comme un axiome qu’à toute particule P on peut associer une<br />
horloge standard HP ∈ H coïncidant avec P à tout instant : on dit que P et HP sont comouvantes.<br />
Nous dirons que le temps τ généré par HP <strong>de</strong>puis un événement origine a0 constitue<br />
par définition le temps propre <strong>de</strong> la particule P écoulé <strong>de</strong>puis l’événement a0 appartenant à<br />
l’histoire <strong>de</strong> la particule (fig. 3). En principe, il faudrait préciser que le temps propre ainsi<br />
défini est relatif à la classe d’horloges standards Hs, mais on admettra ici que toutes les classes<br />
d’horloges standards réalisent le même temps propre, à un changement d’unité près bien entendu.<br />
Il faut toutefois noter que cette unicité <strong>de</strong> la réalisation du temps propre ne va pas <strong>de</strong><br />
soi et fait actuellement l’objet <strong>de</strong> nombreuses recherches tant théoriques qu’expérimentales.<br />
Lignes d’univers.— Les notions <strong>de</strong> variété <strong>de</strong>s événements et <strong>de</strong> temps propre introduites<br />
ci-<strong>de</strong>ssus permettent <strong>de</strong> définir ce qu’on appelle la ligne d’univers d’une particule.<br />
Définition 1.7.1 Soit P une particule. On appelle ligne d’univers <strong>de</strong> cette particule la courbe<br />
CP <strong>de</strong> la variété fondamentale V4 qui au temps propre τ <strong>de</strong> la particule fait correspondre le<br />
point-événement occupé par la particule à l’instant τ.<br />
La ligne d’univers d’une particule est donc une courbe paramétrée par le temps propre <strong>de</strong><br />
la particule 7 . Il résulte <strong>de</strong> ce qui a été dit plus haut que la ligne d’univers d’une particule<br />
quelconque est toujours une courbe du genre temps. On appelle aussi cette ligne l’histoire <strong>de</strong><br />
la particule.<br />
Il est évi<strong>de</strong>nt que quels que soient les points-événements a et b sur CP on a soit (i) a coïnci<strong>de</strong><br />
avec b, soit (ii) a précè<strong>de</strong> b, soit (iii) b précè<strong>de</strong> a. Il est dès lors clair que la relation a précè<strong>de</strong> b<br />
est une relation d’ordre sur la ligne d’univers <strong>de</strong> chaque particule.<br />
Bien entendu, la notion <strong>de</strong> ligne d’univers s’étend sans difficulté aux observateurs, dans<br />
la mesure où on peut les assimiler à <strong>de</strong>s objets d’extension spatiale négligeable, donc à <strong>de</strong>s<br />
particules.<br />
7 En fait, on prend souvent comme paramètre le temps propre multiplié par une constante bien choisie.<br />
En relativité, par exemple, on prend généralement comme paramètre la quantité s = cτ, où c est la vitesse<br />
invariante.<br />
11
Chapitre 2<br />
Champs <strong>de</strong> vecteurs. Champs <strong>de</strong><br />
tenseurs<br />
La <strong>de</strong>scription <strong>de</strong>s interactions physiques nécessite l’emploi <strong>de</strong> champs <strong>de</strong> vecteurs et <strong>de</strong><br />
champs <strong>de</strong> tenseurs sur la variété <strong>de</strong>s événements. Le but <strong>de</strong> ce chapitre est <strong>de</strong> dégager les<br />
définitions et les règles <strong>de</strong> calcul algébrique <strong>de</strong> ces champs. Ici encore, nous nous contenterons<br />
<strong>de</strong> développer une approche intuitive.<br />
2.1 Champs <strong>de</strong> vecteurs<br />
Considérons <strong>de</strong>ux points-événements infiniment voisins situés dans un même domaine <strong>de</strong><br />
carte locale U. Pour faire court, nous désignerons ces points respectivement par x et x + dx.<br />
Ces points ont pour coordonnées locales respectives x µ et x µ +dx µ . Admettons comme point <strong>de</strong><br />
départ intuitif que les accroissements infiniment petits dx µ peuvent être considérés comme les<br />
composantes d’un vecteur infinitésimal. Effectuons une transformation <strong>de</strong> coordonnées locales<br />
admissibles telle que (1.5). En différenciant, on obtient les relations<br />
dx ρ′<br />
3<br />
<br />
ρ ∂x<br />
=<br />
µ=0<br />
′<br />
∂x µ<br />
<br />
dx<br />
x<br />
µ , (2.1)<br />
qui peuvent être lues comme une loi <strong>de</strong> transformation <strong>de</strong>s composantes d’un vecteur.<br />
Dans ce qui suit, toutes les opérations sont effectuées en un point x donné. C’est pourquoi<br />
nous omettrons désormais l’indice x dans les formules <strong>de</strong> transformation. En outre, nous<br />
utiliserons systématiquement la convention suivante pour alléger l’écriture :<br />
Convention d’Einstein.— Toute expression dans laquelle figure un même indice une fois<br />
en position haute et une fois en position basse doit être comprise comme une somme effectuée<br />
sur l’indice répété. Ainsi :<br />
AµB µ 3<br />
= AµB<br />
µ=0<br />
µ , AµνB µν 3 3<br />
= AµνB<br />
µ=0 ν=0<br />
µν , etc. (2.2)<br />
12
Nous écrirons donc les relations (2.1) sous la forme<br />
dx ρ′<br />
= ∂xρ′<br />
∂x µ dxµ . (2.3)<br />
La transformation inverse <strong>de</strong> (2.3) est obtenue en échangeant les rôles <strong>de</strong>s x µ et <strong>de</strong>s xρ′ encore en différenciant (1.6) :<br />
ou<br />
dx µ = ∂xµ<br />
. (2.4)<br />
∂xσ′ dx σ′<br />
En substituant (2.3) dans (2.4) après avoir changé l’indice ρ ′ en σ ′ , il vient<br />
ce qui entraîne les relations<br />
dx µ = ∂xµ<br />
∂x σ′<br />
∂x µ<br />
∂xσ′ où δ µ ν est le système <strong>de</strong> quantités défini par<br />
∂xσ′ dxν<br />
∂xν ∂x σ′<br />
∂x ν = δµ ν , (2.5)<br />
δ µ ν = 1 si µ = ν, δ µ ν = 0 si µ = ν. (2.6)<br />
Lorsqu’on échange les rôles <strong>de</strong>s coordonnées x µ et xρ′ , il vient :<br />
∂x ρ′<br />
∂x ν<br />
∂x ν<br />
∂x σ′ = δ σ′<br />
ρ ′ , (2.7)<br />
où δσ′ ρ ′ est défini par la même convention que δµ ν.<br />
Les relations (2.5) et (2.7) sont fondamentales en analyse tensorielle, comme on aura l’occasion<br />
<strong>de</strong> le voir dans la suite. On notera qu’elles expriment simplement que les matrices<br />
jacobiennes (∂x µ /∂xσ′ ) et (∂xρ′ /∂xν ) sont inverses l’une <strong>de</strong> l’autre.<br />
Ce qui précè<strong>de</strong> nous conduit à proposer la définition suivante.<br />
Définition 2.1.1 On appelle champ <strong>de</strong> vecteurs sur un domaine <strong>de</strong> V4 tout objet représenté<br />
en coordonnées locales x α par un système <strong>de</strong> fonctions V µ (x) qui se transforment selon la loi<br />
V ρ′<br />
(x) = ∂xρ′<br />
∂x µ V µ (x) (2.8)<br />
lorsqu’on effectue le changement <strong>de</strong> coordonnées locales admissibles défini par (1.5).<br />
En échangeant le rôle <strong>de</strong> coordonnées x µ et xρ′ , on obtient la loi <strong>de</strong> transformation :<br />
V µ (x) = ∂xµ<br />
∂x ρ′ V ρ′<br />
(x). (2.9)<br />
Les fonctions V µ (x) sont par définition les composantes du champ <strong>de</strong> vecteurs V dans le<br />
système <strong>de</strong> coordonnées locales x α .<br />
13
Vecteur tangent à une courbe.— Revenons à la courbe C définie par les équations<br />
paramétriques (1.17) dans le domaine U d’ un système <strong>de</strong> coordonnées locales x µ , les fonctions<br />
C µ (λ) étant supposées différentiables. Considérons un point x0 <strong>de</strong> la courbe C correspondant à<br />
une valeur λ0 du paramètre et examinons comment se transforment les quatre quantités<br />
v µ x0 =<br />
<br />
µ dC (λ)<br />
dλ<br />
λ0<br />
(2.10)<br />
lors d’un changement <strong>de</strong> coordonnées locales défini par (1.5). Les équations paramétriques <strong>de</strong><br />
la courbe C sont dans le nouveau système <strong>de</strong> coordonnées<br />
où les fonctions Cρ′ (λ) sont définies par<br />
x ρ′<br />
= C ρ′<br />
(λ),<br />
C ρ′<br />
(λ) = x ρ′<br />
(C α (λ)).<br />
D’après le théorème <strong>de</strong> dérivation <strong>de</strong>s fonctions composées, les quantités<br />
sont données par<br />
v ρ′<br />
x0 =<br />
v ρ′<br />
x0 =<br />
dC ρ ′<br />
(λ)<br />
dλ<br />
<br />
ρ ∂x ′ <br />
∂x µ<br />
x0<br />
<br />
λ0<br />
v µ x0 . (2.11)<br />
La comparaison <strong>de</strong> cette loi <strong>de</strong> transformation avec la formule (2.8) montre que les quantités<br />
v α x0 définies par (2.10) sont les composantes d’un vecteur en x0. Ce vecteur est appelé le vecteur<br />
tangent en x0 à la courbe paramétrée C.<br />
2.2 Champs <strong>de</strong> vecteurs covariants<br />
Il existe cependant un autre type d’objets que l’on considère aussi comme “vectoriels” bien<br />
qu’ils obéissent à une loi <strong>de</strong> transformation différente <strong>de</strong> (2.8). Pour le voir, donnons-nous une<br />
fonction Φ définie sur V4. Les composantes du gradient <strong>de</strong> Φ sont définies en coordonnées locales<br />
x µ par<br />
(gradΦ) µ = ∂Φ<br />
. (2.12)<br />
∂x µ<br />
Examinons comment se transforment ces composantes lorsqu’on effectue le changement<br />
<strong>de</strong> coordonnées locales défini par (1.5). En utilisant le théorème <strong>de</strong> dérivation <strong>de</strong>s fonctions<br />
composées, il vient :<br />
∂Φ<br />
∂xρ′ = ∂<br />
∂xρ′ Φ(x µ (x σ′<br />
)) = ∂xµ<br />
∂xρ′ ∂Φ<br />
∂x µ<br />
d’où on déduit la loi <strong>de</strong> transformation<br />
(gradΦ) ρ ′ = ∂xµ<br />
∂x ρ′ (gradΦ) µ . (2.13)<br />
14
En échangeant les rôles <strong>de</strong>s coordonnées x µ et xρ′ , on obtient :<br />
(gradΦ) µ = ∂xρ′<br />
∂x µ (gradΦ) ρ ′ . (2.14)<br />
Ces lois <strong>de</strong> transformation sont différentes <strong>de</strong>s lois (2.3 et (2.4). Nous sommes ainsi conduits<br />
à définir un nouveau type <strong>de</strong> champs vectoriels.<br />
Définition 2.2.1 On appelle champ <strong>de</strong> vecteurs covariants sur un domaine <strong>de</strong> V4 un objet φ<br />
représenté en coordonnées locales xα par un système <strong>de</strong> fonctions φµ(x) qui se transforment<br />
selon la loi<br />
∂xµ<br />
φρ ′(x) =<br />
∂xρ′ φµ(x) (2.15)<br />
lorsqu’on effectue le changement <strong>de</strong> coordonnées locales admissibles défini par (1.6).<br />
En échangeant le rôle <strong>de</strong> coordonnées x µ et xρ′ , on obtient évi<strong>de</strong>mment :<br />
φµ(x) = ∂xρ′<br />
φρ ′(x). (2.16)<br />
∂x µ<br />
Les fonctions φµ sont les composantes du champ <strong>de</strong> vecteurs covariants 1 φ dans le système<br />
<strong>de</strong> coordonnées locales x α .<br />
2.3 Définition générale <strong>de</strong>s champs <strong>de</strong> tenseurs<br />
Donnons-nous <strong>de</strong>ux champs <strong>de</strong> vecteurs X µ et Y ν et examinons comment se transforment<br />
les 4 2 = 16 produits U λµ = X λ Y µ lorsqu’on effectue un changement <strong>de</strong> coordonnées locales. Il<br />
vient d’après (2.8) :<br />
X ρ′<br />
Y σ′<br />
= ∂xρ′ ∂xσ′<br />
Xλ<br />
∂xλ ∂x µ Y µ = ∂xρ′<br />
∂xλ ∂xσ′ ∂x µ XλY µ . (2.17)<br />
Remplaçons XλY µ par Uλµ dans le troisième membre <strong>de</strong> (2.17) et posons Uρ′ σ ′<br />
On voit que les quantités Uλµ se transforment selon la loi<br />
U ρ′ σ ′<br />
= Xρ′ Y σ′ .<br />
= ∂xρ′<br />
∂xλ ∂xσ′ ∂x µ Uλµ . (2.18)<br />
Donnons-nous en outre un champ <strong>de</strong> vecteurs covariants φν. En utilisant (2.15) et (2.17),<br />
on voit immédiatement que les 4 3 = 64 quantités W λµ ν = X λ Y µ φν se transforment selon la loi<br />
W ρ′ σ ′ ∂xρ′<br />
τ ′ =<br />
∂xλ ∂xσ′ ∂x µ<br />
∂x ν<br />
∂x τ ′ W λµ ν. (2.19)<br />
Nous sommes ainsi conduits à considérer une classe d’objets mathématiques bien plus<br />
générale que la classe <strong>de</strong>s champs <strong>de</strong> vecteurs contravariants ou covariants. Ces objets nouveaux<br />
sont les champs <strong>de</strong> tenseurs, que l’on peut définir comme suit.<br />
1 Un vecteur covariant est aussi appelé un covecteur.<br />
15
Définition 2.3.1 On appelle champ <strong>de</strong> tenseurs k fois covariants et l fois contravariants sur<br />
un domaine <strong>de</strong> V4 tout objet T représenté en coordonnées locales xα par un système <strong>de</strong> 4k+l ν1...νl<br />
fonctions T (x) qui se transforment selon la loi<br />
µ1...µk<br />
T<br />
ρ ′ 1 ...ρ′ k<br />
σ ′ 1 ...σ′ l<br />
(x) = ∂xµ1<br />
∂x ρ′ 1<br />
· · · ∂xµk<br />
∂x ρ′ k<br />
∂xσ′ 1<br />
∂xν1 · · · ∂xσ′ l<br />
∂xνl ν1...νl Tµ1...µk<br />
(x) (2.20)<br />
lorsqu’on effectue le changement <strong>de</strong> coordonnées locales admissibles défini par (1.5) et (1.6).<br />
On dit encore que le champ <strong>de</strong> tenseurs T considéré est <strong>de</strong> type (k,l). La somme k + l est<br />
appelée l’ordre du tenseur T.<br />
ν1...νl<br />
Les quantités Tµ1...µk<br />
(x) sont appelées les composantes en x du champ <strong>de</strong> tenseurs T<br />
dans les coordonnées locales xα .<br />
On obtient en échangeant les rôles <strong>de</strong>s coordonnées x µ et xρ′ :<br />
ν1...νl<br />
µ1...µk (x) = ∂xρ′ 1<br />
∂x µ1 · · · ∂xρ′ k<br />
∂x µk<br />
∂xν1 ∂xσ′ · · ·<br />
1<br />
∂xνl<br />
∂xσ′ l<br />
T<br />
T<br />
ρ ′ 1 ...ρ′ k<br />
σ ′ 1 ...σ′ l<br />
(x). (2.21)<br />
Selon la définition 2.3.1, un champ <strong>de</strong> tenseurs 0 fois covariants et une fois contravariants<br />
peut être considéré comme un champ <strong>de</strong> vecteurs. C’est pourquoi, par abus <strong>de</strong> langage, on<br />
appelle souvent champs <strong>de</strong> vecteurs contravariants les champs <strong>de</strong> vecteurs introduits dans<br />
la définition 1. Cette terminologie a l’avantage <strong>de</strong> bien distinguer les champs <strong>de</strong> vecteurs<br />
proprement dits <strong>de</strong>s champs <strong>de</strong> vecteurs covariants et, pour cette raison, nous l’utiliserons<br />
fréquemment.<br />
Il résulte également <strong>de</strong> la définition 2.3.1 qu’un champ <strong>de</strong> tenseurs une fois covariants et 0<br />
fois contravariants peut être considéré comme un champ <strong>de</strong> vecteurs covariants.<br />
Enfin, pour la généralité <strong>de</strong>s théorèmes, les fonctions scalaires seront regardées comme <strong>de</strong>s<br />
champs <strong>de</strong> tenseurs <strong>de</strong> type (0, 0).<br />
Par souci <strong>de</strong> concision, nous appellerons souvent les champs <strong>de</strong> vecteurs ou <strong>de</strong> tenseurs<br />
simplement “vecteurs” ou “tenseurs”.<br />
2.4 Exemples <strong>de</strong> champs <strong>de</strong> tenseurs<br />
Les quantités U λµ et W λµ ν définies dans la section précé<strong>de</strong>nte sont <strong>de</strong>s exemples <strong>de</strong> champs<br />
<strong>de</strong> tenseurs engendrés par <strong>de</strong>s produits <strong>de</strong> composantes <strong>de</strong> vecteurs contravariants ou covariants.<br />
Il existe toutefois une infinité d’autres champs <strong>de</strong> tenseurs qui ne résultent pas <strong>de</strong> multiplications<br />
<strong>de</strong> composantes <strong>de</strong> champs <strong>de</strong> vecteurs ou <strong>de</strong> covecteurs. Nous donnons ci-<strong>de</strong>ssous <strong>de</strong>ux exemples<br />
qui nous seront particulièrement utiles.<br />
Tenseur <strong>de</strong> Kronecker.— Considérons le système <strong>de</strong> fonctions K β α(x) définies par<br />
K β α(x) = δ β α. (2.22)<br />
On vérifiera facilement que le système <strong>de</strong>s K β α(x) est un champ <strong>de</strong> tenseurs, qu’on appelle<br />
le champ <strong>de</strong> tenseurs <strong>de</strong> Kronecker d’ordre 2. Par abus <strong>de</strong> langage, on désigne le champ <strong>de</strong><br />
tenseurs K β α(x) par δ β α.<br />
16
Tenseur métrique sur V4.— On définit une métrique sur V4 par la donnée en chaque<br />
point x d’une forme quadratique <strong>de</strong> différentielles<br />
ds 2 = gµν(x α )dx µ dx ν<br />
(2.23)<br />
dont la valeur est invariante par les transformations <strong>de</strong> coordonnées admissibles. On suppose<br />
que les quantités gµν sont symétriques par rapport aux indices µ et ν et que la matrice carrée<br />
(gµν) est inversible :<br />
(2.24)<br />
et<br />
gµν = gνµ<br />
dét(gµν) = 0. (2.25)<br />
En substituant (2.4) dans (2.23), on obtient en chaque point x :<br />
ds 2 = gµν(x α )dx µ dx ν = gµν(x α ) ∂xµ<br />
∂x ρ′<br />
∂x ν<br />
∂x σ′ dx ρ′<br />
dx σ′<br />
. (2.26)<br />
Cette équation montre que l’expression <strong>de</strong> ds2 dans les coordonnées locales xρ′ par la forme quadratique<br />
est donnée<br />
ds 2 = gρ ′ σ ′(x)dxρ′ dx σ′<br />
, (2.27)<br />
où les quantités gρ ′ σ ′ sont reliées aux gµν par la loi <strong>de</strong> transformation<br />
gρ ′ ∂xµ<br />
σ ′ =<br />
∂xρ′ ∂x ν<br />
∂x σ′ gµν . (2.28)<br />
En comparant (2.28) avec (2.20), on voit que les quantités gµν se transforment comme<br />
les composantes d’un tenseur g <strong>de</strong>ux fois covariant. On notera que les quantités gρ ′ σ ′ sont<br />
symétriques en ρ ′ et σ ′2 .<br />
Une variété V4 munie d’une métrique g est appelée une variété riemannienne. On désigne<br />
une telle variété par le doublet (V4,g). Lorsque la forme quadratique (2.23) est définie positive,<br />
la variété (V4,g) est dite proprement riemannienne 3 .<br />
Produit scalaire.— On voit aisément à partir <strong>de</strong> la loi <strong>de</strong> transformation (2.28) qu’à tout<br />
couple <strong>de</strong> vecteurs X et Y on peut faire correspondre une quantité réelle g(X,Y ) invariante<br />
par les changements <strong>de</strong> coordonnées en posant :<br />
g(X,Y ) = gµνX µ Y ν . (2.29)<br />
L’application définie par (2.29) est bilinéaire, puisqu’elle est linéaire par rapport à chacun<br />
<strong>de</strong> ses arguments. Il résulte en effet <strong>de</strong> la définition même <strong>de</strong> g(X,Y ) que<br />
g(X + Z,Y ) = g(X,Y ) + g(Z,Y ), g(X,Y + Z) = g(X,Y ) + g(X,Z)<br />
2 On dit que le tenseur g est symétrique (voir Sect. 8).<br />
3 Lorsque la forme quadratique (2.23) n’est pas définie positive, on dit parfois que (V4,g) est pseudoriemannienne.<br />
Nous verrons que les métriques utilisées en relativité appartiennent à cette catégorie.<br />
17
pour tout vecteur Z et que<br />
g(λX,Y ) = g(X,λY ) = λg(X,Y ).<br />
quelque soit le nombre réel λ.<br />
En outre, l’application g est symétrique, puisqu’on a<br />
g(X,Y ) = g(Y,X)<br />
en raison <strong>de</strong> la symétrie <strong>de</strong>s gµν par rapport aux indices µ et ν. Enfin, l’application g est dite<br />
non dégénérée car la matrice <strong>de</strong>s gµν est inversible par hypothèse.<br />
L’ensemble <strong>de</strong> ces quatre propriétés caractérise un produit scalaire 4 en chaque point x ∈ V4.<br />
Il en résulte que la donnée d’une métrique induit la donnée d’un produit scalaire en chaque<br />
point <strong>de</strong> V4. Réciproquement, la donnée d’un produit scalaire en chaque point <strong>de</strong> V4 définit une<br />
métrique sur V4.<br />
2.5 Addition et multiplication <strong>de</strong>s tenseurs<br />
On peut définir l’addition <strong>de</strong> <strong>de</strong>ux tenseurs du même type et la multiplication tensorielle<br />
<strong>de</strong> <strong>de</strong>ux tenseurs <strong>de</strong> types quelconques.<br />
Addition tensorielle.— Donnons-nous par exemple <strong>de</strong>ux tenseurs <strong>de</strong>ux fois covariants Sµν<br />
et Tµν. On vérifie facilement que la somme <strong>de</strong>s composantes Sµν +Tµν se transforme comme un<br />
tenseur <strong>de</strong>ux fois covariant. En appliquant (2.20), il vient en effet<br />
Sρ ′ σ ′ + Tρ ′ ∂xµ<br />
σ ′ =<br />
∂xρ′ relation dont on déduit immédiatement<br />
∂x ν<br />
∂x σ′ Sµν + ∂xµ<br />
∂x ρ′<br />
∂x ν<br />
∂x σ′ Tµν,<br />
Sρ ′ σ ′ + Tρ ′ ∂xµ<br />
σ ′ =<br />
∂xρ′ ∂xν ∂xσ′ (Sµν + Tµν).<br />
Plus généralement, on peut formuler le théorème suivant.<br />
ν1...νl<br />
ν1...νl<br />
Théorème 2.5.1 Soient Sµ1...µk<br />
et Tµ1...µk <strong>de</strong>ux tenseurs <strong>de</strong> type (k,l). Les quantités<br />
ν1...νl U définies par<br />
µ1...µk<br />
U<br />
ν1...νl<br />
µ1...µk<br />
= S<br />
ν1...νl<br />
µ1...µk<br />
sont les composantes d’un tenseur <strong>de</strong> type (k,l).<br />
Le tenseur U <strong>de</strong> composantes U<br />
ν1...νl<br />
µ1...µk<br />
+ T<br />
ν1...νl<br />
µ1...µk<br />
est appelé la somme <strong>de</strong>s tenseurs S et T.<br />
Multiplication tensorielle.— Donnons-nous maintenant un tenseur <strong>de</strong>ux fois covariant<br />
Sαβ et un vecteur contravariant V µ qui peut être considéré, on l’a vu, comme un tenseur 0 fois<br />
covariant et une fois contravariant. Il est facile <strong>de</strong> voir que les produits <strong>de</strong>s composantes SαβV µ<br />
4 Soulignons que le produit scalaire associé à une métrique g arbitraire n’est pas nécessairement défini positif.<br />
18
constituent les composantes d’un tenseur mixte <strong>de</strong> type (2, 1). On peut en effet écrire d’après<br />
(2.20)<br />
Sγ ′ <br />
α ∂x ρ′<br />
δ ′V =<br />
∂xγ′ ∂xβ ∂xδ′ <br />
ρ ∂x<br />
Sαβ<br />
′ <br />
µ<br />
V =<br />
∂x µ ∂xα<br />
∂xγ′ ∂xβ ∂xδ′ ∂xρ′ ∂x µ SαβV µ .<br />
Ce théorème se généralise aisément.<br />
ν1...νl<br />
σ1...σs<br />
Théorème 2.5.2 Soient Sµ1...µk<br />
et Tρ1...ρr <strong>de</strong>ux tenseurs <strong>de</strong> types respectifs (k,l) et<br />
ν1...νlνl+1...νl+s<br />
(r,s). Les quantités W<br />
définies par<br />
W<br />
µ1...µkµk+1...µk+r<br />
ν1...νlνl+1...νl+s<br />
µ1...µkµk+1...µk+r<br />
= S<br />
ν1...νl<br />
µ1...µk<br />
constituent les composantes d’un tenseur <strong>de</strong> type (k + r,l + s).<br />
T<br />
µk+1...µk+r<br />
νl+1...νl+s<br />
(2.30)<br />
Le tenseur W défini par (2.30) est appelé le produit tensoriel <strong>de</strong>s tenseurs S et T. On désigne<br />
W par le symbole S ⊗ T, ce qui revient à poser<br />
(S ⊗ T)<br />
ν1...νlνl+1...νl+s<br />
µ1...µkµk+1...µk+r<br />
= S<br />
ν1...νl<br />
µ1...µk<br />
νl+1...νl+s<br />
Tµk+1...µk+r<br />
. (2.31)<br />
On notera qu’à la différence <strong>de</strong> la multiplication usuelle, T ⊗ S n’est en général pas égal à<br />
S ⊗ T. On a en effet d’après (2.31)<br />
(T ⊗ S)<br />
ν1...νsνs+1...νs+l<br />
µ1...µrµr+1...µr+k<br />
= T<br />
ν1...νs<br />
µ1...µr<br />
expression manifestement différente du second membre <strong>de</strong> (2.31).<br />
2.6 Contraction<br />
S<br />
νs+1...νs+l<br />
µr+1...µr+k<br />
Il existe encore une autre opération sur les tenseurs, la contraction <strong>de</strong>s indices, qui permet<br />
<strong>de</strong> définir un tenseur mixte <strong>de</strong> type (k − 1,l − 1) à partir d’un tenseur mixte <strong>de</strong> type (k,l)<br />
lorsque k ≥ 1 et l ≥ 1. Etant donné par exemple un tenseur T <strong>de</strong> type (2, 2), <strong>de</strong> composantes<br />
T γδ<br />
αβ , considérons les quantités T γ<br />
α obtenues en donnant <strong>de</strong>s valeurs égales aux indices β et δ<br />
et en sommant par rapport à l’indice répété :<br />
T γ<br />
α = T γβ<br />
αβ . (2.32)<br />
Examinons comment se transforment les quantités T γ<br />
α lors d’un changement <strong>de</strong> coordonnées<br />
locales x µ → xρ′ . On pose par définition<br />
T ρ′<br />
µ ′<br />
= T<br />
ρ ′ ν ′<br />
µ ′ ν ′<br />
Il vient donc en appliquant (2.20) pour transformer T<br />
T ρ′<br />
µ ′<br />
∂xα<br />
=<br />
∂x µ′<br />
∂xβ ∂xν′ ∂xρ′ ∂xγ .<br />
ρ ′ ν ′<br />
µ ′ ν ′<br />
∂xν′ γδ ∂xα<br />
T<br />
∂xδ αβ =<br />
∂x µ′<br />
∂xρ′ ∂xγ ∂xβ ∂xν′ 19<br />
:<br />
∂xν′ γδ<br />
T<br />
∂xδ αβ .<br />
,
D’où, compte tenu <strong>de</strong> (2.5) :<br />
T ρ′<br />
µ ′<br />
∂xα<br />
=<br />
∂x µ′<br />
∂x ρ′<br />
∂x<br />
δβ<br />
γ δ<br />
T γδ<br />
αβ<br />
= ∂xα<br />
∂x µ′<br />
∂xρ′ γβ ∂xα<br />
T<br />
∂xγ αβ =<br />
∂x µ′<br />
∂xρ′ γ<br />
T<br />
∂xγ α . (2.33)<br />
Ce calcul montre que les quantités T γ<br />
α constituent les composantes d’un tenseur mixte <strong>de</strong><br />
type (1, 1).<br />
La généralisation <strong>de</strong> cette propriété est immédiate et conduit au théorème qui suit.<br />
Théorème 2.6.1 Soit T un tenseur <strong>de</strong> type (k,l) <strong>de</strong> composantes<br />
avec k ≥ 1,l ≥ 1. Les quantités<br />
T<br />
ν1...νj−1νj+1...νl<br />
µ1...µi−1µi+1...µk<br />
T<br />
ν1...νj−1νjνj+1...νl<br />
µ1...µi−1µiµi+1...µk<br />
= T<br />
µ1...µi−1ρ µi+1...µk<br />
,<br />
ν1...νj−1ρ νj+1...νl<br />
(2.34)<br />
obtenues en posant µi = νj = ρ et en sommant sur l’indice répété ρ constituent les composantes<br />
d’un tenseur <strong>de</strong> type (k − 1,l − 1).<br />
L’opération définie par (2.34) s’appelle une contraction <strong>de</strong> <strong>de</strong>ux indices. Bien entendu, cette<br />
opération peut être effectuée autant <strong>de</strong> fois qu’il y a <strong>de</strong> couples d’indices libres, l’un covariant,<br />
l’autre contravariant.<br />
Remarque importante.— Il faut être très attentif à la position <strong>de</strong>s indices que l’on<br />
contracte. Si nous reprenons le tenseur T γβ<br />
αβ examiné ci-<strong>de</strong>ssus, il est clair qu’on peut obtenir<br />
par contraction quatre tenseurs <strong>de</strong> type (1, 1) qui sont en général différents, à savoir :<br />
T<br />
γ<br />
(1)α<br />
λγ<br />
= Tλα , T<br />
γ<br />
(2)α<br />
γλ<br />
= Tλα , T<br />
γ<br />
(3)α<br />
λγ<br />
= Tαλ , T<br />
γ<br />
(4)α<br />
= T γλ<br />
αλ . (2.35)<br />
Les quatre tenseurs ainsi définis sont parfois appelés premières traces du tenseur mixte<br />
T γβ<br />
αβ .<br />
Une nouvelle contraction <strong>de</strong>s indices libres restants donne maintenant <strong>de</strong>s tenseurs <strong>de</strong> type<br />
(0, 0), i.e. <strong>de</strong>s fonctions scalaires<br />
T<br />
µ<br />
(1)µ<br />
λµ<br />
= Tλµ , T<br />
µ<br />
(2)µ<br />
µλ<br />
= T λµ , T<br />
µ<br />
(3)µ<br />
λµ<br />
= Tµλ , T<br />
µ<br />
(4)µ<br />
= T µλ<br />
µλ<br />
mais cette opération donne seulement <strong>de</strong>ux fonctions scalaires distinctes, puisqu’on a manifestement<br />
On pourra poser<br />
T λµ<br />
λµ<br />
T(1) = T<br />
µ<br />
(1)µ<br />
µλ<br />
= T µλ et T µλ λµ<br />
λµ = Tµλ .<br />
µ<br />
= T(4)µ<br />
, T(2) = T<br />
µ<br />
(2)µ<br />
= T<br />
µ<br />
(3)µ<br />
. (2.36)<br />
On peut appeler les quantités T(1) et T(2) les secon<strong>de</strong>s traces du tenseur T γδ<br />
αβ . On notera<br />
qu’étant <strong>de</strong>s fonctions scalaires, les traces T(1) et T(2) <strong>de</strong>meurent invariantes par changement <strong>de</strong><br />
coordonnées locales. Nous verrons que leur rôle en physique est capital, notamment en relativité.<br />
Dans le cas d’un tenseur T β<br />
α , il existe une seule première trace définie par<br />
Tr(T) = T α<br />
α . (2.37)<br />
20
On appelle cet invariant simplement la trace du tenseur mixte T β<br />
α . Le plus souvent, on désigne<br />
cette trace par T. Il faut donc veiller à ne pas la confondre avec le tenseur T lui-même.<br />
Multiplication contractée.— En pratique, on est souvent amené à combiner la multiplication<br />
tensorielle et la contraction d’indices appartenant à <strong>de</strong>ux tenseurs différents en facteurs.<br />
Soient par exemple Sαβ et T γδ les composantes <strong>de</strong> <strong>de</strong>ux tenseurs S et T. Leur produit tensoriel<br />
U = S ⊗ T a pour composantes<br />
U γδ<br />
αβ = SαβT γδ .<br />
Une contraction <strong>de</strong> U sur un indice appartenant à S et un indice appartenant à T permet<br />
<strong>de</strong> former les quatre tenseurs mixtes U(1), U(2),, U(3) et U(4) d’ordre 2 suivants :<br />
U γ<br />
(1)α = SλαT λγ , U γ<br />
(2)α = SλαT γλ ,<br />
U γ<br />
(3)α = SαλT λγ , U γ<br />
(4)α = SαλT γλ ,<br />
qui sont en général distincts.<br />
Les produits contractés sur <strong>de</strong>ux couples d’indices donnent seulement <strong>de</strong>ux invariants :<br />
U (1) = U µ<br />
(1)µ = SλµT λµ , U (2) = U µ<br />
(2)µ = SλµT µλ .<br />
On remarquera que la contraction d’un tenseur par rapport à <strong>de</strong>ux (ou 2p) indices peut<br />
toujours être considérée comme une multiplication contractée <strong>de</strong> T par le tenseur mixte <strong>de</strong><br />
Kronecker <strong>de</strong>fini par (2.22). Reprenons par exemple le tenseur T γδ<br />
αβ déjà utilisé ci-<strong>de</strong>ssus. On<br />
peut écrire en effet<br />
etc.<br />
T γλ<br />
αλ<br />
T λγ<br />
αλ<br />
2.7 Critères <strong>de</strong> tensorialité<br />
γλ<br />
= δβ λTαβ = δλ νT γν<br />
αλ ,<br />
λγ<br />
= δβ λTαβ = δλ νT νγ<br />
αλ ,<br />
La multiplication contractée permet <strong>de</strong> former un critère général <strong>de</strong> tensorialité très pratique<br />
pour s’assurer qu’un système <strong>de</strong> quantités que l’on introduit dans un calcul est un tenseur.<br />
Commençons par un exemple en montrant qu’un système <strong>de</strong> quantités T α βγε constitue les<br />
composantes d’un tenseur <strong>de</strong> type (3, 1) si et seulement si quel que soit le tenseur <strong>de</strong>ux fois<br />
contravariant U µν , les quantités T α βγεU βγ sont les composantes d’un tenseur une fois covariant<br />
et une fois covariant.<br />
Le caractère nécessaire <strong>de</strong> la condition énoncée résulte <strong>de</strong> ce qui a été dit plus haut <strong>de</strong> la<br />
multiplication contractée. Pour montrer son caractère suffisant, effectuons une transformation<br />
<strong>de</strong> coordonnées x µ → xρ′ . Par hypothèse, les quantités T α βγεU βγ se transforment comme les<br />
composantes d’un tenseur une fois covariant et une fois covariant. On a donc d’après (2.20)<br />
T λ′<br />
µ ′ ν ′ ρ ′Uµ′ ν ′<br />
= ∂xλ′<br />
∂xα ∂xε ∂xρ′ T α βγεU βγ . (2.38)<br />
21
Or, U étant un tenseur <strong>de</strong>ux fois contravariant, on peut remplacer les quantités U µ′ ν ′<br />
figurant<br />
dans le premier membre <strong>de</strong> (2.38) par<br />
Il vient :<br />
U µ′ ν ′<br />
= ∂xµ′<br />
∂x β<br />
∂x ν′<br />
∂x γ Uβγ .<br />
T λ′<br />
µ ′ ν ′ ρ ′<br />
∂x µ′<br />
∂xβ ∂xν′ ∂xγ Uβγ = ∂xλ′<br />
∂xα ∂xε ∂xρ′ T α βγεU βγ . (2.39)<br />
Les équations (2.39) <strong>de</strong>vant être satisfaites quels que soient les tenseurs U βγ , on doit avoir<br />
T λ′<br />
µ ′ ν ′ ρ ′<br />
∂x µ′<br />
∂xβ ∂xν′ ∂xλ′<br />
=<br />
∂xγ ∂xα ∂x ε<br />
∂x ρ′ T α βγε. (2.40)<br />
Opérons la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (2.40) par ∂xβ<br />
∂x<br />
un réarrangement <strong>de</strong> l’ordre <strong>de</strong>s termes<br />
T λ′<br />
µ ′ ν ′ ρ ′<br />
∂x µ′<br />
∂xβ ∂xβ ∂xσ′ ∂xν′ ∂xγ ∂xγ ∂xτ ′ = ∂xλ′<br />
∂xα ∂x β<br />
∂x σ′<br />
∂xγ ∂xτ ′<br />
En tenant compte <strong>de</strong>s relations (2.7), les équations (2.41) s’écrivent<br />
T λ′<br />
µ ′ ν ′ ρ ′δµ′ σ ′δν′<br />
λ′<br />
τ ′ = T σ ′ τ ′ ρ<br />
∂xλ′<br />
′ =<br />
∂xα ∂xβ ∂xσ′ ∂xγ ∂xτ ′<br />
∂xγ<br />
σ′ ∂x<br />
τ′ . Il vient avec<br />
∂x ε<br />
∂x ρ′ T α βγε. (2.41)<br />
∂x ε<br />
∂x ρ′ T α βγε. (2.42)<br />
Les équations (2.42) montrent que les quantités T α βγε se transforment comme les composantes<br />
d’un tenseur <strong>de</strong> type (3, 1). CQFD.<br />
Le théorème que nous venons <strong>de</strong> montrer admet la généralisation suivante.<br />
Théorème 2.7.1 Pour qu’un système <strong>de</strong> 4r+s ν1...νs<br />
quantités Tµ1...µr<br />
constitue les composantes<br />
d’un tenseur <strong>de</strong> type (r,s) dans un système <strong>de</strong> coordonnées locales xα , il faut et il suffit que<br />
quel que soit le tenseur U β1...βl <strong>de</strong> type (k,l) avec k ≤ r et l ≤ s, le système <strong>de</strong> quantités<br />
α1...αk<br />
T<br />
µ1...µr<br />
ν1...νs<br />
U<br />
µ1...µl<br />
ν1...νk<br />
soit le système <strong>de</strong> composantes d’un tenseur r − k fois covariant et s − l fois contravariant.<br />
(2.43)<br />
Ce théorème a pour corollaire la proposition suivante, très souvent utilisée comme critère.<br />
Théorème 2.7.2 Pour qu’un système <strong>de</strong> 4r+s ν1...νs<br />
quantités Tµ1...µr<br />
constitue les composantes<br />
d’un tenseur <strong>de</strong> type (r,s) dans un système <strong>de</strong> coordonnés locales xα , il faut et il suffit que quels<br />
que soient les r vecteurs contravariants X(k) <strong>de</strong> composantes X αk<br />
(k) et quels que soient les s<br />
vecteurs covariants φ (l) <strong>de</strong> composantes φ (l)<br />
, la quantité<br />
βl<br />
I = T<br />
µ1...µr<br />
ν1...νs<br />
X µ1<br />
(1) ...Xµr<br />
(r) φ(1)<br />
ν1 ...φ(s)<br />
νs<br />
soit invariante lorsqu’on effectue un changement <strong>de</strong> base.<br />
22<br />
(2.44)
2.8 Tenseurs symétriques et tenseurs antisymétriques<br />
Tenseurs symétriques.— Soit T un tenseur <strong>de</strong>ux fois covariant. Supposons que les composantes<br />
Tµν <strong>de</strong> T dans un système <strong>de</strong> coordonnées locales x α soient telles que l’égalité<br />
Tνµ = Tµν<br />
(2.45)<br />
soit satisfaite pour tous les couples d’indices (µ,ν). On déduit aisément <strong>de</strong> la loi <strong>de</strong> transformation<br />
(2.20) que les composantes <strong>de</strong> T dans un autre système <strong>de</strong> coordonnées locales xβ′ vérifient<br />
aussi la propriété Tσ ′ ρ ′ = Tρ ′ σ ′. Les relations <strong>de</strong> symétrie (2.45) traduisent donc une propriété<br />
intrinsèque. C’est pourquoi on dit que T est un tenseur symétrique.<br />
Un tenseur métrique est un exemple <strong>de</strong> tenseur <strong>de</strong>ux fois covariant symétrique.<br />
Tenseurs antisymétriques.— Considérons maintenant un tenseur <strong>de</strong>ux fois covariant F<br />
dont les composantes Fµν dans les coordonnées locales x α vérifient les relations<br />
Fµν = −Fνµ<br />
(2.46)<br />
pour tous les couples d’indices (µ,ν). Alors <strong>de</strong>s relations analogues sont satisfaites par les<br />
composantes <strong>de</strong> F dans n’importe quel autre système <strong>de</strong> coordonnées locales. On dit que F est<br />
un tenseur antisymétrique.<br />
Ces considérations s’appliquent également aux tenseurs <strong>de</strong>ux fois contravariants.<br />
Parties symétrique et antisymétrique d’un tenseur.— On peut toujours exprimer<br />
un tenseur T <strong>de</strong>ux fois covariant (ou <strong>de</strong>ux fois contravariant) arbitraire comme une somme<br />
d’un tenseur symétrique et d’un tenseur antisymétrique. En effet, n’importe quel système <strong>de</strong><br />
16 quantités Tµν peut s’écrire sous la forme<br />
où T(µν) et T[µν] sont respectivement définis par<br />
Tµν = T(µν) + T[µν], (2.47)<br />
T(µν) = 1<br />
2 (Tµν + Tνµ) = T(νµ), (2.48)<br />
T[µν] = 1<br />
2 (Tµν − Tνµ) = −T[νµ], (2.49)<br />
et il est aisé <strong>de</strong> montrer que T(µν) et T[µν] sont <strong>de</strong>s composantes <strong>de</strong> tenseurs <strong>de</strong> type (2, 0). Du<br />
fait que la décomposition (2.47) est unique, on appelle T(µν) et T[µν] respectivement la partie<br />
symétrique <strong>de</strong> T et la partie antisymétrique du tenseur T.<br />
Les notions qui précè<strong>de</strong>nt peuvent être étendues aux tenseurs d’ordre supérieur à 2.<br />
2.9 Composantes covariantes et contravariantes<br />
23
Donnons-nous une variété différentielle V4 munie d’une métrique g, et considérons un champ<br />
<strong>de</strong> vecteurs contravariants V µ . Du fait que g est un tenseur <strong>de</strong>ux fois covariant <strong>de</strong> composantes<br />
gµν, les quantités<br />
Vν = gνρV ρ<br />
(2.50)<br />
sont les composantes d’un tenseur <strong>de</strong> type (1, 0), i.e. d’un vecteur covariant V ∗ (voir multiplication<br />
contractée, sect. 2.6). On convient <strong>de</strong> regar<strong>de</strong>r le vecteur contravariant V et le vecteur<br />
covariant V ∗ qui lui est associé comme étant un seul et même vecteur dont les quantités V µ<br />
sont les composantes contravariantes et les quantités Vν définies par (2.50) sont les composantes<br />
covariantes.<br />
On peut aisément déterminer les composantes contravariantes V µ en fonction <strong>de</strong>s composantes<br />
covariantes Vν. On a supposé en effet que la condition (2.25) est satisfaite dans n’importe<br />
quel système <strong>de</strong> coordonnées locales admissibles. Les équations (2.50) forment donc un système<br />
régulier <strong>de</strong> quatre équations linéaires à quatre inconnues V µ lorsque les composantes covariantes<br />
Vν sont données (système <strong>de</strong> Kramer). La théorie élémentaire <strong>de</strong>s systèmes <strong>de</strong> Kramer montre<br />
que ce système admet une solution unique qui peut s’écrire sous la forme<br />
V µ = g µν Vν, (2.51)<br />
les quantités g µν étant <strong>de</strong>s fonctions <strong>de</strong>s coordonnées indépendantes <strong>de</strong>s quantités Vν. En substituant<br />
(2.50) dans (2.51), on voit que<br />
V µ = g µν gνρV ρ . (2.52)<br />
Comme les équations (2.52) doivent être satisfaites quelles que soint le vecteur V , on en<br />
déduit que les quantités g µν doivent satisfaire les seize relations<br />
g µν gνρ = δ µ ρ. (2.53)<br />
Les relations (2.53) montrent que la matrice (g µν ) est l’inverse <strong>de</strong> la matrice (gµν).<br />
On a le théorème important suivant, dont la démonstration est donnée dans l’appendice 1.<br />
Théorème 2.9.1 Les quantités g µν sont les composantes d’un tenseur symétrique <strong>de</strong>ux fois<br />
contravariant, i.e. obéissent à la loi <strong>de</strong> transformation :<br />
g ρ′ σ ′<br />
= ∂xρ′<br />
∂x µ<br />
∂xσ′ ∂xν gµν . (2.54)<br />
Ce théorème permet d’associer à tout vecteur covariant φ <strong>de</strong> composantes φρ un vecteur<br />
contravariant φ∗ dont les composantes φ µ sont définies par<br />
φ σ = g ρσ φρ. (2.55)<br />
De nouveau, on convient <strong>de</strong> regar<strong>de</strong>r les vecteurs φ et φ∗ comme un seul et même vecteur<br />
dont les quantités φρ sont les composantes covariantes et les quantités φ σ sont les composantes<br />
contravariantes.<br />
24
Sur une variété riemannienne, on parlera donc dsormais <strong>de</strong> vecteurs tout court, mais on<br />
distinguera soigneusement les composantes contravariantes et les composantes covariantes <strong>de</strong><br />
ces vecteurs.<br />
Les considérations qui précè<strong>de</strong>nt s’éten<strong>de</strong>nt sans difficulté aux tenseurs d’ordre ≥ 2. Étant<br />
donné par exemple un tenseur S <strong>de</strong>ux fois contravariant <strong>de</strong> composantes S µν , on regar<strong>de</strong>ra<br />
comme i<strong>de</strong>ntifiable à S le tenseur <strong>de</strong>ux fois covariant <strong>de</strong> composantes<br />
ainsi que les tenseurs mixtes <strong>de</strong> composantes<br />
Les quantités S µν µ .<br />
, Sαβ, S β<br />
riantes, covariantes et mixtes du tenseur S.<br />
Sαβ = gαµgβνS µν<br />
(2.56)<br />
µ .<br />
S β = gβνS µν . ν<br />
, S α = gαµS µν . (2.57)<br />
et S . ν<br />
α seront respectivement appelées composantes contrava-<br />
De même, étant donné un tenseur <strong>de</strong>ux fois covariant T <strong>de</strong> composantes Tµν, on dira que<br />
les quantités Tµν sont les composantes covariantes <strong>de</strong> T, et on définira les composantes contravariantes<br />
et mixtes <strong>de</strong> T respectivement par les équations<br />
et<br />
T ρσ = g ρµ g σν Tµν<br />
(2.58)<br />
T ρ<br />
. ν = g ρµ Tµν, T σ<br />
µ . = g σν Tµν . (2.59)<br />
L’extension aux tenseurs d’ordre supérieur à 2 s’ensuit naturellement.<br />
Remarque importante.— Il faudra faire très attention à la disposition <strong>de</strong>s indices quand<br />
on évalue <strong>de</strong>s composantes covariantes ou mixtes à partir <strong>de</strong> composantes contravariantes par<br />
exemple. Pour les composantes mixtes d’un tenseur <strong>de</strong>ux fois covariant Tµν, par exemple, on<br />
n’a pas T µ<br />
. ν = T µ<br />
ν . , sauf si Tµν est symétrique.<br />
D’après les relations (2.58), les composantes contravariantes du tenseur métrique g sont les<br />
quantités g ρµ g σν gµν. Or, d’après (2.53), on a g σν gµν = δ σ µ. En conséquence :<br />
g ρµ g σν gµν = g ρµ δ σ µ = g ρσ . (2.60)<br />
Les relations (2.60) montrent que les quantités g µν sont les composantes contravariantes du<br />
tenseur métrique g, les quantités gµν étant elles-même les composantes covariantes du même<br />
tenseur.<br />
Calculons maintenant les composantes mixtes du tenseur métrique. Compte tenu <strong>de</strong> la<br />
symétrie du tenseur métrique, les composantes mixtes g ρ . ν et g ρ<br />
ν . sont confondues et peuvent<br />
être désignées par g ρ ν. On a d’après (2.59)<br />
D’où en appliquant (2.53) :<br />
g ρ ν = g ρµ gµν .<br />
g ρ ν = δ ρ ν. (2.61)<br />
25
Cette <strong>de</strong>rnière équation montre que les composantes mixtes du tenseur métrique s’i<strong>de</strong>ntifient<br />
aux composantes du tenseur <strong>de</strong> Kronecker d’ordre 2 défini dans la sect. 2.4.<br />
On notera que l’utilisation <strong>de</strong>s composantes contravariantes, covariantes ou mixtes <strong>de</strong>s vecteurs<br />
et <strong>de</strong>s tenseurs permet d’obtenir <strong>de</strong>s expressions particulièrement concises <strong>de</strong> la plupart<br />
<strong>de</strong>s expressions utilisées en analyse tensorielle. Ainsi, le produit scalaire <strong>de</strong> <strong>de</strong>ux vecteurs <strong>de</strong><br />
composantes contravariantes X µ et Y ν s’écrit comme nous l’avons vu<br />
g(X,Y ) = gµνX µ Y ν .<br />
Développée, cette expression est une double somme, l’une sur l’indice µ, l’autre sur l’indice<br />
ν, contenant 16 termes. Or, la même expression s’écrit en tenant compte <strong>de</strong> la formule (2.50)<br />
définissant les composantes covariantes d’un vecteur :<br />
g(X,Y ) = XνY ν = g(X,Y ) = X µ Yµ. (2.62)<br />
Les second et troisième membres <strong>de</strong> (2.62) sont <strong>de</strong>s sommes simples, comportant 4 termes.<br />
Enfin, en utilisant les relations (2.51) et (2.53), on voit facilement que le produit scalaire<br />
g(X,Y ) peut s’exprimer en fonction <strong>de</strong>s composantes covariantes <strong>de</strong>s vecteurs X et Y selon la<br />
formule<br />
g(X,Y ) = g µν XµYν. (2.63)<br />
Appendice 1 : démonstration du théorème 2.9.1<br />
L’inverse d’une matrice symétrique étant elle-même symétrique, les quantités g µν impliquées<br />
dans les équations (2.51) sont symétriques par rapport aux indices µ et ν :<br />
g νµ = g µν . (2.64)<br />
La loi <strong>de</strong> transformation <strong>de</strong>s g µν est nécessairement telle que les relations<br />
gτ ′ λ ′gλ′ σ ′<br />
= δ σ′<br />
τ ′<br />
soient satisfaites dans le système <strong>de</strong> coordonnées locales xρ′ . On a<br />
et<br />
gτ ′ λ<br />
∂xα<br />
′ =<br />
∂xτ ′<br />
∂x β<br />
∂x λ′ gαβ<br />
(2.65)<br />
(2.66)<br />
δ σ′ ∂xσ′<br />
τ ′ =<br />
∂xα ∂xβ ∂xτ ′ δ α β. (2.67)<br />
du fait que les quantités gτ ′ λ ′ et δσ′ τ ′ sont respectivement les composantes d’un tenseur <strong>de</strong>ux fois<br />
covariant et d’un tenseur mixte d’ordre 2. Substituons (2.66) et (2.67) dans (2.65) et effectuons<br />
la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> l’équation obtenue par ∂xρ′<br />
∂x µ<br />
∂xτ′ ∂xν g µν . On obtient<br />
∂x ρ′<br />
∂x µ<br />
τ ′<br />
∂x<br />
∂xν ∂xα ∂xτ ′<br />
∂xβ ∂xλ′ g µν gαβg λ′ σ ′<br />
= ∂xρ′<br />
∂x µ<br />
26<br />
τ ′<br />
∂x<br />
∂xν ∂xσ′ ∂xα ∂xβ ∂xτ ′ g µν δ α β<br />
(2.68)
En modifiant l’ordre <strong>de</strong>s facteurs et en utilisant <strong>de</strong> façon répétée les relations (2.5), (2.7) et<br />
(2.53), on voit que le premier membre <strong>de</strong> (2.68) s’écrit<br />
∂x ρ′<br />
∂x µ<br />
τ ′<br />
∂x<br />
∂xν ∂xα ∂xτ ′<br />
∂xβ ∂xλ′ g µν gαβg λ′ σ ′<br />
= ∂xρ′<br />
∂x µ<br />
soit encore<br />
∂xρ′ ∂x µ<br />
τ ′<br />
∂x<br />
∂xν ∂xα ∂x<br />
∂xτ ′<br />
β<br />
Le second membre <strong>de</strong> (2.68) <strong>de</strong>vient<br />
∂x ρ′<br />
∂x µ<br />
τ ′<br />
∂x<br />
∂xν ∂x λ′ g µν gαβg λ′ σ ′<br />
∂xβ ∂xλ′ δ α ν g µν gαβg λ′ σ ′<br />
= ∂xρ′<br />
∂x µ<br />
∂x µ<br />
∂x λ′ g λ′ σ ′<br />
,<br />
= δ ρ′<br />
λ ′gλ′ σ ′<br />
= g ρ′ σ ′<br />
. (2.69)<br />
∂xβ ∂x<br />
∂xτ ′<br />
σ′<br />
∂xα gµνδ α β = ∂xρ′<br />
∂x µ<br />
∂xσ′ ∂xα δβ νδ α βg µν = ∂xρ′<br />
∂x µ<br />
∂xσ′ ∂xν gµν . (2.70)<br />
La comparaison <strong>de</strong> (2.69) et <strong>de</strong> (2.70) montre que les quantités g µν se transforment selon la<br />
formule (2.54), ce qui démontre le théorème 2.9.1.<br />
27
Chapitre 3<br />
Espace-temps <strong>de</strong> Minkowski<br />
Dans ce chapitre, nous montrons que le principe d’inertie, l’hypothèse que l’espace est<br />
euclidien, <strong>de</strong> dimension 3 et isotrope, et le postulat qu’il existe une vitesse finie invariante par<br />
les changements <strong>de</strong> référentiels galiléens conduisent directement à l’espace-temps <strong>de</strong> Minkowski<br />
comme scène universelle.<br />
3.1 Principes fondamentaux<br />
Définition 3.1.1 (Référentiels galiléens) On appelle référentiel galiléen tout référentiel S<br />
auquel on peut associer un espace proprement euclidien 1 à trois dimensions E3[S] et une échelle<br />
<strong>de</strong> temps T [S] <strong>de</strong> telle sorte qu’une particule isolée (i.e. soustraite à toute action extérieure)<br />
soit au repos par rapport à S ou décrive une droite <strong>de</strong> E3[S] avec un mouvement uniforme.<br />
E3[S] est appelé l’espace physique du référentiel S. On désignera les points <strong>de</strong> cet espace<br />
par <strong>de</strong>s lettres majuscules (O,A,B,C,...) pour les différencier <strong>de</strong>s points-événements qui seront<br />
toujours représentés par <strong>de</strong>s lettres minuscules (x,y,...). L’hypothèse que E3[S] est un espace<br />
proprement euclidien permet d’associer à un point O arbitraire <strong>de</strong> E3[S] un repère orthonormé<br />
(O,e1,e2,e3) par rapport auquel on définit les notions usuelles <strong>de</strong> la cinématique telles que le<br />
vecteur position x et le vecteur vitesse v d’une particule à chaque instant t <strong>de</strong> l’échelle <strong>de</strong> temps<br />
T [S]. Dans ce chapitre, nous supposerons toujours que E3[S] est rapporté à un tel repère, les<br />
coordonnées spatiales étant désignées par x i , avec i = 1, 2, 3.<br />
Bien entendu, cette définition ne vaut que parce qu’on admet la validité du postulat fondamental<br />
suivant.<br />
Postulat 3.1.1 (Principe d’inertie restreint) Des référentiels galiléens sont en principe<br />
réalisables dans toute région <strong>de</strong> l’univers dépourvue <strong>de</strong> champ <strong>de</strong> gravitation.<br />
Nous proposons 2 d’appeler le postulat 3.1.1 principe d’inertie restreint pour bien le distinguer<br />
du principe d’inertie usuel (i.e. galiléo-newtonien). Selon ce <strong>de</strong>rnier en effet, la loi <strong>de</strong><br />
1La notion d’espace proprement euclidien est un cas particulier <strong>de</strong> la notion d’espace (ponctuel) affine : voir<br />
l’annexe A.<br />
2La terminologie adoptée ici nous est propre, en effet.<br />
28
gravitation newtonienne peut être formulée dans un référentiel galiléen arbitraire (voir sect.<br />
7.1). A contrario, le postulat 3.1.1 n’affirme pas qu’on puisse maintenir la notion <strong>de</strong> référentiel<br />
galiléen lorsque l’interaction gravitationnelle n’est pas négligeable.<br />
Il résulte <strong>de</strong> ce qui précè<strong>de</strong> que la physique considérée dans les chapitres 3 à 6 doit être<br />
regardée comme une physique vali<strong>de</strong> dans un univers (ou une région <strong>de</strong> l’univers) sans gravitation,<br />
sans qu’on puisse pour l’instant se prononcer sur sa validité ou sa non-validité dans un<br />
champ <strong>de</strong> gravitation. Nous verrons dans le chapitre 7 pourquoi et comment cette physique<br />
doit être modifiée quand la gravitation est prise en compte.<br />
Les énoncés ci-<strong>de</strong>ssus doivent être complétés par un postulat qui précise le lien entre les<br />
variables mathématiques que sont les dates t et les coordonnées cartésiennes orthonormées x i<br />
et les mesures que l’on peut effectuer avec <strong>de</strong>s horloges standard et <strong>de</strong>s étalons <strong>de</strong> longueur au<br />
repos par rapport au référentiel galiléen considéré.<br />
Postulat 3.1.2 Soit S un référentiel galiléen arbitraire muni d’un repère orthonormé (O,e1,e2,e3)<br />
et d’une échelle <strong>de</strong> temps t tels que le postulat 3.1.1 soit vali<strong>de</strong>. Alors<br />
a) si <strong>de</strong>ux événements xA et xB se produisent au même point x <strong>de</strong> E3[S] (i.e. si x i A = x i B),<br />
la différence <strong>de</strong> dates tB − tA est égale au temps propre mesuré entre xA et xB par une horloge<br />
standard au repos au point x;<br />
b) si A et B sont <strong>de</strong>ux points arbitraires <strong>de</strong> l’espace E3[S] <strong>de</strong> coordonnées respectives x i A<br />
et x i B, la distance entre ces <strong>de</strong>ux points mesurée au moyen d’étalons standards <strong>de</strong> longueur au<br />
repos par rapport au référentiel S est égale à la quantité<br />
lAB =<br />
<br />
(x 1 B − x 1 A) 2 + (x 2 B − x 2 A) 2 + (x 3 B − x 3 A) 2 . (3.1)<br />
Ces <strong>de</strong>ux postulats sont admis aussi bien par la physique préeinsteinienne que par la relativité.<br />
Toutefois la physique préeinsteinienne postulait également que pour <strong>de</strong>ux événements<br />
quelconques xA et xB observés dans <strong>de</strong>ux systèmes <strong>de</strong> référence galiléens S et S ′ en mouvement<br />
l’un par rapport à l’autre, on pouvait poser<br />
t ′ B − t ′ A = tB − tA , (3.2)<br />
hypothèse qui revenait à supposer l’existence d’un temps absolu. Or, nous le verrons dans la<br />
section suivante, la relation (3.2) n’est absolument pas impliquée par les postulats 3.1.1 et 3.1.2,<br />
et s’est en outre avérée incompatible avec le postulat d’existence d’une vitesse invariante énoncé<br />
ci-<strong>de</strong>ssous.<br />
Postulat 3.1.3 (Isotropie <strong>de</strong> l’espace) L’espace physique associé à un référentiel galiléen<br />
arbitraire est isotrope en chacun <strong>de</strong> ses points.<br />
Rappelons qu’un milieu est dit isotrope en un point lorsque ses propriétés sont les mêmes<br />
dans toutes les directions issues <strong>de</strong> ce point. Le postulat 3.1.3 revient à énoncer que <strong>de</strong>ux<br />
référentiels déduits l’un <strong>de</strong> l’autre par une rotation <strong>de</strong>s axes spatiaux sont équivalents pour<br />
formuler les lois <strong>de</strong> la physique.<br />
Voici maintenant le postulat qui implique une rupture radicale avec la physique préeinsteinienne.<br />
29
Postulat 3.1.4 (Existence d’une vitesse invariante) Il existe une vitesse invariante par<br />
les changements <strong>de</strong> référentiels galiléens. Cette vitesse est notée c.<br />
Ce postulat signifie qu’une particule ou une interaction se propageant avec la vitesse c par<br />
rapport à un référentiel galiléen donné se propage également avec la vitesse c par rapport à<br />
n’importe quel autre référentiel galiléen. Bien entendu, conformément au postulat d’isotropie<br />
<strong>de</strong> l’espace, la vitesse c est indépendante <strong>de</strong> la direction et du sens <strong>de</strong> la propagation. On notera<br />
que l’énoncé n’affirme nullement que la vitesse c soit effectivement réalisable par une particule<br />
ou par un signal. Le postulat 3.1.4 n’affirme pas non plus que la constante c est une vitesse<br />
limite ni qu’elle constitue la borne supérieure <strong>de</strong> toutes les vitesses possibles.<br />
La vitesse invariante c est une constante universelle. Historiquement, ce sont les problèmes<br />
posés par l’électrodynamique et l’optique à la fin du XIX e siècle qui ont conduit Einstein à<br />
postuler en 1905 que la vitesse <strong>de</strong> la lumière dans le vi<strong>de</strong> était une constante indépendante<br />
du référentiel galiléen et <strong>de</strong> l’état <strong>de</strong> mouvement <strong>de</strong> la source 3 . C’est pourquoi on appelle<br />
généralement c vitesse <strong>de</strong> la lumière dans le vi<strong>de</strong>, mais cette terminologie doit impérativement<br />
être abandonnée. Nous allons voir en effet que l’existence d’une vitesse invariante c dicte en<br />
quelque sorte la structure <strong>de</strong> l’espace-temps, c’est-à-dire le cadre fondamental dans lequel<br />
nous décrivons toutes les interactions, et pas seulement les phénomènes électromagnétiques.<br />
La constante c n’est donc pas liée à une interaction particulière.<br />
Bien entendu, il est en pratique légitime <strong>de</strong> poser que la vitesse <strong>de</strong> propagation <strong>de</strong> la<br />
lumière dans le vi<strong>de</strong> est numériquement égale à c. Cette affirmation est en effet conforme<br />
à l’expérience. En outre, cette égalité numérique est une conséquence directe <strong>de</strong> la théorie<br />
électromagnétique <strong>de</strong> Maxwell formulée dans le cadre relativiste que nous sommes en train <strong>de</strong><br />
construire. Mais ces arguments ne sont pas du tout équivalents à l’affirmation d’une i<strong>de</strong>ntité<br />
essentielle <strong>de</strong> c avec la vitesse <strong>de</strong> la lumière puisqu’on peut concevoir <strong>de</strong>s théories relativistes<br />
<strong>de</strong> l’électromagnétisme prédisant une vitesse <strong>de</strong> propagation différentes <strong>de</strong> c. C’est pourquoi<br />
nous éviterons systématiquement la terminologie courante, en appelant la constante c vitesse<br />
invariante ou encore vitesse fondamentale 4 .<br />
3.2 Lois <strong>de</strong> transformation <strong>de</strong>s coordonnées galiléennes<br />
Selon ce qui précè<strong>de</strong>, un événement peut être repéré dans un référentiel galiléen arbitraire<br />
par une date t et trois coordonnées cartésiennes orthogonales x i . Du fait que la constante<br />
universelle c a la dimension d’une vitesse, on remplacera la date t par une coordonnée x 0 ayant<br />
la dimension d’une longueur en posant<br />
x 0 = ct. (3.3)<br />
3 A. Einstein, Zur Electrodynamik bewegter Körper [Sur l’électrodynamique <strong>de</strong>s corps en mouvement], Annalen<br />
d. Physik, t. XVII, pp. 891-921, 1905. Trad. De M. Solovine : Sur l’électrodynamique <strong>de</strong>s corps en mouvement,<br />
Gauthier-Villars, <strong>Paris</strong>, 1955.<br />
4 On a proposé d’autres dénominations pour c, comme par ex. “constante <strong>de</strong> structure spatio-temporelle” ou<br />
encore “constante <strong>de</strong> structure <strong>de</strong> l’espace-temps”, voire “constante <strong>de</strong> Lorentz”. L’important est d’éviter une<br />
terminologie trompeuse.<br />
30
On repérera donc désormais un événement dans un reférentiel galiléen donné au moyen <strong>de</strong><br />
quatre coordonnées (x0 ,x1 ,x2 ,x3 ) qu’on appellera <strong>de</strong>s coordonnées galiléennes homogènes (ou<br />
simplement coordonnées galiléennes5 ). Pour abréger, le système (x0 ,x1 ,x2 ,x3 ) sera représenté<br />
par (xα ), l’indice α prenant l’une quelconque <strong>de</strong>s valeurs 0, 1, 2, 3. D’une façon générale, on<br />
représentera les indices variant <strong>de</strong> 0 à 3 par <strong>de</strong>s lettres grecques α,β,...,λ,µ,ν,..., réservant les<br />
lettres latines i,j,k,l,... pour les indices variant <strong>de</strong> 1 à 3.<br />
On admet qu’à un événement donné correspond un quadruplet <strong>de</strong> coordonnées galiléennes<br />
(xα ) et un seul, chacune <strong>de</strong>s variables xα pouvant prendre n’importe quelle valeur entre −∞<br />
en ∞.<br />
Considérons maintenant <strong>de</strong>ux référentiels galiléens S et S ′ en mouvement l’un par rapport<br />
à l’autre. Un point-événement x admet <strong>de</strong>s coordonnées galiléennes (xα ) par rapport à S et<br />
(xβ′ ) par rapport à S ′ . Chaque coordonnée xβ′ est évi<strong>de</strong>mment une fonctions <strong>de</strong>s coordonnées<br />
(xα ), <strong>de</strong> sorte qu’on peut poser<br />
x β′<br />
= F β′<br />
(x 0 ,x 1 ,x 2 ,x 3 ) = F β′<br />
(x α ). (3.4)<br />
Ces transformations <strong>de</strong> coordonnées galiléennes ne peuvent être arbitraires car elles doivent<br />
faire correspondre un mouvement rectiligne uniforme (ou le repos) dans S ′ à un mouvement<br />
rectiligne uniforme (ou le repos) dans S d’après la définition 3.1.1 et le postulat 3.1.1. On peut<br />
montrer 6 que les transformations les plus générales ayant cette propriété sont nécessairement<br />
<strong>de</strong> la forme<br />
α x α + b β′<br />
x β′<br />
= Aβ′<br />
Bλxλ , (3.5)<br />
+ K<br />
où les quantités A β′<br />
α ,b β′<br />
,Bλ et K sont <strong>de</strong>s constantes 7 .<br />
On admet qu’à <strong>de</strong>s coordonnées galiléennes finies dans un référentiel doivent toujours correspondre<br />
<strong>de</strong>s coordonnées galiléennes finies dans n’importe quel autre référentiel 8 . Il faut donc<br />
prendre les quatre constantes Bλ du dénominateur égales à 0 et supposer K = 0. Il est clair<br />
qu’on ne diminue pas la généralité en posant K = 1. En conséquence, nous poserons désormais<br />
que les formules <strong>de</strong> transformation <strong>de</strong>s coordonnées galilénnes sont <strong>de</strong> la forme<br />
x β′<br />
= A β′<br />
α x α + b β′<br />
, (3.6)<br />
où les quantités Aβ′ α et bβ′ sont <strong>de</strong>s constantes. Bien entendu, nous exigerons que les relations<br />
(3.6) soient inversibles, <strong>de</strong> sorte qu’on puisse écrire<br />
où A α β ′ et bα sont également <strong>de</strong>s constantes.<br />
x α = A α β ′xβ′ + b α , (3.7)<br />
5 On a aussi proposé d’appeler ces coordonnées <strong>de</strong>s coordonnées galiléennes réduites. Voir A. Lichnerowicz,<br />
Éléments <strong>de</strong> calcul tensoriel, Armand Colin.<br />
6 Ce théorème a été démontré par V. Fock dans son ouvrage The Theory of Space Time and Gravitation,<br />
Pergamon Press, 1959.<br />
7 On notera que le dénominateur figurant dans le second membre <strong>de</strong> (3.5) est le même pour chacune <strong>de</strong>s<br />
quatre coordonnées.<br />
8 Ne pas exiger cette condition et maintenir la généralité <strong>de</strong>s transformations homographiques (3.5) conduirait<br />
à une “relativité étendue” dont la discussion sortirait du cadre <strong>de</strong> ce cours. On notera que la présence d’un<br />
dénominateur non constant impliquerait l’abandon du postulat d’homogénéité et d’isotropie <strong>de</strong> l’espace associé<br />
à un référentiel galiléen arbitraire<br />
31
On note que ces transformations sont <strong>de</strong>s transformations affines. C’est pourquoi nous<br />
poserons que la variété <strong>de</strong>s événements compatible avec le principe d’inertie et les principes<br />
d’homogénéité <strong>de</strong> l’espace et du temps est un espace affine 9 A4 associé à l’espace vectoriel IR 4 .<br />
Par abus <strong>de</strong> langage, nous i<strong>de</strong>ntifierons A4 et IR 4 .<br />
Les constantes bβ′ et bα sont arbitraires et peuvent être prises égales à 0 par un choix<br />
judicieux <strong>de</strong> l’origine <strong>de</strong>s temps et <strong>de</strong> l’origine <strong>de</strong>s axes spatiaux dans chacun <strong>de</strong>s référentiels<br />
considérés. Par contre, les constantes Aβ′ α et Aα β ′ doivent évi<strong>de</strong>mment dépendre du mouvement<br />
relatif <strong>de</strong>s référentiels galiléens S et S ′ l’un par rapport à l’autre.<br />
3.3 Mouvement relatif <strong>de</strong> <strong>de</strong>ux référentiels galiléens<br />
Il est remarquable que les lois <strong>de</strong> transformation (3.6) et (3.7) permettent <strong>de</strong> spécifier sans<br />
nouvelle hypothèse le mouvement d’un référentiel galiléen par rapport à un autre référentiel<br />
galiléen. Écrivons les relations (3.7) sous la forme plus explicite<br />
x 0 = A 0 0 ′x0′ + A 0 j ′xj′ + b 0 , (3.8)<br />
x i = A i 0 ′x0′ + A i j ′xj′ + b i , (3.9)<br />
et considérons une particule P ′ au repos par rapport au référentiel S ′ . Les coordonnées x j′<br />
<strong>de</strong> P ′ par rapport à S ′ étant <strong>de</strong>s constantes, la différentiation <strong>de</strong>s éqs. (3.8) et (3.9) montre<br />
immédiatement que le vecteur vitesse w <strong>de</strong> P ′ par rapport au référentiel S est un vecteur<br />
constant dont les composantes w i sont données par<br />
w i = dxi<br />
dt<br />
≡ cdxi<br />
dx0 = cAi 0 ′dx0′<br />
A0 0 ′dx0′ = c Ai0 ′<br />
A0 0 ′<br />
. (3.10)<br />
Les composantes constantes w i sont indépendantes <strong>de</strong> la particule au repos par rapport à<br />
S ′ choisie. Par définition, le vecteur constant w est le vecteur vitesse <strong>de</strong> S ′ par rapport à S. Les<br />
formules <strong>de</strong> transformations (3.7) entraînent donc que <strong>de</strong>ux référentiels galiléens S et S ′ sont<br />
en mouvement rectiligne uniforme l’un par rapport à l’autre.<br />
3.4 Intervalle entre <strong>de</strong>ux points-événements<br />
Nous allons voir que l’existence d’une vitesse invariante c entraîne une profon<strong>de</strong> nouveauté<br />
par rapport à l’ancienne physique : l’existence d’un intervalle spatio-temporel entre <strong>de</strong>ux pointsévénements<br />
arbitraires dont la valeur est indépendante du référentiel.<br />
Pour l’établir, donnons-nous <strong>de</strong>ux référentiels galiléens arbitraires S et S ′ et considérons<br />
<strong>de</strong>ux points-événements infiniment voisins x et x + dx. Les coordonnées galiléennes <strong>de</strong> x et<br />
9 On trouvera la définition générale d’un espace affine <strong>de</strong> dimension n dans l’annexe A. Le choix d’un espace<br />
affine comme cadre <strong>de</strong> la physique relativiste fut proposé par le mathématicien Hermann Weyl dès les années<br />
20. Cet auteur affirme en effet “ ... l’univers [en l’absence <strong>de</strong> champ gravitationnel, N.d.A.] est un espace<br />
quadridimensionnel euclidien affine” dans le Chap. III <strong>de</strong> son ouvrage Temps, Espace, Matière : leçons sur la<br />
théorie <strong>de</strong> la relativité générale, trad. franç. <strong>de</strong> la 4 ème édition all. <strong>de</strong> Raum-Zeit-Materie, 1921.<br />
32
x + dx sont respectivement (xα ) et (xα + dxα ) dans S et (xβ′ ) et (xβ′ + dxβ′ ) dans S ′ . Dans<br />
ce paragraphe, nous appelons (L) la transformation du type défini par (3.6) exprimant les<br />
coordonnées (xβ′ ) en fonction <strong>de</strong>s (xα ). On se souviendra que les coefficients Aβ′ α et bβ′ étant<br />
<strong>de</strong>s constantes, on a par différenciation<br />
dx β′<br />
= A β′<br />
α dx α . (3.11)<br />
Supposons d’abord que les points-événements x et x + dx soient reliés par une particule ou<br />
une interaction se propageant avec la vitesse c par rapport à S. Dans ce référentiel, la distance<br />
entre x et x + dx est<br />
dist(x,x + dx) =<br />
<br />
(dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 .<br />
Une propagation avec la vitesse c entre x et x + dx est donc caractérisée par la relation<br />
<br />
(dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 = c|dt| = |dx 0 |,<br />
qui peut encore s’écrire en élevant les <strong>de</strong>ux membres au carré :<br />
(dx 0 ) 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 = 0. (3.12)<br />
D’après le postulat 3.1.4, la propagation considérée s’effectue également avec la vitesse c<br />
par rapport au référentiel galiléen S ′ . La relation<br />
doit donc être satisfaite par les dx β′<br />
(dx 0′<br />
) 2 − (dx 1′<br />
) 2 − (dx 2′<br />
) 2 − (dx 3′<br />
) 2 = 0. (3.13)<br />
définis par (3.11) lorsque les dx α vérifient la condition<br />
(3.12).<br />
Supposons maintenant que x et x + dx soient <strong>de</strong>ux points-événements infiniment proches<br />
arbitraires. Dans S, nous pouvons leur associer l’intervalle ds 2 défini par 10<br />
ds 2 = (dx 0 ) 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 . (3.14)<br />
De même, dans le référentiel galiléen S ′ , nous pouvons leur associer l’intervalle<br />
ds ′2 = (dx 0′<br />
) 2 − (dx 1′<br />
) 2 − (dx 2′<br />
) 2 − (dx 3′<br />
) 2 . (3.15)<br />
D’après ce que nous venons <strong>de</strong> voir, la transformation (L) doit être telle que<br />
ds 2 = 0 =⇒ ds ′2 = 0. (3.16)<br />
Comment (L) transforme-t-elle l’intervalle ds 2 lorsque ds 2 = 0 ? La réponse vient du<br />
théorème suivant, que nous énoncerons sans démonstration.<br />
Théorème 3.4.1 Soit (L) une transformation affine telle que la condition (3.16) soit satisfaite.<br />
Il existe une constante réelle Φ[L] telle que l’égalité<br />
ds ′2 = Φ[L]ds 2 , (3.17)<br />
est réalisée pour n’importe quelle paire <strong>de</strong> points-événements x et x + dx.<br />
10 Nous appelons ds 2 l’intervalle par abus <strong>de</strong> langage. En fait, la notion courante d’intervalle correspondrait à<br />
la racine carrée <strong>de</strong> ds 2 , mais ds 2 n’est pas défini positif, comme on le verra dans la suite...<br />
33
Du point <strong>de</strong> vue mathématique, il est clair que la constante Φ[L] peut recevoir une valeur<br />
arbitraire. Si en effet une transformation (L) satisfait la condition (3.16), la transformation<br />
affine (Lk) définie par<br />
x β′<br />
(k) = k(Aβ′ α x α + b β′<br />
), k = constante = 0<br />
satisfait également cette condition et transforme l’intervalle ds 2 en ds 2 k = Φ[Lk]ds 2 , avec Φ[Lk] =<br />
k 2 Φ[L]. Pour lever cet arbitraire sur Φ[L], il faut maintenant faire intervenir <strong>de</strong>s considérations<br />
physiques.<br />
Tout d’abord Φ[L] ne peut dépendre que <strong>de</strong>s coefficients A β′<br />
α , puisque l’équation (3.17) est<br />
une relation entre les différentielles dx α et dx β′<br />
= A β′<br />
α dx α . Or, les coefficients A β′<br />
α figurant dans<br />
l’expression (3.6) doivent dépendre <strong>de</strong> la vitesse w <strong>de</strong> S par rapport à S ′ . Nous pouvons donc<br />
considérer que le facteur Φ[L] est lui-même une fonction <strong>de</strong> w, ce qui nous conduit à écrire<br />
(3.17) sous la forme<br />
ds ′2 = Φ(w)ds 2 . (3.18)<br />
Mais le postulat d’isotropie <strong>de</strong> l’espace entraîne que le facteur <strong>de</strong> proportionnalité Φ(w)<br />
dépend uniquement <strong>de</strong> la valeur absolue <strong>de</strong> la vitesse w. On peut donc écrire<br />
Bien entendu, on a <strong>de</strong> même<br />
ds ′2 = F(|w|)ds 2 . (3.19)<br />
ds 2 = F(|w ′ |)ds ′2 , (3.20)<br />
où w ′ est la vitesse <strong>de</strong> S par rapport à S ′ . Les équations (3.19) et (3.20) entraînent que<br />
Or, il est manifeste que<br />
F(|w|)F(|w ′ |) = 1. (3.21)<br />
|w ′ | = |w|. (3.22)<br />
En effet, il existe certainement un référentiel galiléen S0 dans lequel les origines O et O ′ se<br />
déplacent sur une droite commune avec <strong>de</strong>s vitesses opposées u0 et −u0. Pour les observateurs<br />
au repos par rapport à S0, les observateurs liés à S et à S ′ sont dans <strong>de</strong>s situations symétriques<br />
et doivent en conséquence s’attribuer <strong>de</strong>s vitesses relatives égales en valeur absolue, sinon le<br />
postulat d’isotropie ne serait pas respecté.<br />
Il résulte <strong>de</strong> (3.21) et (3.22) que [F(|w|)] 2 = 1. Comme on doit poser F = 1 lorsque w = 0,<br />
on prendra<br />
F(|w|) = 1. (3.23)<br />
Par conséquent, les transformations <strong>de</strong> coordonnées galiléennes (3.6) doivent être telles que<br />
l’égalité<br />
ds 2 = ds ′2<br />
(3.24)<br />
soit satisfaite pour n’importe quel couple <strong>de</strong> points-événements infiniment voisins. L’égalité<br />
(3.24) signifie que le ds 2 entre <strong>de</strong>ux points-événements infiniment voisins est une quantité<br />
absolue, i.e. invariante par les changements <strong>de</strong> référentiels et indépendante <strong>de</strong> tout choix d’observateurs.<br />
D’où la proposition suivante, qui constitue la proposition fondamentale sur laquelle<br />
est bâtie toute la théorie.<br />
34
Proposition 3.4.1 (Invariance <strong>de</strong> l’intervalle) Soient S et S ′ <strong>de</strong>ux référentiels galiléens.<br />
Toute transformation (L) exprimant les coordonnées galiléennes d’un point-événement arbitraire<br />
par rapport à S ′ en fonction <strong>de</strong>s coordonnées galiléennes <strong>de</strong> ce point-événement par rapport<br />
à S est une transformation affine (3.6) qui laisse invariantes la valeur et la forme <strong>de</strong><br />
l’intervalle ds 2 défini par (3.14) ou <strong>de</strong> manière équivalente par (3.25)-(3.26) .<br />
Les transformations (3.6) laissant invariant l’intervalle entre <strong>de</strong>ux points-événements sont<br />
appelées transformations <strong>de</strong> Lorentz inhomogènes lorsque les constantes b µ′ ne sont pas toutes<br />
nulles et transformations <strong>de</strong> Lorentz homogènes lorsque b µ′ = 0. Ces transformations forment<br />
un groupe, qu’on appelle le groupe <strong>de</strong> Lorentz. Nous verrons dans le chapitre suivant comment<br />
déterminer ces transformations.<br />
Du fait que l’intervalle ds 2 entre <strong>de</strong>ux points-événements x et x + dx possè<strong>de</strong> une valeur<br />
indépendante du référentiel galiléen choisi, on peut munir la variété fondamentale V4 <strong>de</strong> la<br />
métrique définie par la forme quadratique <strong>de</strong> différentielles (3.14), à laquelle on donne le nom<br />
<strong>de</strong> métrique <strong>de</strong> Minkowski. La variété fondamentale que nous avons i<strong>de</strong>ntifée avec l’espace affine<br />
IR 4 munie <strong>de</strong> cette métrique est appelée l’espace-temps <strong>de</strong> Minkowski. La théorie <strong>de</strong> la relativité<br />
restreinte a pour objet <strong>de</strong> construire la physique dans cet espace-temps.<br />
La métrique (3.14) diffère d’une métrique proprement euclidienne par la présence du signe<br />
- <strong>de</strong>vant chaque terme spatial (dx i ) 2 . D’une manière générale, la différence σ entre le nombre<br />
<strong>de</strong> signes + et le nombre <strong>de</strong> signes - dans la forme diagonale d’une métrique constitue ce qu’on<br />
appelle la signature <strong>de</strong> cette métrique. La signature <strong>de</strong> la métrique <strong>de</strong> Minkowski écrite sous la<br />
forme (3.14) est donc σ = −2.<br />
Nous utiliserons la signature σ = −2 dans ce cours, mais il faut noter qu’on pourrait tout<br />
aussi bien écrire la métrique <strong>de</strong> Minkowski sous la forme<br />
ds 2 = (dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 − (dx 0 ) 2 ,<br />
auquel cas la signature serait égale à 2. L’écriture conventionnelle avec σ = 2 est d’usage<br />
recommandé par l’Union Astronomique Internationale.<br />
Dans un système <strong>de</strong> coordonnées galiléennes (x α ) arbitraire, la métrique <strong>de</strong> l’espace-temps<br />
<strong>de</strong> Minkowski peut s’écrire sous la forme plus con<strong>de</strong>nsée<br />
les quantités ηαβ étant définies par<br />
ds 2 = ηαβ dx α dx β , (3.25)<br />
η00 = 1, η11 = η22 = η33 = −1, ηαβ = 0 si α = β. (3.26)<br />
Dans n’importe quel autre système <strong>de</strong> coordonnées galiléennes (xβ′ ), la métrique s’écrira<br />
bien entendu<br />
avec<br />
ds 2 = ηγ ′ δ ′ dxγ′ dx δ′<br />
, (3.27)<br />
η0 ′ 0 ′ = 1, η1 ′ 1 ′ = η2 ′ 2 ′ = η3 ′ 3 ′ = −1, ηγ ′ δ ′ = 0 si γ′ = δ ′ .<br />
35
3.5 Classification <strong>de</strong>s intervalles. Cône isotrope<br />
Il résulte immédiatement du caractère affine <strong>de</strong>s transformations <strong>de</strong> Lorentz que l’on peut<br />
parler <strong>de</strong> l’invariance <strong>de</strong> l’intervalle entre <strong>de</strong>ux points-événements x et y dont les coordonnées<br />
diffèrent par <strong>de</strong>s quantités finies. Si (x α ) et (y α ) sont les coordonnées galiléennes respectives <strong>de</strong><br />
x et <strong>de</strong> y par rapport à un référentiel galiléen arbitraire, l’intervalle entre x et y est défini par<br />
la relation<br />
s 2 xy = (y 0 − x 0 ) 2 − (y 1 − x 1 ) 2 − (y 2 − x 2 ) 2 − (y 3 − x 3 ) 2 , (3.28)<br />
qui s’écrit encore<br />
s 2 xy = ηαβ(y α − x α )(y β − x β ), (3.29)<br />
Soient <strong>de</strong>ux points-événements x et y distincts. Cherchons sous quelle condition il existe<br />
un référentiel galiléen S0 dans lequel ces <strong>de</strong>ux points-événements ont les mêmes coordonnées<br />
spatiales. Dans un tel référentiel, l’intervalle s 2 xy aura pour expression<br />
s 2 xy = (y 0 0 − x 0 0) 2<br />
puisque par hypothèse x i 0 = y i 0 pour i = 1, 2, 3. L’équation (3.30) montre qu’on doit avoir<br />
(3.30)<br />
s 2 xy > 0. (3.31)<br />
On dit qu’un intervalle satisfaisant à la condition (3.31) est du genre temps.<br />
Par définition, x et y sont simultanés dans un référentiel S si y 0 = x 0 dans ce référentiel.<br />
Pour qu’un tel référentiel existe, il faut que la condition<br />
s 2 xy < 0 (3.32)<br />
soit satisfaite. Si en effet on a y 0 = x 0 dans S, l’intervalle s 2 xy a pour expression<br />
s 2 xy = −(y 1 − x 1 ) 2 − (y 2 − x 2 ) 2 − (y 3 − x 3 ) 2<br />
Un intervalle satisfaisant à la condition (3.32) est dit du genre espace.<br />
Enfin, l’intervalle entre x et y est dit isotrope si<br />
(3.33)<br />
s 2 xy = 0. (3.34)<br />
L’équation (3.34) est la condition nécessaire et suffisante pour qu’une particule se mouvant<br />
(ou une interaction se propageant) avec la vitesse c puisse relier x et y.<br />
Les conditions (3.31), (3.32) et (3.34) sont complètement indépendantes du référentiel<br />
puisque l’intervalle est un invariant. La classification qui en résulte a donc une signification absolue.<br />
Cette classification conduit à introduire en chaque point-événement x l’objet géométrique<br />
intrinsèque (i.e. indépendant du référentiel) qu’on appelle le cône isotrope 11 <strong>de</strong> sommet x.<br />
11 On dit aussi cône <strong>de</strong> lumière <strong>de</strong> sommet x, mais nous éviterons cette terminologie pour les raisons invoquées<br />
à la fin <strong>de</strong> la sect. 3.1.<br />
36
Γ<br />
+<br />
x<br />
Ailleurs <strong>de</strong> x<br />
Γ<br />
−<br />
x<br />
Futur <strong>de</strong> x<br />
x<br />
Passé <strong>de</strong> x<br />
Ailleurs <strong>de</strong> x<br />
Fig. 3.1 – Passé, futur, et ailleurs d’un point x.<br />
Définition 3.5.1 (Cône isotrope <strong>de</strong> sommet x) Étant donné un point-événement x quelconque,<br />
on appelle cône isotrope <strong>de</strong> sommet x et on note Γx l’ensemble <strong>de</strong>s points-événements<br />
y tels que l’intervalle entre x et y soit nul. Dans un référentiel galiléen arbitraire, l’équation du<br />
cône Γx est :<br />
s 2 xy ≡ ηαβ(y α − x α )(y β − x β ) = 0. (3.35)<br />
Le cône Γx est composé du point x, d’une nappe Γ + x correspondant à y 0 −x 0 > 0, dite nappe<br />
future, et d’une nappe Γ − x correspondant à y 0 − x 0 < 0, dite nappe passée. Le cône isotrope <strong>de</strong><br />
sommet x divise donc l’espace-temps <strong>de</strong> Minkowski en trois régions attachées à x (voir fig. 3.1).<br />
1. Le futur <strong>de</strong> x, défini comme l’ensemble Fx <strong>de</strong>s points-événements y tels que s 2 xy ≥ 0 et<br />
y 0 − x 0 > 0 :<br />
Fx = {y | s 2 xy ≥ 0 et y 0 − x 0 > 0}. (3.36)<br />
2. Le passé <strong>de</strong> x, défini comme l’ensemble Px <strong>de</strong>s points-événements y tels que s 2 xy ≥ 0 et<br />
y 0 − x 0 < 0 :<br />
Px = {y | s 2 xy ≥ 0 et y 0 − x 0 < 0}. (3.37)<br />
3. L’ailleurs <strong>de</strong> x, défini comme l’ensemble Ax <strong>de</strong>s points-événements y tels que s 2 xy < 0 :<br />
Ces dénominations se comprennent par elles-mêmes.<br />
3.6 Lignes d’univers du genre temps<br />
Ax = {y | s 2 xy < 0}. (3.38)<br />
On dira qu’un point-événement x appartient à l’histoire d’une particule si la particule<br />
coïnci<strong>de</strong> avec l’événement x au moment où il se produit. D’après ce qui a été expliqué dans le<br />
premier chapitre, cette notion est totalement indépendante du choix d’un système <strong>de</strong> référence.<br />
37
Donnons-nous un référentiel galiléen arbitraire S rapporté à un système <strong>de</strong> coordonnées<br />
galilénnes (x 0 ,x i ) et considérons une particule P <strong>de</strong> vecteur vitesse v par rapport à S, ce vecteur<br />
pouvant varier au cours du temps. Soient x et x+dx <strong>de</strong>ux points-événements infiniment voisins<br />
appartenant à l’histoire <strong>de</strong> P. Compte tenu <strong>de</strong> la relation dx = vdt, l’élément d’intervalle ds 2<br />
entre ces <strong>de</strong>ux points-événements est d’après (3.14) :<br />
x<br />
0<br />
O<br />
ds 2 = c 2 dt 2 − dx 2 = (c 2 − |v| 2 )dt 2 . (3.39)<br />
x<br />
2<br />
x (s)<br />
Fig. 3.2 – Ligne d’univers d’une particule.<br />
On voit que ds2 > 0 si et seulement si |v| < c. Or, ds2 est un invariant. On peut donc écrire<br />
ds2 = (c2 − |v ′ | 2 )dt ′2 dans tout référentiel galiléen S ′ rapporté à <strong>de</strong>s coordonnées galiléennes<br />
(x0′ ,xj′ ), v ′ étant la vitesse <strong>de</strong> P par rapport à S ′ . D’où la proposition qui suit.<br />
Proposition 3.6.1 Si une particule est <strong>de</strong> vitesse |v| < c en x dans un référentiel galiléen,<br />
alors cette particule est <strong>de</strong> vitesse inférieure à c en x dans tous les référentiels galiléens.<br />
Un corollaire immédiat <strong>de</strong> ce qui précè<strong>de</strong> est que si une particule avait une vitesse |v| > c<br />
dans un référentiel galiléen donné, elle aurait une vitesse supérieure à c dans n’importe quel<br />
autre référentiel galiléen. Enfin, on retrouve évi<strong>de</strong>mment à partir <strong>de</strong> (3.39) qu’une particule <strong>de</strong><br />
vitesse |v| égale à c dans S sera également <strong>de</strong> vitesse c dans n’importe quel autre référentiel,<br />
ce qui est naturel puisque c est par hypothèse une vitesse invariante.<br />
On dira qu’un référentiel galiléen S0 est instantanément comouvant avec la particule en x<br />
lorsque x et x + dx ont les mêmes coordonnées spatiales dans S0, i.e. lorsque (dx i )S0 = 0.<br />
Cette définition signifie simplement que la particule P est au repos instantané par rapport à<br />
S0 au moment où se produit l’événement x. Or, d’après ce que nous avons vu dans la section<br />
précé<strong>de</strong>nte, cette occurrence se réalise uniquement si ds 2 > 0. Il faut donc que la condition<br />
|v| < c soit satisfaite dans un référentiel galiléen arbitraire. Un référentiel galiléen <strong>de</strong>vant<br />
évi<strong>de</strong>mment être comouvant avec chacun <strong>de</strong> ses points (i.e. avec chacune <strong>de</strong>s particules qui lui<br />
sont liées), on est conduit à formuler la proposition qui suit.<br />
38<br />
x<br />
1
Proposition 3.6.2 La valeur absolue <strong>de</strong> la vitesse relative <strong>de</strong> <strong>de</strong>ux référentiels galiléens arbitraires<br />
est toujours inférieure à la vitesse fondamentale c.<br />
Il est dès lors naturel <strong>de</strong> supposer que les observateurs sont constitués <strong>de</strong> particules dont<br />
la vitesse est toujours inférieure à c. Il est en effet difficile <strong>de</strong> concevoir un observateur (i.e. un<br />
instrument <strong>de</strong> physique) qui ne pourrait être au repos par rapport à aucun référentiel galiléen.<br />
C’est pourquoi nous poserons le postulat qui suit.<br />
Postulat 3.6.1 Soit P un observateur considéré comme ponctuel, décrit dans un référentiel<br />
galiléen arbitraire muni d’un système <strong>de</strong> coordonnées galiléennes (x 0 ,x 1 ,x 2 ,x 3 ), avec x 0 = ct.<br />
Pour tout couple d’événements infiniment voisins appartenant à l’histoire <strong>de</strong> cet observateur,<br />
l’inégalité<br />
ds 2 = c 2 dt 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 > 0 (3.40)<br />
est satisfaite.<br />
La condition (3.40) traduit simplement le postulat qu’un observateur a toujours une vitesse<br />
inférieure à c dans n’importe quel référentiel galiléen. En fait, on admet <strong>de</strong> façon plus générale<br />
qu’il n’existe pas <strong>de</strong> particules ayant une vitesse > c. On peut montrer en effet que l’existence<br />
<strong>de</strong> telles particules (tachyons) entraînerait <strong>de</strong>s violations <strong>de</strong> la causalité.<br />
Il découle <strong>de</strong> ce qui précè<strong>de</strong> que les courbes <strong>de</strong> l’espace-temps le long <strong>de</strong>squelles l’inégalité<br />
(3.40) est satisfaite jouent un rôle fondamental dans la théorie puisqu’elles peuvent être considérées<br />
comme <strong>de</strong>s histoires d’observateurs possibles. On les appelle lignes d’univers du genre temps<br />
(fig. 3.2).<br />
3.7 Temps propre<br />
Par hypothèse, la particule considérée dans ce qui suit possè<strong>de</strong> une ligne d’univers du genre<br />
temps. On désigne par x et x + dx <strong>de</strong>ux points-événements infiniment voisins appartenant à<br />
l’histoire <strong>de</strong> cette particule : x + dx est supposé situé dans le futur <strong>de</strong> x, et on adopte dès lors<br />
la convention ds > 0 pour l’intervalle entre x et x + dx.<br />
Par rapport au référentiel S0 instantanément comouvant en x avec cette particule (cf. section<br />
précé<strong>de</strong>nte), l’intervalle ds 2 entre x et x + dx a pour expression d’après (3.30) :<br />
ce qui entraîne avec notre convention <strong>de</strong> signe sur ds :<br />
ds 2 = c 2 dt 2 0 , (3.41)<br />
ds = cdt0 . (3.42)<br />
D’après la partie a) du postulat 3.1.2, dt0 est la durée mesurée entre x et x + dx par une<br />
horloge standard au repos par rapport à S0. La quantité dt0 représente donc ce qu’on peut<br />
appeler le laps <strong>de</strong> temps propre dτ mesuré entre x et x + dx par une horloge standard H0 en<br />
mouvement inertiel instantanément comouvante avec la particule P. Si la particule P est ellemême<br />
en mouvement inertiel (particule isolée), il est naturel <strong>de</strong> regar<strong>de</strong>r la quantité dτ donnée<br />
par<br />
dτ = ds<br />
(3.43)<br />
c<br />
39
comme le laps <strong>de</strong> temps propre <strong>de</strong> la particule écoulé entre les points-événements x et x + dx.<br />
Cette i<strong>de</strong>ntification <strong>de</strong> dt0 avec un laps <strong>de</strong> temps propre infinitésimal <strong>de</strong> la particule s’impose<br />
d’elle-même.<br />
Lorsque la particule P est animée d’un mouvement quelconque (mouvement non inertiel ou<br />
accéléré), la relation (3.42) et l’interprêtation <strong>de</strong> dt0 comme temps propre <strong>de</strong> H0 restent vraies<br />
mais il ne va plus <strong>de</strong> soi qu’on peut i<strong>de</strong>ntifier dt0 avec un laps <strong>de</strong> temps propre <strong>de</strong> la particule<br />
accélérée. On admet néanmoins cette i<strong>de</strong>ntification en la posant comme une définition.<br />
Définition 3.7.1 Soit P une particule dont la ligne d’univers est du genre temps. On appelle<br />
temps propre <strong>de</strong> cette particule entre <strong>de</strong>ux événements x et x + dx <strong>de</strong> son histoire la quantité<br />
dτ définie par<br />
dτ = ds<br />
. (3.44)<br />
c<br />
Il faut souligner que la relation (3.44) est complètement indépendante du référentiel choisi,<br />
ainsi que du système <strong>de</strong> coordonnées adopté. Nous avons vu en effet que ds est une quantité<br />
invariante attachée à <strong>de</strong>ux points-événements x et x + dx : une telle quantité est absolue.<br />
Dans la pratique, il sera souvent indispensable d’expliciter dτ en fonction <strong>de</strong>s coordonnées.<br />
Lorsqu’on choisit un référentiel galiléen arbitraire S rapporté à un système <strong>de</strong> coordonnés<br />
galiléennes x 0 = ct,x i , on a évi<strong>de</strong>mment<br />
dτ = 1<br />
c<br />
c<br />
2dt2 − (dx1 ) 2 − (dx2 ) 2 − (dx3 ) 2 . (3.45)<br />
La définition 3.7.1 est adoptée parce que l’expérience montre que le temps propre délivré<br />
par une horloge atomique idéale satisfait la relation (3.44), au moins tant que l’accélération <strong>de</strong><br />
cette horloge n’est pas trop gran<strong>de</strong>... C’est pourquoi on adopte en pratique le postulat suivant.<br />
Postulat 3.7.1 (Hypothèse <strong>de</strong>s horloges atomiques) Le laps <strong>de</strong> temps dτ mesuré entre<br />
<strong>de</strong>ux événements x et x + dx <strong>de</strong> l’histoire d’une horloge atomique idéale ne dépend pas <strong>de</strong><br />
l’accélération <strong>de</strong> cette <strong>de</strong>rnière et satisfait la relation dτ = ds/c.<br />
Le postulat 3.7.1 équivaut à l’hypothèse que <strong>de</strong>ux atomes i<strong>de</strong>ntiques situés au même pointévénement<br />
et instantanément comouvants présentent le même spectre <strong>de</strong> raies à un observateur<br />
donné, indépendamment <strong>de</strong> leurs accélérations respectives 12 . Il faut souligner le caractère approché<br />
<strong>de</strong> ce postulat, qui contraste avec les postulats précé<strong>de</strong>nts que l’on pouvait tenir pour<br />
rigoureux. On ne voit en effet pas pourquoi les raies spectrales d’un atome seraient totalement<br />
insensibles à l’accélération <strong>de</strong> ce <strong>de</strong>rnier. Néanmoins, on peut noter que l’accélération <strong>de</strong>s atomes<br />
utilisés dans les horloges atomiques dans les conditions expérimentales usuelles est bien plus<br />
faible que l’accélération d’un électron autour du noyau. Le postulat 3.7.1 paraît donc légitime<br />
et n’est contredit par aucune expérience.<br />
12 En toute rigueur, il faut restreindre cet énoncé aux raies <strong>de</strong> très hautes fréquences telles que celles qui sont<br />
utilisées dans les horloges actuelles (approximation <strong>de</strong> l’optique géométrique). Pour les basses fréquences, l’effet<br />
Doppler est affecté par l’accélération <strong>de</strong> la source (ainsi que par l’accélération <strong>de</strong> l’observateur).<br />
40
Compte tenu <strong>de</strong> (3.39), l’équation (3.44) donne la relation suivante entre la différentielle <strong>de</strong><br />
temps propre et la différentielle <strong>de</strong> temps coordonnée :<br />
<br />
<br />
v 2<br />
dτ = dt 1 −<br />
c<br />
. (3.46)<br />
On écrit souvent (3.46) sous la forme<br />
où Γ est défini par<br />
Γ =<br />
dt<br />
dτ<br />
<br />
= Γ, (3.47)<br />
1<br />
1 − v<br />
c<br />
Γ est appelé le facteur <strong>de</strong> Lorentz 13 .<br />
Il résulte immédiatement <strong>de</strong> (3.48) que Γ = 1 si v = 0 et<br />
2 . (3.48)<br />
Γ > 1 si v = 0. (3.49)<br />
L’inégalité (3.49) est équivalente à dt > dτ si v = 0. C’est pourquoi on appelle (3.47)<br />
la formule <strong>de</strong> dilatation <strong>de</strong>s durées. Il faut toutefois faire très attention à la signification <strong>de</strong>s<br />
quantités qui interviennent dans cette formule. La quantité dτ est indépendante du référentiel<br />
dans lequel on décrit le mouvement (on a souligné ci-<strong>de</strong>ssus que dτ est une quantité intrinsèque).<br />
Par contre, dt et v sont <strong>de</strong>s quantités qui dépen<strong>de</strong>nt du référentiel dans lequel on décrit le<br />
mouvement.<br />
Bien entendu, les relations (3.44) et (3.45) peuvent être intégrées le long <strong>de</strong> la ligne d’univers<br />
d’une particule. On obtient alors la proposition fondamentale suivante.<br />
Proposition 3.7.1 Soit P une particule dont la ligne d’univers C est <strong>de</strong> genre temps. On<br />
appelle x1 et x2 <strong>de</strong>ux points-événements <strong>de</strong> l’histoire <strong>de</strong> cette particule, numérotés <strong>de</strong> telle sorte<br />
que x2 soit dans le futur <strong>de</strong> x1. Le temps propre τ12[C] mesuré entre x1 et x2 par une horloge<br />
standard comouvante avec la particule P est alors donné par<br />
x2<br />
τ12[C] =<br />
x1<br />
dτ = 1<br />
c<br />
x2<br />
ds, (3.50)<br />
où les intégrales sont <strong>de</strong>s intégrales curvilignes prises le long <strong>de</strong> C.<br />
Soit<br />
x α = x α (ℓ) (3.51)<br />
un système d’équations paramétriques <strong>de</strong> la ligne d’univers <strong>de</strong> P dans un système <strong>de</strong> coordonnées<br />
galiléennes xα arbitrairement choisi, les xα (ℓ) désignant <strong>de</strong>s fonctions continûment<br />
différentiables d’un paramètre réel ℓ lui-même arbitrairement choisi. Si on appelle ℓ1 et ℓ2 les<br />
valeurs <strong>de</strong> ℓ correspondant respectivement à x1 et à x2, τ12[C] est alors donné par<br />
ℓ2<br />
τ12[C] =<br />
l’intégrale étant prise le long <strong>de</strong> C.<br />
ℓ1<br />
dx 0<br />
dℓ<br />
2 − dx 1<br />
dℓ<br />
x1<br />
2 − dx 2<br />
dℓ<br />
2 <br />
dx3 2<br />
− dℓ<br />
dℓ, (3.52)<br />
13 Ce facteur est très souvent représenté par la lettre γ, mais nous évitons cette notation pour éviter tout<br />
risque <strong>de</strong> confusion avec le paramètre postnewtonien γ dans les théories <strong>de</strong> la gravitation.<br />
41
Le paramétre ℓ intervenant dans l’éq. (3.52) étant arbitraire, nous pouvons prendre le tempscoordonnée<br />
t comme paramètre, et la formule (3.52) s’écrit alors<br />
De l’inégalité<br />
t2<br />
τ12[C] =<br />
t1<br />
<br />
1 − 1<br />
c2 <br />
dxdt 2dt t2<br />
=<br />
t1<br />
<br />
1 − 1<br />
c2 2 dxdt ≤ 1, on déduit qu’on a toujours<br />
dt<br />
. (3.53)<br />
Γ<br />
τ12[C] ≤ t2 − t1 . (3.54)<br />
L’égalité τ12[C] = t2 − t1 est réalisée si et seulement si la vitesse <strong>de</strong> P par rapport à S est<br />
constamment nulle. Dans tous les autres cas, on a l’inégalité au sens strict<br />
τ12[C] < t2 − t1 . (3.55)<br />
L’inégalité (3.55) s’applique en particulier lorsque x1 et x2 sont <strong>de</strong>s événements se produisant<br />
au même point A <strong>de</strong> l’espace du référentiel S, alors que la particule P n’est pas au repos par<br />
rapport à S entre x1 et x2 (fig. 3.3). L’inégalité (3.55) constitue alors ce qu’on a appelé le<br />
“paradoxe <strong>de</strong>s jumeaux” ou encore le “paradoxe du voyageur <strong>de</strong> Langevin”. La différence t2 −t1<br />
est en effet le temps propre vécu entre x1 et x2 par un observateur au repos en A, tandis que<br />
τ12[C] est le temps propre vécu par un observateur OC comouvant avec la particule P. Si on<br />
appelle C0 la ligne d’univers d’un observateur au repos en A, la formule (3.53) donne<br />
et l’inégalité (3.55) <strong>de</strong>vient<br />
t2 − t1 = τ12[C0]<br />
τ12[C] < τ12[C0],<br />
ce qui montre qu’entre les événements x1 et x2, l’observateur au repos en A a vieilli davantage<br />
que l’observateur qui a voyagé.<br />
Cette conséquence remarquable <strong>de</strong> la relativité restreinte a été vérifiée expérimentalement<br />
avec <strong>de</strong>s horloges atomique embarquées à bord d’un avion effectuant le tour <strong>de</strong> la Terre 14 , ainsi<br />
qu’avec <strong>de</strong>s muons du rayonnement cosmique 15 .<br />
On remarque qu’un observateur au repos en A par rapport à S est en mouvement rectiligne<br />
uniforme dans n’importe quel autre référentiel galiléen. Comme l’inégalité τ[C0] ≤ τ[C] est<br />
invariante par les changements <strong>de</strong> référentiels, nous pouvons énoncer la proposition suivante.<br />
Proposition 3.7.2 Soient x1 et x2 <strong>de</strong>ux points-événements distincts reliés par la ligne d’univers<br />
C d’une particule P dont la vitesse est constamment inférieure à c. Si C0 désigne la droite<br />
<strong>de</strong> l’espace-temps <strong>de</strong> Minkowski passant par x1 et x2, l’inégalité<br />
τ12[C] ≤ τ12[C0] (3.56)<br />
est satisfaite, l’égalité étant réalisée si et seulement si C est confondue avec C0.<br />
14 Expérience <strong>de</strong> Hafele et Keating. Voir par ex. J. C. Hafele, American Journal of Physics, vol. 40, p. 81<br />
(1972).<br />
15 Expérience <strong>de</strong> D. H. Frisch et J. H. Smith, American Journal of Physics, vol. 31, p. 342 (1963). Une analyse<br />
très claire est donnée par Y. Simon, Relativité restreinte, Cours et applications, Vuibert, 2004.<br />
42
ct<br />
ct<br />
x<br />
0<br />
2 2<br />
x<br />
x<br />
1 1<br />
i i x = x = x<br />
1<br />
C C<br />
0<br />
2<br />
i<br />
A<br />
Fig. 3.3 – “Paradoxe <strong>de</strong>s jumeaux” : on a τ12[C] < t2 − t1, alors que τ12[C0] = t2 − t1.<br />
Il résulte <strong>de</strong> cette proposition que la droite <strong>de</strong> genre temps C0 reliant x1 et x2 réalise la<br />
ligne d’univers <strong>de</strong> plus long temps propre entre x1 et x2. Étant donné que ds et dτ diffèrent par<br />
un facteur constant, on peut énoncer que C0 réalise un extremum (ici un maximum) <strong>de</strong> ds.<br />
Cette propriété fondamentale signifie que la ligne d’univers d’une particule libre (mouvement<br />
inertiel) est une géodésique16 du genre temps <strong>de</strong> l’espace-temps <strong>de</strong> Minkowski.<br />
On notera que la propriété <strong>de</strong> C0 <strong>de</strong> réaliser le plus long temps propre est en contraste<br />
total avec la propriété bien connue <strong>de</strong> la droite euclidienne usuelle <strong>de</strong> réaliser comme on le<br />
sait le plus court chemin spatial entre <strong>de</strong>ux points donnés. En fait, la propriété <strong>de</strong> longueur<br />
temporelle maximale <strong>de</strong> C0 est due à la présence du signe - <strong>de</strong>vant chacun <strong>de</strong>s termes (dxi ) 2<br />
dans la métrique <strong>de</strong> Minkowski.<br />
Exercice : mouvement uniformément accéléré au sens relativiste.— On considère<br />
un observateur P dont la ligne d’univers C est définie dans un référentiel galiléen S par les<br />
équations paramétriques 17 :<br />
x 0 = c2 aτ<br />
sinh ,<br />
a c<br />
x<br />
(3.57)<br />
1 = c2<br />
<br />
cosh<br />
a<br />
aτ<br />
<br />
− 1 ,<br />
c<br />
(3.58)<br />
x 2 = 0, (3.59)<br />
x 3 = 0, (3.60)<br />
où τ varie entre 0 et ∞ et a est une constante ayant la dimension d’une accélération (m.s −2 ).<br />
On suppose a > 0.<br />
1. Déterminer x 1 en fonction du temps t = x 0 /c. En déduire l’expression <strong>de</strong> la vitesse<br />
v 1 = dx 1 /dt et <strong>de</strong> la dérivée dv 1 /dt en fonction <strong>de</strong> t. Montrer que le mouvement défini par<br />
(3.57)-(3.60) se confond pratiquement avec un mouvement uniformément accéléré au sens usuel<br />
le long <strong>de</strong> l’axe <strong>de</strong>s x 1 lorsque t
une expression approchée <strong>de</strong> x 1 (t),v 1 (t) et dv 1 (t)/dt lorsque t >> c/a. Comment interprêter<br />
ces résultats ?<br />
2. Calculer (x 0 ) 2 −(x 1 +c 2 /a) 2 en tout point <strong>de</strong> C. En déduire la nature géométrique <strong>de</strong> C.<br />
Donner une représentation graphique <strong>de</strong> C dans le plan Ox 1 x 0 . Cette représentation graphique<br />
permet-elle <strong>de</strong> comprendre les réponses apportées à la première question ?<br />
3. Déterminer le temps propre <strong>de</strong> la particule entre le point-événement correspondant à τ0<br />
et le point-événement correspondant à τ. Comment peut-on interprêter le paramètre τ figurant<br />
dans (3.57) et (3.58) ?<br />
4. Exprimer ce temps propre en fonction <strong>de</strong> la coordonnée t. Appliquer la formule obtenue<br />
en posant a = g = 9, 81 m.s −1 dans les cas suivants : a) t = 1 jour ; b) t = 10 6 années. On<br />
prendra c = 3×10 8 m.s −1 , 1 jour = 86400 s, 1 année = 3, 15569×10 7 s. Commenter les résultats<br />
obtenus.<br />
Solution.<br />
1. Les équations (3.59) et (3.60) montrent que le mouvement <strong>de</strong> P s’effectue sur l’axe <strong>de</strong>s<br />
x 1 . Il est facile d’éliminer le paramètre τ entre les éqs. (3.57) et (3.58). En utilisant l’i<strong>de</strong>ntité<br />
cosh 2 x − sinh 2 x = 1 l’équation (3.57) peut s’écrire<br />
x 1 = c2<br />
a<br />
<br />
1 + sinh 2 aτ<br />
c<br />
<br />
− 1<br />
(3.61)<br />
Or, d’après (3.57)<br />
sinh aτ at<br />
= . (3.62)<br />
c c<br />
Substituons dans (3.61). On obtient l’équation horaire cherchée :<br />
x 1 = c2<br />
⎡<br />
⎣ 1 +<br />
a<br />
a2t2 ⎤<br />
− 1⎦<br />
. (3.63)<br />
c2 On déduit <strong>de</strong> (3.63) l’expression <strong>de</strong> la vitesse<br />
qui s’écrit encore<br />
v 1 = dx1<br />
dt =<br />
v 1 =<br />
at<br />
<br />
1 + a2 t 2<br />
c 2<br />
c<br />
<br />
1 + c2<br />
a 2 t 2<br />
La dérivée <strong>de</strong> v 1 par rapport à t est donnée par<br />
dv 1<br />
dt =<br />
<br />
a<br />
1 + a2 t 2<br />
c 2<br />
L’équation (3.66) montre immédiatement que<br />
dv 1<br />
dt<br />
(3.64)<br />
. (3.65)<br />
3/2 . (3.66)<br />
≈ a (3.67)<br />
lorsque t
préeinsteinienne. On notera que pour a = g = 9, 81 m.s −2 , on a c/a = 3, 06 × 10 7 s ≈ 1 an.<br />
Cette durée permet <strong>de</strong> comprendre pourquoi la différence entre les <strong>de</strong>ux mouvements n’est pas<br />
facilement décelable dans les conditions d’expérimentations usuelles.<br />
La formule (3.64) montre que lorsque t s’accroît, la vitesse <strong>de</strong> P s’approche indéfiniment <strong>de</strong><br />
la vitesse constante c. Lorsque t >> c/a, on peut négliger 1 dans le radical<br />
écrire<br />
x 1 (t) ≈ ct, v 1 dv<br />
(t) ≈ c,<br />
1<br />
≈ 0. (3.68)<br />
dt<br />
<br />
1 + a2 t 2<br />
c 2 et on peut<br />
Vu dans le référentiel S, le mouvement <strong>de</strong> P tend à se confondre avec un mouvement<br />
uniforme s’effectuant avec la vitesse c, sans jamais toutefois atteindre cette limite !<br />
2. L’i<strong>de</strong>ntité cosh 2 x − sinh 2 x = 1 entraîne que<br />
(x 0 ) 2 −<br />
<br />
x 1 + c2<br />
a<br />
2<br />
= − c4<br />
a 2.<br />
(3.69)<br />
Cette équation montre que la ligne d’univers <strong>de</strong> P est un arc d’hyperbole admettant la<br />
droite isotrope x0 = x1 + c2 comme asymptote lorsque τ → ∞.<br />
a<br />
3. Considérons <strong>de</strong>ux points-événements infiniment voisins x et x+dx appartenant à la ligne<br />
d’univers <strong>de</strong> P. En différentiant les équations par rapport au paramètre τ, on voit que<br />
dx 0 = c cosh aτ<br />
c dτ, dx1 = c sinh aτ<br />
c dτ, dx2 = 0, dx 3 = 0. (3.70)<br />
L’élément ds 2 le long <strong>de</strong> C est donc donné par<br />
ds 2 = (dx 0 ) 2 − (dx 1 ) 2 = c 2<br />
<br />
cosh 2 aτ<br />
c − sinh2 <br />
aτ<br />
dτ<br />
c<br />
2 = c 2 dτ 2 . (3.71)<br />
On en conclut que le paramètre τ figurant dans les équations (3.57)-(3.60) est le laps <strong>de</strong> temps<br />
propre <strong>de</strong> l’observateur qui s’écoule entre le point-événement (0, 0, 0, 0) et le point-événement<br />
x(τ) dont les coordonnées sont données par les équations (3.57)-(3.60).<br />
4. On peut écrire (3.57) sous la forme<br />
at<br />
c<br />
= sinh aτ<br />
c<br />
. (3.72)<br />
On sait que l’inverse <strong>de</strong> la fonction sinus hyperbolique est la fonction sinh −1 x = ln(x+ √ 1 + x 2 ).<br />
On tire donc immédiatement <strong>de</strong> (3.72)<br />
τ = c<br />
a ln<br />
⎡<br />
⎣ at<br />
c +<br />
<br />
Si at/c > 1, (3.72) donne<br />
1 + a2 t 2<br />
c 2<br />
⎤<br />
⎦. (3.73)<br />
τ = t − 1 a<br />
6<br />
2<br />
c2 t3 + ... (3.74)<br />
τ ≈ c 2at<br />
ln . (3.75)<br />
a c<br />
45
Exemples numériques.— Afin <strong>de</strong> pouvoir appliquer ces calculs à <strong>de</strong>s astronautes, on a pris<br />
une accélération a égale à l’accélération g <strong>de</strong> la pesanteur terrestre. On doit donc remplacer<br />
a/c par g/c = 3, 27 × 10 −8 .<br />
a) Si t = 1 jour = 86400 s, on a gt/c = 2, 825×10 −3 . La formule (3.74) peut donc s’appliquer.<br />
Il vient<br />
τ = 1 jour − 0, 115 s. (3.76)<br />
Cette différence serait évi<strong>de</strong>mment mesurable avec une bonne montre à quartz. On peut alors<br />
se <strong>de</strong>man<strong>de</strong>r pourquoi on ne met pas facilement en évi<strong>de</strong>nce l’effet voyageur <strong>de</strong> Langevin. Pour<br />
le comprendre, calculons la distance x 1 parcourue par l’observateur P pendant cette journée.<br />
D’après (3.63), x 1 = 36, 6 millions <strong>de</strong> km, soit approximativement la moitié <strong>de</strong> la distance<br />
Terre-Mars lors d’une conjonction <strong>de</strong>s <strong>de</strong>ux planètes ! Noter qu’on trouverait pratiquement la<br />
même distance parcourue en utilisant la loi horaire usuelle x 1 ≈ 1<br />
2 gt2 . C’est naturel puisqu’on<br />
est ici dans le cas où t est nettement inférieur à c/g. En effet c/g ≈ 3 × 10 7 s ≈ 1 an.<br />
b) Si t = 10 6 ans = 3, 15569 × 10 7 s, on obtient avec (3.75)<br />
τ = 14, 1 ans. (3.77)<br />
La différence avec la valeur <strong>de</strong> t = 10 6 ans est ici énorme. La distance x 1 parcourue est alors<br />
<strong>de</strong> l’ordre <strong>de</strong> 10 6 années-lumière puisque la majeure partie du parcours s’effectue à une vitesse<br />
très voisine <strong>de</strong> celle <strong>de</strong> la lumière (on le voit aisément avec l’éq. (3.65)). On en conclut qu’un<br />
voyage aller-retour entre la Terre et un objet situé à <strong>de</strong>ux millions d’années-lumière 18 avec un<br />
accélération <strong>de</strong> 1 g ne durerait que 4 × 14, 1 = 56, 4 ans pour l’astronaute, alors qu’il se serait<br />
écoulé quatre millions d’années sur Terre <strong>de</strong>puis son départ... L’aventure vous tenterait-elle ?<br />
18 Tel est l’ordre <strong>de</strong> gran<strong>de</strong>ur <strong>de</strong> la distance entre notre Galaxie et la galaxie d’Andromè<strong>de</strong>.<br />
46
Chapitre 4<br />
Cinématique relativiste<br />
Ce chapitre est consacré à la formulation “tridimensionnelle” <strong>de</strong> la cinématique <strong>de</strong> la relativité<br />
restreinte.<br />
4.1 Notations<br />
Dans le chapitre précé<strong>de</strong>nt, nous avons postulé qu’on peut associer à tout référentiel galiléen<br />
S un espace affine proprement euclidien E3[S]. Un repère (O,ei) (i = 1, 2, 3) étant choisie dans<br />
E3[S], on représentera un 3-vecteur <strong>de</strong> composantes a i par rapport à ce repère indifféremment<br />
par le triplet (a 1 ,a 2 ,a 3 ) ou par la lettre grasse a définie par a = a i ei. Le repère (O,ei) sera<br />
toujours supposé orthonormé. En conséquence, le produit scalaire <strong>de</strong> <strong>de</strong>ux 3-vecteurs a =<br />
(a 1 ,a 2 ,a 3 ) et b = (b 1 ,b 2 ,b 3 ) aura pour expression<br />
a.b = a 1 b 1 + a 2 b 2 + a 3 b 3 . (4.1)<br />
4.2 Transformations spéciales <strong>de</strong> Lorentz<br />
Donnons-nous <strong>de</strong>ux référentiels galiléens S et S ′ en mouvement l’un par rapport à l’autre.<br />
Nous avons vu dans le chapitre précé<strong>de</strong>nt que les coordonnées galiléennes (xα ) d’un pointévénement<br />
x par rapport à S s’expriment en fonction <strong>de</strong>s coordonnées galiléennes (xβ′ ) <strong>de</strong> ce<br />
point-événement par rapport à S ′ par <strong>de</strong>s relations affines<br />
x α = A α β ′xβ′ + b α<br />
(A α β ′ = const., bα = const.) (4.2)<br />
ayant la propriété <strong>de</strong> laisser invariantes la valeur et la forme <strong>de</strong> l’intervalle élémentaire ds 2 , i.e.<br />
d’être telles que<br />
(dx 0 ) 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 = (dx 0′<br />
) 2 − (dx 1′<br />
) 2 − (dx 2′<br />
) 2 − (dx 3′<br />
) 2 . (4.3)<br />
Les constantes bα sont arbitraires, alors que les constantes Aα β ′ dépen<strong>de</strong>nt <strong>de</strong> la vitesse w<br />
<strong>de</strong> S ′ par rapport à S. Les équations (3.10) du chap. 3 peuvent s’écrire<br />
A i 0 ′ = βiA 0 0 ′ , (4.4)<br />
47
à condition <strong>de</strong> poser comme nous le ferons désormais<br />
β i = dxi<br />
dx<br />
c<br />
0 = wi<br />
. (4.5)<br />
Choisissons comme origine O ′ le point <strong>de</strong> S ′ qui coïnci<strong>de</strong> avec O à l’instant t = 0. De plus,<br />
choisissons l’origine <strong>de</strong>s dates t ′ dans S ′ <strong>de</strong> telle sorte que la coïnci<strong>de</strong>nce <strong>de</strong> O et O ′ ait lieu à<br />
l’instant t ′ = 0. Alors l’événement <strong>de</strong> coordonnées galiléennes (0, 0, 0, 0) par rapport à S ′ doit<br />
avoir les coordonnées galiléennes (0, 0, 0, 0) par rapport à S, ce qui entraîne<br />
b α = 0 (4.6)<br />
pour α = 0, 1, 2, 3. Réciproquement, les conditions (4.6) entraînent que les origines O et O ′<br />
coïnci<strong>de</strong>nt lorsque t = 0 et t ′ = 0.<br />
Dans ce qui suit, nous supposerons toujours satisfaites les relations (4.6). Rappelons qu’on<br />
appelle transformations homogènes <strong>de</strong> Lorentz les transformations correspondantes. 1<br />
x<br />
3<br />
x<br />
2<br />
x 3'<br />
x<br />
2'<br />
O O' x1<br />
Fig. 4.1 – Repères Ox1x2x3 et O ′ x1′ x2′ x3′ .<br />
Pour une horloge standard comouvante avec l’origine O ′ , on a d’après (4.2) :<br />
w<br />
x 0 = A 0 0 ′x0′ . (4.7)<br />
Cette relation montre qu’on a nécessairement A0 0 ′ = 0. De plus, la quantité A00 ′ étant<br />
une constante, nous pouvons toujours choisir les échelles <strong>de</strong> temps <strong>de</strong> telle sorte que <strong>de</strong>s x0′ croissants correspon<strong>de</strong>nt à <strong>de</strong>s x0 croissants. C’est pourquoi nous supposerons dans ce qui suit<br />
que<br />
A 0 0 ′ > 0. (4.8)<br />
Les transformations <strong>de</strong> Lorentz qui satisfont la condition (4.8) sont dites orthochrones.<br />
Supposons pour l’instant qu’il existe <strong>de</strong>s transformations <strong>de</strong> Lorentz homogènes orthochrones<br />
prenant la forme simple<br />
1 On omet souvent l’épithète homogène.<br />
x 0 = A 0 0 ′x0′<br />
48<br />
+ A 0 1 ′x1′ , (4.9)<br />
x<br />
1'
x 1 = A 1 0 ′x0′ + A 1 1 ′x1′ , (4.10)<br />
x 2 = A 2 2 ′x2′ , (4.11)<br />
x 3 = A 3 3 ′x3′ . (4.12)<br />
Du fait que A 2 0 ′ = A3 0 ′ = 0, les équations (4.4) entraînent que β2 = 0 et β 3 = 0, ce qui<br />
équivaut à<br />
w 2 = 0, w 3 = 0. (4.13)<br />
On posera pour simplifier l’écriture<br />
w 1 = w (4.14)<br />
et<br />
β 1 = β, avec β = w<br />
.<br />
c<br />
(4.15)<br />
Une transformation définie par les équations (4.9)-(4.11) correspond donc à un repère<br />
O ′ x1′ x2′ x3′ dont chaque point se déplace parallèlement à l’axe Ox1 w = cβ.<br />
avec une vitesse constante<br />
Soit P ′ un point lié à l’axe O ′ x1′ . On a x2′ P ′ = 0 et x3′ P ′ = 0. Il résulte alors <strong>de</strong> (4.11) que<br />
x 2 P ′ = 0 et x3 P ′ = 0 : le mouvement <strong>de</strong> P ′ dans S s’effectue donc sur l’axe Ox 1 . Nous avons<br />
vu ci-<strong>de</strong>ssus que ce mouvement s’effectue avec la vitesse w. On peut donc énoncer que chaque<br />
point lié à l’axe O ′ x1′ glisse avec la vitesse w sur l’axe Ox1 . En particulier, le point O ′ décrit<br />
la droite Ox 1 selon l’équation horaire x 1 = wt (rappelons que d’après notre choix <strong>de</strong>s origines<br />
spatiales et temporelles, O ′ coïnci<strong>de</strong> avec O à l’instant t = 0).<br />
Un raisonnement analogue montre que chaque point lié au plan O ′ x1′ x2′ glisse sur le plan<br />
Ox1x2 , et que chaque point lié au plan O ′ x1′ x3′ glisse sur le plan Ox1x3 . Enfin, il découle<br />
immédiatement <strong>de</strong> la forme <strong>de</strong> la transformation qu’à chaque instant t, l’ensemble <strong>de</strong>s points<br />
liés à O ′ x2′ (resp. O ′ x3′ ) est situé dans S sur un axe issu <strong>de</strong> O ′ et parallèle à Ox2 (resp. Ox3 ).<br />
Le repère O ′ x1′ x2′ x3′ <strong>de</strong>ssiné dans Ox1x2x3 à un instant t donné est donc parallèle au repère<br />
Ox 1 x 2 x 3 , comme on l’a représenté sur la figure 4.1.<br />
Il découle <strong>de</strong> (4.10) qu’on a pour chaque événement se produisant sur O ′ x1′ à l’instant<br />
t ′ = 0 :<br />
x 1 = A 1 1 ′x1′ .<br />
Cette relation montre que le signe <strong>de</strong> la constante A1 1 ′ dépend <strong>de</strong> l’orientation relative <strong>de</strong>s<br />
. Nous supposerons désormais que cette orientation est choisie <strong>de</strong> telle sorte<br />
axes Ox 1 et O ′ x 1′<br />
que l’inégalité<br />
A 1 1 ′ > 0 (4.16)<br />
soit satisfaite (“Ox1 et Ox1′ sont <strong>de</strong> même sens”). De même, les relations (4.11) et (4.12)<br />
entraînent qu’on peut toujours choisir l’orientation relative <strong>de</strong>s axes Ox2 et O ′ x2′ d’une part,<br />
Ox3 et O ′ x3′ d’autre part <strong>de</strong> telle façon que les inégalités<br />
A 2 2 ′ > 0, A33 ′ > 0 (4.17)<br />
soient satisfaites.<br />
Explicitons maintenant les transformations <strong>de</strong> Lorentz orthochrones du type (4.9)-(4.11).<br />
Les équations (4.4) se réduisant à<br />
A 1 0 ′ = βA00 ′, (4.18)<br />
49
la relation d’invariance (3.14) se traduit par l’équation<br />
(A 0 0 ′dx0′<br />
+ A 0 1 ′dx1′ ) 2 − (βA 0 0 ′dx0′ + A 1 1 ′dx1′ ) 2 − (A 2 2 ′)2 (dx 2′<br />
) 2 − (A 3 3 ′)2 (dx 3′<br />
) 2<br />
= (dx 0′<br />
) 2 − (dx 1′<br />
) 2 − (dx 2′<br />
) 2 − (dx 3′<br />
) 2<br />
(4.19)<br />
qui doit être vérifiée quels que soient dx 0 ,dx 1 ,dx 2 ,dx 3 . En développant le membre <strong>de</strong> gauche <strong>de</strong><br />
(4.19) et en i<strong>de</strong>ntifiant <strong>de</strong>s <strong>de</strong>ux membres terme à terme, on obtient compte tenu <strong>de</strong>s conditions<br />
(4.8), (4.16) et (4.17) :<br />
A 0 0 ′ = A11 ′ =<br />
1<br />
√<br />
1 − β2 , A01 ′ = A10 ′ =<br />
En conséquence, la transformation cherchée s’écrit :<br />
x 0 = x0′ + βx1′ √<br />
1 − β2 , x1 = x1′ + βx0′ √<br />
1 − β2 , x2 = x 2′<br />
β<br />
√<br />
1 − β2 , A22 ′ = A33 ′ = 1. (4.20)<br />
, x 3 = x 3′<br />
. (4.21)<br />
On appelle transformation spéciale <strong>de</strong> Lorentz une telle transformation. On peut montrer<br />
que les transformations <strong>de</strong> Lorentz homogènes orthochrones les plus générales s’obtiennent par<br />
composition d’une transformation spéciale et <strong>de</strong> rotations <strong>de</strong>s axes spatiaux <strong>de</strong>s référentiels<br />
galiléens S et S ′ .<br />
En résolvant le système d’équations (4.21) en x 0′<br />
, x 1′<br />
, x 2′<br />
x 0′<br />
= x0 − βx 1<br />
√ 1 − β 2<br />
, x1′<br />
= x1 − βx 0<br />
√ 1 − β 2<br />
, x2′<br />
et x3′ , on obtient :<br />
= x 2 , x 3′<br />
= x 3 . (4.22)<br />
La transformation (4.22) inverse <strong>de</strong> (4.21) est clairement une transformation spéciale <strong>de</strong><br />
Lorentz obtenue en échangeant les rôles joués par xα et xβ′ et en changeant β en −β. Il<br />
s’ensuit que le vecteur vitesse w ′ du référentiel S par rapport au référentiel S ′ est le vecteur<br />
w ′ admettant les composantes w1′ = −w, w2′ = 0,w3′ = 0 par rapport au système d’axes<br />
orthonormés O ′ x1′ x2′ x3′ .<br />
La transformation <strong>de</strong> Lorentz (4.21) est à comparer avec la transformation admise par la<br />
physique préeinsteinienne, qui s’écrirait ici<br />
t = t ′ , x 1 = x 1′<br />
+ wt ′ , x 2 = x 2′<br />
, x 3 = x 3′<br />
. (4.23)<br />
La transformation (4.23) s’appelle une transformation spéciale <strong>de</strong> Galilée. Il est immédiat<br />
<strong>de</strong> former son inverse :<br />
t ′ = t, x 1′<br />
= x 1 − wt, x 2′<br />
= x 2 , x 3′<br />
= x 3 . (4.24)<br />
On note en particulier que les transformations <strong>de</strong> Galilée n’impliquaient aucune limitation<br />
sur la vitesse w alors que les formules <strong>de</strong> transformations (4.21) et (4.22) n’ont <strong>de</strong> sens que si<br />
−1 < β < 1 ⇐⇒ −c < w < c. (4.25)<br />
Nous retrouvons donc ici que la valeur absolue <strong>de</strong> la vitesse <strong>de</strong> translation w d’un référentiel<br />
galiléen par rapport à un autre référentiel galiléen est toujours inférieure à la vitesse fondamentale<br />
c.<br />
50
4.3 Loi <strong>de</strong> composition relativiste <strong>de</strong>s vitesses<br />
Nous supposons que les origines <strong>de</strong>s coordonnées et les axes spatiaux sont choisis <strong>de</strong> telle<br />
sorte que S et S ′ soient reliés par la transformations spéciale <strong>de</strong> Lorentz (4.21). Si v ′ désigne<br />
le vecteur vitesse d’une particule isolée P par rapport à S ′ , et si w est le vecteur vitesse <strong>de</strong> S ′<br />
par rapport à S, la vitesse v <strong>de</strong> P par rapport à S n’est plus donnée par la loi d’addition bien<br />
connue en cinématique galiléenne<br />
v = v ′ + w . (4.26)<br />
Pour trouver la nouvelle loi <strong>de</strong> composition <strong>de</strong>s vitesses, considérons <strong>de</strong>ux événements infiniment<br />
voisins appartenant à l’histoire <strong>de</strong> P, <strong>de</strong> coordonnées galiléennes respectives (x0′ ,x1′ ,x2′ ,x3′ )<br />
et (x0′ +dx0′ ,x1′ +dx1′ ,x2′ +dx2′ ,x3′ +dx3′ ). Par rapport à S, ces <strong>de</strong>ux événements sont séparés<br />
par <strong>de</strong>s éléments différentiels dx 0 ,dx 1 ,dx 2 ,dx 3 obtenus en différentiant la transformation <strong>de</strong> Lorentz<br />
(4.21) :<br />
dx 0 = dx0′ + βdx1′ √ , dx<br />
1 − β2 1 = dx1′ + βdx0′ √ , dx<br />
1 − β2 2 = dx 2′<br />
Si on note vi′ les composantes du vecteur vitesse v ′ , on peut substituer dxi′ dans les éqs. (4.27). Il vient :<br />
dx 0 <br />
1<br />
= √ 1 +<br />
1 − β2 w v<br />
c<br />
1′<br />
<br />
dx<br />
c<br />
0′<br />
,<br />
dx 1 <br />
1 w v1′<br />
= √ +<br />
1 − β2 c c<br />
d’où après division <strong>de</strong>s dx i par dt = dx 0 /c :<br />
v 1 = v1′ + w<br />
w v1′<br />
1 +<br />
c2 , v 2 =<br />
, dx 3 = dx 3′<br />
. (4.27)<br />
dx 0′<br />
, dx 2 = v2′<br />
c dx0′ , dx 3 = v3′<br />
c dx0′ ,<br />
√ 1 − β 2<br />
1 +<br />
w v1′<br />
c 2<br />
v 2′<br />
, v 3 =<br />
√ 1 − β 2<br />
1 +<br />
w v1′<br />
c 2<br />
= (vi′ /c)dx0′ v 3′<br />
. (4.28)<br />
On note que ces formules sont nettement plus compliquées que la loi d’addition galiléenne.<br />
On remarquera en particulier que dx2 = dx2′ et dx3 = dx3′ n’entraînent pas que v2 = v2′ et<br />
v3 = v3′ . En fait, la présence du terme √ 1 − β2 dans les expressions <strong>de</strong> v2 et v3 implique que<br />
ces composantes ten<strong>de</strong>nt vers 0 lorsque |w| → c, v2′ et v3′ restant inchangées.<br />
Il est possible d’obtenir une expression du dénominateur commun à v 1 ,v 2 et v 3 qui soit<br />
indépendante du choix <strong>de</strong>s axes <strong>de</strong> l’espace lié au référentiel S ′ . On a vu plus haut que la<br />
vitesse relative <strong>de</strong> S par rapport à S ′ est en effet le vecteur w ′ <strong>de</strong> composantes w1′ = −w,<br />
w2′ = 0,w3′ = 0. En conséquence, la quantité wv1′ dans le second membre <strong>de</strong> (4.32) est en<br />
réalité l’opposé du produit scalaire du vecteur w ′ par le vecteur vitesse v ′ . On peut donc<br />
écrire :<br />
wv 1′<br />
= −w ′ .v ′ . (4.29)<br />
Substituons (4.29) dans(4.28). Il vient :<br />
v 1 = v1′ + w<br />
1 − w′ .v ′<br />
c2 , v 2 √<br />
1 − β2 =<br />
1 − w′ .v ′<br />
c2 51<br />
v 2′<br />
, v 3 =<br />
√ 1 − β 2<br />
1 − w′ .v ′<br />
c 2<br />
v 3′<br />
. (4.30)
On calcule aisément le carré <strong>de</strong> la norme <strong>de</strong> v à partir <strong>de</strong>s formules (4.28). En notant que<br />
on obtient 2 :<br />
(v 1′<br />
) 2 + (1 − β 2 )[(v 2′<br />
) 2 + (v 3′<br />
) 2 ] = (1 − β 2 )v ′2 2 1<br />
+ β (v ′<br />
) 2<br />
v 2 =<br />
⎛<br />
1<br />
⎝1 + wv1′<br />
c 2<br />
⎞2<br />
Compte tenu <strong>de</strong> (4.29), cette <strong>de</strong>rnière relation s’écrit encore<br />
v 2 =<br />
à condition <strong>de</strong> poser<br />
<br />
1<br />
1 − w′ .v ′<br />
c 2<br />
⎠<br />
2<br />
(4.31)<br />
<br />
(1 − β 2 )v ′2 + w 2 + 2wv 1 ′<br />
+ β 2 (v 1′<br />
) 2<br />
. (4.32)<br />
<br />
(1 − β ′2 )v ′2 + w ′2 − 2w ′ .v ′ + (β ′ .v ′ ) 2 <br />
, (4.33)<br />
β ′ = w′<br />
c = (β′ , 0, 0) = (−β, 0, 0). (4.34)<br />
Il faut bien entendu se souvenir que β ′2 2 ′2 2 = β et w = w .<br />
La relation (4.33) présente l’intérêt d’exprimer v2 sous une forme qui est indépendante du<br />
choix <strong>de</strong>s axes spatiaux dans les référentiels S et S ′ . On a donc une relation générale, et on<br />
peut oublier qu’on l’a démontrée en utilisant une transformation spéciale <strong>de</strong> Lorentz. Autrement<br />
dit : l’équation (4.33) exprime le carré <strong>de</strong> la vitesse d’une particule par rapport à S en fonction<br />
d’éléments qui sont tous relatifs au référentiel S ′ et qui ne dépen<strong>de</strong>nt pas du choix <strong>de</strong>s axes. En<br />
fait, v2 est exprimé en fonction <strong>de</strong> v ′2 ′2 ′ ′ , w et <strong>de</strong> l’angle que forment v avec w (on a en effet<br />
w ′ .v ′ = |w ′ ||v ′ | cos(w ′ ,v ′ )).<br />
On obtient l’expression <strong>de</strong>s composantes <strong>de</strong> la vitesse v ′ en fonction <strong>de</strong>s composantes <strong>de</strong> la<br />
vitesse v en échangeant les rôles <strong>de</strong>s quantités primées et non primées et en remplaçant w par<br />
−w dans les équations (4.28). Il vient :<br />
√ √<br />
1 − β2 1 − β2 v 1′<br />
= v1 − w<br />
w v1<br />
1 −<br />
c2 , v 2′<br />
=<br />
1 −<br />
w v1<br />
c 2<br />
v 2 , v 3′<br />
=<br />
1 −<br />
w v1<br />
c 2<br />
v 3 . (4.35)<br />
Là encore, le dénominateur commun aux quantités vi′ peut s’exprimer sous une forme<br />
indépendante du choix <strong>de</strong>s axes <strong>de</strong> l’espace lié au référentiel S. On a :<br />
v 1′<br />
= v1 − w<br />
1 − w.v<br />
c2 , v 2′<br />
√<br />
1 − β2 =<br />
1 − w.v<br />
c2 v 2 , v 3′<br />
√<br />
1 − β2 =<br />
1 − w.v<br />
c2 v 3 . (4.36)<br />
Un calcul analogue à celui qu’on a fait ci-<strong>de</strong>ssus pour trouver l’expression <strong>de</strong> v 2 donne pour<br />
le carré <strong>de</strong> la norme <strong>de</strong> v ′ :<br />
v ′2 =<br />
<br />
1<br />
1 − w.v<br />
c 2<br />
2<br />
<br />
(1 − β 2 )v 2 + w 2 − 2w.v + (β.v) 2<br />
, (4.37)<br />
2 On notera qu’il faudrait écrire β 2 au lieu <strong>de</strong> β 2 et β ′2 au lieu <strong>de</strong> β ′2 partout dans ce chapitre.<br />
52
où<br />
β = w<br />
= (β, 0, 0). (4.38)<br />
c<br />
Tout comme (4.33), la formule (4.37) est générale.<br />
On vérifie facilement avec ces formules que |v| = c si et seulement si |v ′ | = c. On peut en<br />
outre montrer qu’on a |v| < c si et seulement si |v ′ | < c, en supposant bien entendu |w| < c.<br />
Remarque.— Contrairement à ce que les équations (4.34) et (4.38) en termes <strong>de</strong> composantes<br />
pourraient laisser penser, les vecteurs (tridimendionnels) β et β ′ ne sont pas colinéaires<br />
car ils appartiennent à <strong>de</strong>s espace tridimensionnels distincts, puisqu’associés à <strong>de</strong>s référentiels<br />
en mouvement relatif. On n’écrira donc jamais β ′ = β ni w ′ = −w.<br />
4.4 Aberration <strong>de</strong> la lumière<br />
On appelle aberration <strong>de</strong> la lumière le fait que les rayons venant d’une source d’apparence<br />
ponctuelle 3 (satellite, étoile, quasar, ...) sont vus dans <strong>de</strong>s directions différentes lorsqu’ils sont<br />
observés dans <strong>de</strong>s systèmes <strong>de</strong> référence en mouvement l’un par rapport à l’autre. En effet<br />
un observateur lié à un référentiel voit une source lumineuse dans la direction définie dans ce<br />
référentiel par le vecteur vitesse du rayon lumineux qui lui arrive <strong>de</strong> cette source au moment <strong>de</strong><br />
son observation. Le phénomène d’aberration résulte donc <strong>de</strong> la propagation <strong>de</strong> la lumière avec<br />
une vitesse finie et <strong>de</strong> la loi <strong>de</strong> composition <strong>de</strong>s vitesses.<br />
Au départ, nous nous donnons les référentiels galiléens S et S ′ avec les origines et les<br />
systèmes d’axes fixés dans la section 4.2. Nous verrons que ce choix particulier n’empêche pas<br />
d’obtenir la formule fondamentale <strong>de</strong> l’aberration en toute généralité. En physique galiléenne,<br />
le vecteur vitesse V l d’un rayon lumineux par rapport à S est relié au vecteur vitesse V ′<br />
l <strong>de</strong> ce<br />
rayon par rapport à S ′ par la formule résultant immédiatement <strong>de</strong> (4.26)<br />
V l = V ′<br />
l + w. (4.39)<br />
La formule (4.39) est très simple mais son utisation pratique soulève une grave difficulté <strong>de</strong><br />
principe. En effet, le calcul <strong>de</strong> la différence <strong>de</strong> directions au moyen <strong>de</strong> (4.39) va faire intervenir<br />
la direction et la norme <strong>de</strong>s vecteurs V l et V ′<br />
l. Or l’astronome qui veut utiliser cette formule<br />
peut seulement mesurer la vitesse du rayon lumineux dans son propre référentiel (i.e., la Terre),<br />
et encore une telle mesure est-elle fort délicate en pratique. Il ne peut pas rester immobile<br />
avec ses instruments dans un référentiel S ′ lié au barycentre du système solaire par exemple.<br />
En conséquence notre astronome ne peut pas faire <strong>de</strong> calcul théorique précis sans faire <strong>de</strong>s<br />
hypothèses sur la vitesse <strong>de</strong> la lumière dans le référentiel S ′ .<br />
3 L’effet d’aberration fut mis en évi<strong>de</strong>nce pour la première fois par Römer en 1676 en comparant les observations<br />
<strong>de</strong>s éclipses <strong>de</strong>s satellites <strong>de</strong> Jupiter avec les tables <strong>de</strong> Cassini. L’aberration annuelle <strong>de</strong>s étoiles fut<br />
découverte en 1726 par Bradley à la suite <strong>de</strong> mesures <strong>de</strong>stinées à mettre en évi<strong>de</strong>nce une parallaxe stellaire.<br />
Pour une analyse très complète du point <strong>de</strong> vue astronomique, voir par ex. Astronomie générale, A. Danjon.<br />
(Edit. A. Blanchard, <strong>Paris</strong>, secon<strong>de</strong> éd., 1994).<br />
53
Les difficultés rencontrées par la conception préeinsteinienne disparaissent complètement<br />
en relativité restreinte si on admet comme nous le ferons désormais la validité <strong>de</strong> l’hypothèse<br />
suivante 4 :<br />
Hypothèse sur la lumière.— La lumière se propage dans le vi<strong>de</strong> avec la vitesse c.<br />
Il suffit dès lors d’appliquer la loi <strong>de</strong> composition relativiste <strong>de</strong>s vitesses à <strong>de</strong>s points se<br />
déplaçant avec la vitesse c pour obtenir une théorie complète <strong>de</strong> l’aberration dans le vi<strong>de</strong>.<br />
Commençons par traiter le problème simple du changement <strong>de</strong> direction apparente d’un<br />
rayon lumineux par rapport à l’axe <strong>de</strong>s x 1 .<br />
Changement <strong>de</strong> direction apparente d’un rayon lumineux.— Considérons un rayon<br />
lumineux se propageant parallèlement à une droite ∆ fixe par rapport au référentiel S. On<br />
appelle α l’angle que forme ∆ avec l’axe Ox1 (voir fig. 4.2). Par rapport au référentiel S ′ ,<br />
ce rayon se propage parallèlement à une droite ∆ ′ faisant un angle α ′ avec l’axe Ox1′ . On se<br />
propose <strong>de</strong> déterminer α ′ en fonction <strong>de</strong> α.<br />
x x<br />
3 3'<br />
∆ ∆'<br />
α α'<br />
O O'<br />
Fig. 4.2 – Aberration <strong>de</strong> la lumière.<br />
Par raison <strong>de</strong> symétrie, nous pouvons supposer que le rayon arrivant en O se propage dans<br />
le plan Ox 1 x 3 . Pour un rayon venant <strong>de</strong> l’infini et arrivant vers l’axe Ox 1 , les composantes du<br />
vecteur vitesse par rapport à S sont alors<br />
v 1 = −c cos α , v 2 = 0 v 3 = −c sin α . (4.40)<br />
L’application <strong>de</strong>s formules (4.35) donne immédiatement<br />
x<br />
v 1′ cos α + β<br />
= −c , (4.41)<br />
1 + β cosα<br />
4 On peut justifier cette hypothèse si on admet la validité <strong>de</strong>s équations <strong>de</strong> Maxwell formulées <strong>de</strong> manière<br />
à satisfaire au principe d’équivalence <strong>de</strong>s référentiels galiléens (généralement appelé principe <strong>de</strong> relativité, le<br />
principe d’équivalence <strong>de</strong>s référentiels galiléens est formulé dans la section 5.1).<br />
54<br />
1<br />
x<br />
1'
Or, on a évi<strong>de</strong>mment<br />
v 2′<br />
= 0,<br />
v 3′<br />
√<br />
1 − β2 = −c sin α . (4.42)<br />
1 + β cosα<br />
v 1′<br />
= −c cos α ′ , v 3′<br />
= −c sin α ′ . (4.43)<br />
Substituons les expressions (4.43) dans (4.41)-(4.42). Nous obtenons les formules <strong>de</strong> transformation<br />
suivantes :<br />
cos α ′ cos α + β<br />
= , (4.44)<br />
1 + β cos α<br />
sin α ′ √<br />
1 − β2 = sin α . (4.45)<br />
1 + β cos α<br />
Bien entendu, les formules (4.44) et (4.45) ne sont pas indépendantes. On peut les con<strong>de</strong>nser<br />
en une seule formule très élégante en utilisant l’i<strong>de</strong>ntité :<br />
tan α′<br />
2<br />
sin α′<br />
= . (4.46)<br />
1 + cosα ′<br />
En substituant (4.44) et (4.45) dans le second membre <strong>de</strong> (4.46), il vient en effet :<br />
tan α′<br />
2 =<br />
√ √<br />
1 − β2 sin α<br />
1 − β2 sin α<br />
<br />
=<br />
cos α+β<br />
(1 + β cos α) 1 +<br />
(1 + β)(1 + cosα)<br />
1+β cos α<br />
D’où on déduit :<br />
tan α′<br />
2 =<br />
<br />
1 − β α<br />
tan . (4.47)<br />
1 + β 2<br />
On obtient les formules permettant <strong>de</strong> calculer l’angle α en fonction <strong>de</strong> α ′ en échangeant<br />
le rôle <strong>de</strong>s quantités primées et non primées (noter que β doit être remplacé par −β dans cet<br />
échange). Il vient :<br />
et<br />
cosα = cos α′ − β<br />
, (4.48)<br />
1 − β cos α ′<br />
√<br />
1 − β2 sin α =<br />
1 − β cos α ′ sin α′ , (4.49)<br />
tan α<br />
2 =<br />
<br />
1 + β α′<br />
tan . (4.50)<br />
1 − β 2<br />
Distance angulaire entre <strong>de</strong>ux sources.— Considérons <strong>de</strong>ux rayons lumineux ∆(1) et<br />
∆(2) respectivement émis par les sources ponctuelles E(1) et E(2) et arrivant simultanément en<br />
O à l’instant t = 0. La distance angulaire séparant les <strong>de</strong>ux sources telle qu’elle est vue par<br />
un observateur en O au repos par rapport au référentiel S est l’angle φ entre ∆(1) et ∆(2).<br />
55
Demandons-nous quelle est la distance angulaire φ ′ entre E(1) et E(2) vue à l’instant t ′ = 0 par<br />
un observateur en O ′ au repos par rapport au référentiel S ′ .<br />
Précisons les notations. Etant donné un rayon lumineux arbitraire, on appelle l le vecteur<br />
unitaire caractérisant la direction et le sens <strong>de</strong> la propagation <strong>de</strong> ce rayon par rapport au<br />
référentiel S. Le vecteur vitesse v du rayon est alors donné par<br />
v = c l, avec |l| = 1. (4.51)<br />
Par rapport au référentiel S ′ , ce rayon se propage bien entendu avec le vecteur vitesse v ′<br />
v ′ = c l ′ , avec |l ′ | = 1. (4.52)<br />
Les rayons ∆(1) et ∆(2) seront donc respectivement caractérisés par les vecteurs l(1) et l(2)<br />
dans S et par les vecteurs correspondants l ′ (1) et l ′ (2) dans S ′ . Il résulte <strong>de</strong>s équations (4.51) et<br />
(4.52) et <strong>de</strong> la loi <strong>de</strong> composition <strong>de</strong>s vitesses (4.36) que les composantes <strong>de</strong> l ′ (1) et <strong>de</strong> l ′ (2) sont<br />
respectivement données par<br />
l 1′<br />
(1) = l1 (1)<br />
− β<br />
1 − β.l(1)<br />
, l 2′<br />
(1) =<br />
l 1′<br />
(2) = l(2) − β<br />
, l<br />
1 − β.l(2)<br />
2′<br />
(2) =<br />
√ 1 − β 2<br />
l<br />
1 − β.l(1)<br />
2 (1) , l 3′<br />
(1) =<br />
√ 1 − β 2<br />
l<br />
1 − β.l(2)<br />
2′<br />
(2) , l 3′<br />
(2) =<br />
√ 1 − β 2<br />
l<br />
1 − β.l(1)<br />
3 (1) , (4.53)<br />
√ 1 − β 2<br />
l<br />
1 − β.l(2)<br />
3′<br />
(2) . (4.54)<br />
L’angle φ ′ cherché étant l’angle formé par les <strong>de</strong>ux vecteurs l ′ (1) et l ′ (2), on peut écrire :<br />
cos φ ′ = l ′ (1).l ′ (2)<br />
(4.55)<br />
puisque |l ′ (1)| = 1 et |l ′ (2)| = 1. Explicitons le second membre <strong>de</strong> (4.55) en tenant compte <strong>de</strong><br />
(4.53) et <strong>de</strong> (4.54). Il vient :<br />
cos φ ′ =<br />
On a évi<strong>de</strong>mment<br />
3<br />
i ′ =1<br />
l i′<br />
(1)l i′<br />
(2)<br />
= (1 − β2 ) <br />
l1 (1) l1 (2) + l2 (1) l2 (2) + l3 (1) l3 <br />
(2) + β2l1 (1) l1 (2) + β2 − βl1 (1) − βl1 (2)<br />
[1 − β.l(1)] [1 − β.l(2)]<br />
l 1 (1)l 1 (2) + l 2 (1)l 2 (2) + l 3 (1)l 3 (2) = l(1).l(2)<br />
et, compte tenu du choix d’axes que nous avons fait :<br />
. (4.56)<br />
(4.57)<br />
βl 1 (1) = β.l(1) , βl 1 (2) = β.l(2). (4.58)<br />
En substituant (4.57) et (4.58) dans (4.56) et en notant que β 2 ≡ 1 − (1 − β 2 ), on obtient<br />
cos φ ′ = (1 − β2 )[l(1).l(2) − 1] + [1 − β.l(1)][1 − β.l(2)]<br />
[1 − β.l(1)] [1 − β.l(2)]<br />
= (1 − β2 )[l(1).l(2) − 1]<br />
+ 1. (4.59)<br />
[1 − β.l(1)] [1 − β.l(2)]<br />
56
On a évi<strong>de</strong>mment l(1).l(2) = cos φ. Compte tenu <strong>de</strong> l’i<strong>de</strong>ntité 1−cos x = 2 sin<br />
(4.59) s’écrit donc<br />
2 φ′<br />
sin<br />
2 =<br />
2 1<br />
2<br />
x, la relation<br />
1 − β2 φ<br />
sin2 . (4.60)<br />
[1 − β.l(1)] [1 − β.l(2)] 2<br />
Cette relation présente l’intérêt d’être complètement indépendante du choix <strong>de</strong>s axes spatiaux<br />
dans les référentiels S et S ′ . L’utilisation d’une transformation spéciale <strong>de</strong> Lorentz ne nous a<br />
donc pas empéché d’obtenir un résultat général.<br />
La formule (4.60) est fondamentale pour l’astrométrie puisqu’elle établit un lien direct entre<br />
<strong>de</strong>ux quantités angulaires qui sont en principe directement mesurables. Du point <strong>de</strong> vue astronomique,<br />
il est cependant plus commo<strong>de</strong> <strong>de</strong> caractériser les rayons lumineux par <strong>de</strong>s vecteurs<br />
unitaires orientés vers les sources lumineuses. C’est pourquoi nous poserons<br />
n(1) = −l(1) n(2) = −l(2) , n ′ (1) = −l ′ (1) , n(2) = −l(2) . (4.61)<br />
Nous formulerons donc la proposition fondamentale suivante.<br />
Proposition 4.4.1 Supposons qu’un observateur O au repos par rapport à un référentiel galiléen<br />
S observe simultanément <strong>de</strong>ux sources ponctuelles E(1) et E(2) respectivement dans les<br />
directions n(1) et n(2) (dans S). Soit φ l’angle entre n(1) et n(2) définissant dans S la distance<br />
angulaire entre E(1) et E(2). Un observateur O ′ lié à un référentiel galiléen S ′ <strong>de</strong> vecteur vitesse<br />
w par rapport à S et coïncidant avec O au moment <strong>de</strong> l’observation voit E(1) et E(2)<br />
respectivement dans les directions n ′ (1) et n ′ (2) formant l’angle φ ′ donné par la relation :<br />
2 φ′<br />
sin<br />
2 =<br />
les vecteurs n(1), n(2), n ′ (1) et n ′ (2) étant définis par (4.61).<br />
1 − β2 φ<br />
sin2 , (4.62)<br />
[1 + β.n(1)] [1 + β.n(2)] 2<br />
La relation (4.62) donne φ ′ en fonction <strong>de</strong> quantités qui sont toutes définies dans S. On<br />
obtient une relation donnant φ en fonction <strong>de</strong> quantités toutes définies dans S ′ en échangeant<br />
les rôles <strong>de</strong>s quantités primées et non primées :<br />
2 φ<br />
sin<br />
2 =<br />
1 − β ′2<br />
[1 + β ′ .n ′ (1)] [1 + β ′ .n ′ φ′<br />
sin2 , (4.63)<br />
(2)] 2<br />
dans laquelle on a posé β ′ = w ′ /c, w ′ étant le vecteur vitesse <strong>de</strong> S par rapport à S ′ . Nous<br />
avons vu dans la section précé<strong>de</strong>nte que β ′2 = β 2 , mais qu’on ne peut écrire w ′ = −w.<br />
4.5 Effet Doppler-Fizeau<br />
Une on<strong>de</strong> peut très généralement être représentée par une superposition d’on<strong>de</strong>s planes<br />
monochromatiques. En outre, la nature scalaire, vectorielle ou tensorielle d’une on<strong>de</strong> donnée<br />
ne change pas la théorie <strong>de</strong> l’effet Doppler-Fizeau. C’est pourquoi nous nous bornerons ici à<br />
l’étu<strong>de</strong> d’une on<strong>de</strong> plane monochromatique scalaire définie en chaque point-événement x par<br />
l’équation<br />
u(x) = A cos S(x), (4.64)<br />
57
où A est l’amplitu<strong>de</strong> supposée constante et S(x) est la phase ayant la forme suivante dans un<br />
reférentiel galiléen S donné :<br />
S(x) = ωt − k.x ,<br />
3<br />
k.x = k<br />
i=1<br />
i x i , (4.65)<br />
où ω est la pulsation <strong>de</strong> l’on<strong>de</strong> et k le vecteur d’on<strong>de</strong> par rapport à S.<br />
Rappelons que suivant <strong>de</strong>s résultats classiques, la fréquence ν <strong>de</strong> l’on<strong>de</strong> et sa longueur d’on<strong>de</strong><br />
λ par rapport à S sont respectivement données par les relations<br />
ν = ω<br />
2π<br />
2π<br />
, λ = , (4.66)<br />
|k|<br />
d’où on tire l’expression bien connue <strong>de</strong> la vitesse <strong>de</strong> propagation par rapport à S :<br />
V = ν λ = ω<br />
. (4.67)<br />
|k|<br />
Déterminons l’expression <strong>de</strong> la phase S(x) lorsqu’on effectue une transformation spéciale <strong>de</strong><br />
Lorentz définie par (4.21). On obtient<br />
avec<br />
et<br />
S(x) = ω<br />
=<br />
c x0 − k 1 x 1 − k 2 x 2 − k 3 x 3<br />
1<br />
√ 1 − β 2<br />
ω<br />
c<br />
− βk1<br />
Dans le référentiel S ′ , la phase S(x) s’écrit donc sous la forme<br />
k 1′<br />
=<br />
<br />
x 0′<br />
<br />
− k 1 − ω<br />
c β<br />
<br />
x 1′<br />
<br />
− k 2 x 2′<br />
− k 3 x 3′<br />
. (4.68)<br />
S(x) = ω′<br />
c x0′ − k 1′<br />
x 1′<br />
− k 2′<br />
x 2′<br />
− k 3′<br />
x 3′<br />
, (4.69)<br />
ω ′ =<br />
1 <br />
√ ω − wk<br />
1 − β2 1<br />
(4.70)<br />
<br />
1<br />
√ k<br />
1 − β2 1 − ω<br />
c β<br />
<br />
, k 2′<br />
= k 2 , k 3′<br />
= k 3 . (4.71)<br />
Il résulte <strong>de</strong> ces équations que l’on<strong>de</strong> (4.64) est vue dans le référentiel S ′ comme une on<strong>de</strong><br />
plane dont la pulsation ω ′ est donnée par (4.70) et le vecteur d’on<strong>de</strong> k ′ est le vecteur dont les<br />
composantes sont données par (4.71). On déduit <strong>de</strong> (4.70) que la fréquence ν ′ <strong>de</strong> l’on<strong>de</strong> telle<br />
qu’elle serait mesurée par un observateur au repos par rapport à S ′ est<br />
ν ′ = ω′<br />
2π =<br />
<br />
1<br />
√ ν − w<br />
1 − β2 k1<br />
<br />
2π<br />
(4.72)<br />
On note que wk 1 est la valeur du produit scalaire usuel du 3-vecteur vitesse w et du 3vecteur<br />
d’on<strong>de</strong> k, puisque w = (w, 0, 0). Utilisant la notation classique (4.1), on peut donc<br />
poser :<br />
wk 1 = w.k . (4.73)<br />
58
En conséquence, la relation (4.72) s’écrit encore<br />
ν ′ <br />
1<br />
= √ ν −<br />
1 − β2 w.k<br />
<br />
, (4.74)<br />
2π<br />
On sait que la direction et le sens dans lesquels l’on<strong>de</strong> se propage par rapport au référentiel<br />
S sont respectivement la direction et le sens du vecteur k. On peut tout aussi bien caractériser<br />
cette direction et ce sens par le vecteur unitaire l défini par<br />
l = k<br />
. (4.75)<br />
|k|<br />
Compte tenu <strong>de</strong> (4.66), (4.67) et (4.75), la relation (4.74) s’écrit finalement<br />
ν ′ <br />
ν<br />
= √ 1 −<br />
1 − β2 w.l<br />
<br />
.<br />
V<br />
Déterminons maintenant la longueur d’on<strong>de</strong> λ ′ par rapport au référentiel S ′ . On a<br />
λ ′ = 2π<br />
|k ′ . (4.76)<br />
|<br />
D’après (4.67) et (4.73), la première équation <strong>de</strong> (4.71) élevée au carré peut sécrire<br />
(k 1′<br />
) 2 = 1<br />
1 − β2 <br />
(k 1 ) 2 2<br />
− |k|<br />
2V<br />
c2 <br />
2 w.l<br />
<br />
− β2<br />
V<br />
Compte tenu <strong>de</strong> cette équation et <strong>de</strong> k2′ = k2 ,k3′ = k3 , il vient<br />
|k ′ | 2 = (k 1′<br />
) 2 + (k 2′<br />
= |k|2<br />
1 − β2 <br />
1 − β 2 2<br />
+ β<br />
2V<br />
− 2V<br />
c2 c<br />
) 2 + (k 3′<br />
) 2<br />
(β.l) + (β.l)2<br />
La longueur d’on<strong>de</strong> par rapport au référentiel S ′ a donc pour expression :<br />
λ ′ = λ<br />
√<br />
1 − β2 .<br />
1 − β2 + β2 V 2<br />
c2 − 2 V<br />
c<br />
(β.l) + (β.l)2<br />
<br />
(4.77)<br />
. (4.78)<br />
La vitesse <strong>de</strong> propagation V ′ <strong>de</strong> l’on<strong>de</strong> par rapport à S ′ se déduit aisément <strong>de</strong>s expressions<br />
obtenues pour ν ′ et λ ′ . Il vient :<br />
V ′ = ν ′ λ ′ = ν′<br />
ν<br />
λ ′<br />
V = V<br />
λ<br />
<br />
1 − w.l<br />
V<br />
1 − β2 + β2 V 2<br />
c2 − 2 V<br />
c<br />
(β.l) + (β.l)2<br />
Les formules trouvées ci-<strong>de</strong>ssus expriment les rapports ν ′ /ν, λ ′ /λ et V ′ /V sous une forme<br />
qui est indépendante du choix <strong>de</strong>s axes spatiaux dans les référentiels S et S ′ . Autrement dit,<br />
nous pouvons oublier que nous nous sommes servis <strong>de</strong> la transformation spéciale <strong>de</strong> Lorentz<br />
pour les établir. En conséquence, nous avons établi <strong>de</strong>s relations générales. Rappelons que nous<br />
avons déjà rencontré ce type <strong>de</strong> déduction dans la section 4.4.<br />
Nous sommes ainsi conduits à la proposition suivante :<br />
59<br />
.
Proposition 4.5.1 Soit une on<strong>de</strong> monochromatique plane décrite dans un référentiel galiléen<br />
arbitraire S par l’équation<br />
<br />
ω<br />
u(x) = A cos<br />
c x0 <br />
− k.x .<br />
Soit S ′ un référentiel galiléen ayant une vitesse w par rapport à S. Si ν, λ et V désignent<br />
respectivement la fréquence, la longueur d’on<strong>de</strong> et la vitesse <strong>de</strong> phase <strong>de</strong> l’on<strong>de</strong> telles qu’elles<br />
sont mesurées dans le référentiel S, alors la fréquence ν ′ , la longueur d’on<strong>de</strong> λ ′ et la vitesse <strong>de</strong><br />
phase V ′ mesurées dans le référentiel S ′ sont respectivement données par<br />
ν ′ =<br />
λ ′ = λ<br />
<br />
1 − w.l<br />
<br />
,<br />
V<br />
(4.79)<br />
√<br />
1 − β2 1 − β2 + β2 V 2<br />
c2 − 2 V<br />
,<br />
c<br />
(β.l) + (β.l)2<br />
(4.80)<br />
ν<br />
√ 1 − β 2<br />
V ′ = V <br />
où l est le vecteur unitaire défini par (4.75).<br />
1 − w.l<br />
V<br />
1 − β2 + β2 V 2<br />
c2 − 2 V<br />
c<br />
(β.l) + (β.l)2<br />
, (4.81)<br />
On<strong>de</strong> monochromatique émise par une source éloignée.— Considérons maintenant<br />
une on<strong>de</strong> monochromatique émise par une source ponctuelle E dont l’éloignement est beaucoup<br />
plus grand que la dimension du récepteur R utilisé pour son observation. Nous supposons que<br />
le récepteur est situé en un point xR immobile par rapport à un référentiel galiléen S et que la<br />
source E est animée d’un mouvement rectiligne uniforme <strong>de</strong> vecteur vitesse w par rapport à S.<br />
Nous pouvons assimiler l’on<strong>de</strong> arrivant sur le récepteur R à une on<strong>de</strong> monochromatique plane.<br />
L’on<strong>de</strong> arrivant sur le récepteur R a été émise en x(tE) à l’instant tE défini par<br />
|xR − xE(tE)| = V (tR − tE). (4.82)<br />
Le vecteur l parallèle à la direction <strong>de</strong> cette on<strong>de</strong> inci<strong>de</strong>nte et orienté dans le sens <strong>de</strong><br />
propagation est donc défini par<br />
l = xR − xE(tE)<br />
. (4.83)<br />
|xR − xE(tE)|<br />
Il faut noter que tE est une fonction <strong>de</strong> tR, <strong>de</strong> w et <strong>de</strong> la position x0 <strong>de</strong> E à un instant<br />
initial t0 arbitrairement choisi.<br />
Le référentiel galiléen S0 comouvant avec la source E joue le rôle joué par le référentiel<br />
S ′ dans ce qui précè<strong>de</strong>. La fréquence ν ′ dans la formule (4.79) est maintenant la fréquence ν0<br />
<strong>de</strong> la source émettrice qui serait mesurée par un observateur au repos par rapport à S0. On<br />
appelle ν0 la fréquence propre <strong>de</strong> E. La fréquence ν observée dans S à l’instant tR se déduit<br />
immédiatement <strong>de</strong> (4.79). Nous pouvons donc formuler la proposition qui suit.<br />
Proposition 4.5.2 (Effet Doppler-Fizeau) Soit R un récepteur au repos par rapport à un<br />
référentiel galiléen S observant un train d’on<strong>de</strong>s monochromatiques <strong>de</strong> fréquence propre ν0 émis<br />
60
par une source se mouvant avec un vecteur vitesse w constant par rapport à S. La fréquence ν<br />
du train d’on<strong>de</strong>s mesurée par R à l’instant tR est donnée par la relation :<br />
√<br />
1 − β2 ν = ν0<br />
1 − w.l<br />
, (4.84)<br />
V<br />
où V désigne la vitesse <strong>de</strong> propagation <strong>de</strong>s on<strong>de</strong>s par rapport à S et l est le vecteur défini par<br />
(4.83).<br />
Pour un train d’on<strong>de</strong>s monochromatiques se déplaçant avec la vitesse invariante c (cas <strong>de</strong><br />
la lumière, par exemple), on a V = c et la relation (4.84) s’écrit<br />
√<br />
1 − β2 ν = ν0 , (4.85)<br />
1 − β.l<br />
où β est défini par (4.38). L’équation (4.85) est l’expression relativiste <strong>de</strong> l’effet Doppler-Fizeau<br />
pour les radiations lumineuses se propageant dans le vi<strong>de</strong>.<br />
61
Chapitre 5<br />
Dynamique relativiste (I)<br />
Nous nous sommes jusqu’ici uniquement préoccupés <strong>de</strong> construire une cinématique. Nous<br />
avons en effet décrit les mouvements <strong>de</strong>s particules et <strong>de</strong>s observateurs sans nous intéresser<br />
aux causes susceptibles <strong>de</strong> produire ces mouvements. Dans ce chapitre, nous allons formuler une<br />
dynamique compatible avec le cadre défini par l’espace-temps <strong>de</strong> Minkowski. Pour cela, les postulats<br />
que nous avons introduits jusqu’ici sont insuffisants. Il nous faut introduire <strong>de</strong> nouveaux<br />
postulats, dont le plus important est ce que l’on appelle fort improprement le principe <strong>de</strong> relativité<br />
et qu’il nous paraît bien préférable <strong>de</strong> nommer le principe d’équivalence <strong>de</strong>s référentiels<br />
galiléens.<br />
Les notations et conventions utilisées dans ce chapitre sont les mêmes que dans le chapitre<br />
précé<strong>de</strong>nt. En particulier, un vecteur <strong>de</strong> l’espace affine proprement euclidien E3[S] associé à<br />
un référentiel galiléen S est représenté par une lettre grasse ou par le triplet constitué par ses<br />
composantes par rapport à un trièdre orthonormé (O,ei).<br />
5.1 Principe d’équivalence <strong>de</strong>s référentiels galiléens<br />
Nous allons avoir besoin d’un nouveau principe pour fon<strong>de</strong>r une physique et en particulier<br />
une dynamique compatibles avec la cinématique exposée dans les chapitres précé<strong>de</strong>nts. Ce principe<br />
est universellement appelé “principe <strong>de</strong> relativité”, mais cette dénomination est regrettable<br />
car elle ne renseigne pas sur le contenu effectif du dit principe. Il s’agit en fait d’un principe<br />
postulant l’équivalence complète <strong>de</strong>s référentiels galiléens pour formuler les lois <strong>de</strong> la physique.<br />
D’où la dénomination proposée ici.<br />
Postulat 5.1.1 (Principe d’équivalence <strong>de</strong>s référentiels galiléens ou principe <strong>de</strong> relativité)<br />
Les lois physiques gouvernant les interactions ont la même forme dans tous les<br />
référentiels galiléens.<br />
Nous notons que le postulat d’existence d’une vitesse c invariante par les changements <strong>de</strong><br />
référentiels galiléens est compatible avec le principe d’équivalence <strong>de</strong>s référentiels galiléens. Un<br />
physicien déterminant cette vitesse fondamentale dans un référentiel galiléen S donné va trouver<br />
la même valeur <strong>de</strong> c qu’un autre physicien effectuant <strong>de</strong>s expériences analogues dans un autre<br />
référentiel galiléen S ′ en mouvement par rapport à S précisément parce que c est invariante (on<br />
suppose bien entendu que les mêmes systèmes d’unités sont utilisés dans S et S ′ ).<br />
62
5.2 Quantité <strong>de</strong> mouvement et énergie cinétique d’une<br />
particule isolée<br />
Considérons une particule se mouvant avec une vitesse v par rapport à un reférentiel galiléen<br />
arbitraire S. Selon la mécanique newtonienne, cette particule possè<strong>de</strong> une quantité <strong>de</strong><br />
mouvement p et une énergie cinétique Ec respectivement définies par<br />
et<br />
p = mv (5.1)<br />
Ec = 1<br />
2 mv2 , (5.2)<br />
où m est un nombre réel positif appelé la masse inerte (ou simplement la masse) <strong>de</strong> la particule.<br />
Comment peut-on définir <strong>de</strong>s gran<strong>de</strong>urs analogues en relativité restreinte ? On suppose bien<br />
entendu que les particules considérées ont toutes <strong>de</strong>s lignes d’univers du genre temps.<br />
On commence d’abord par généraliser le concept <strong>de</strong> masse en admettant le postulat qui<br />
suit.<br />
Postulat 5.2.1 À toute particule P dont la ligne d’univers est du genre temps, on peut attribuer<br />
un nombre réel positif m qu’on appelle la masse inerte (ou simplement masse) <strong>de</strong> P. La<br />
quantité scalaire m est indépendante du référentiel1 .<br />
Le postulat 5.2.1 ne stipule nullement que la masse d’une particule reste nécessairement<br />
inchangée au cours <strong>de</strong> l’histoire <strong>de</strong> cette particule. Considérons par exemple un atome. Il découle<br />
<strong>de</strong> ce qui va être établi dans la suite que si cet atome émet ou absorbe un photon, sa masse<br />
inerte varie : dans le premier cas sa masse inerte diminue, dans le second cas sa masse augmente.<br />
Nous allons maintenant chercher à définir la quantité <strong>de</strong> mouvement p et l’énergie cinétique<br />
Ec d’une particule en supposant que ces gran<strong>de</strong>urs sont <strong>de</strong> la forme suivante :<br />
<br />
p = M m, v<br />
<br />
v (5.3)<br />
c<br />
et<br />
<br />
Ec = Ec m, v<br />
<br />
, (5.4)<br />
c<br />
où M(m, v/c) et Ec(m, v/c) sont <strong>de</strong>s fonctions <strong>de</strong> la masse et du vecteur vitesse <strong>de</strong> la particule.<br />
Le principe d’équivalence <strong>de</strong>s référentiels galiléens entraîne que M(m, v/c) et Ec(m, v/c)<br />
sont <strong>de</strong>s fonctions universelles <strong>de</strong> la masse inerte m et du vecteur vitesse v, i.e. <strong>de</strong>s fonctions<br />
qui ne dépen<strong>de</strong>nt pas du référentiel galiléen par rapport auquel la particule est décrite. De<br />
plus le principe d’isotropie <strong>de</strong> l’espace implique que M(m, v/c) et Ec(m, v/c) doivent dépendre<br />
seulement <strong>de</strong> m et <strong>de</strong> la valeur absolue <strong>de</strong> v ou encore du carré <strong>de</strong> v. En conséquence on cherche<br />
à déterminer p et Ec sous la forme<br />
<br />
p = M<br />
m, v2<br />
c 2<br />
v (5.5)<br />
1 On évitera <strong>de</strong> parler <strong>de</strong> masse relativiste variant avec la vitesse comme on a continué à le faire longtemps<br />
après la naissance <strong>de</strong> la relativité restreinte. Les anciens traités introduisaient souvent la masse longitudinale<br />
et la masse transversale. La quantité m introduite dans le postulat 5.2.1 était alors souvent appelée la masse<br />
propre.<br />
63
et<br />
où on a posé<br />
Ec = Ec<br />
<br />
m, v2<br />
c 2<br />
<br />
, (5.6)<br />
v = |v|. (5.7)<br />
On admet que (5.5) et (5.6) coïnci<strong>de</strong>nt avec les expressions newtoniennes lorsque la vitesse<br />
|v| <strong>de</strong>vient infiniment petite. On doit donc avoir<br />
et<br />
lim<br />
|v|→0 M<br />
<br />
2Ec<br />
lim<br />
|v|→0<br />
<br />
m, v2<br />
c 2<br />
m, v2<br />
c 2<br />
<br />
<br />
= m (5.8)<br />
mv 2 = 1. (5.9)<br />
On admet en outre que la valeur absolue <strong>de</strong> la quantité <strong>de</strong> mouvement M(m,v 2 /c 2 )v et<br />
l’énergie cinétique Ec(m,v 2 /c 2 ) sont <strong>de</strong>s fonctions continues, monotones croissantes <strong>de</strong> v sur<br />
l’intervalle 0 ≤ v < c. Comme la quantité <strong>de</strong> mouvement et l’énergie cinétique doivent prendre<br />
la valeur nulle lorsque v = 0 d’après (5.8) et (5.9), les fonctions M(m,v 2 /c 2 ), M(m,v 2 /c 2 )v et<br />
Ec(m,v 2 /c 2 ) sont > 0 lorsque v = 0.<br />
Sous ces hypothèses, on démontre que les fonctions universelles M(m,v 2 /c 2 ) et Ec(m,v 2 /c 2 )<br />
sont complètement déterminées en écrivant que lors d’une collision élastique <strong>de</strong> <strong>de</strong>ux particules<br />
<strong>de</strong> masses i<strong>de</strong>ntiques, la somme vectorielle <strong>de</strong>s quantités <strong>de</strong> mouvement et la somme <strong>de</strong>s énergies<br />
totales sont conservées quel que soit le référentiel gali̷léen dans lequel on décrit le processus (voir<br />
Annexe D). On trouve ainsi qu’une particule <strong>de</strong> vitesse v a pour quantité <strong>de</strong> mouvement le<br />
vecteur<br />
et pour énergie cinétique la quantité<br />
p = mv<br />
<br />
1 − v2<br />
c2 ⎛<br />
⎞<br />
(5.10)<br />
Ec = mc 2<br />
⎜ 1<br />
⎜<br />
⎝<br />
<br />
1 − v2<br />
c2 ⎟<br />
− 1⎟<br />
⎠ . (5.11)<br />
Lorsque la vitesse <strong>de</strong> la particule est petite <strong>de</strong>vant la vitesse fondamentale c, on peut faire un<br />
développement approché <strong>de</strong>s seconds membres <strong>de</strong> (5.11) et (5.10). Compte tenu <strong>de</strong> (1−x 2 ) −1/2 ≈<br />
1 + 1<br />
2 x2 + 3<br />
8 x4 + ..., on obtient<br />
et<br />
p = m<br />
Ec = 1<br />
2 mv2<br />
<br />
<br />
1 + 1 v<br />
2<br />
2<br />
<br />
+ ... v (5.12)<br />
c2 1 + 3<br />
4<br />
v2 <br />
+ ... . (5.13)<br />
c2 Ces <strong>de</strong>ux <strong>de</strong>rnières formules montrent comment les expressions relativistes <strong>de</strong> la quantité <strong>de</strong><br />
mouvement et <strong>de</strong> l’énergie cinétique diffèrent <strong>de</strong>s expressions newtoniennes aux faibles vitesses.<br />
64
5.3 Energie d’une particule. Inertie <strong>de</strong> l’énergie<br />
La formule (5.11) suggère que la quantité mc 2 est une énergie qui appartient en propre<br />
à la particule lorsque celle-ci est au repos par rapport au référentiel choisi pour décrire les<br />
phénomènes. On peut montrer la validité <strong>de</strong> ce point <strong>de</strong> vue en considérant le cas d’un choc<br />
mou <strong>de</strong> <strong>de</strong>ux particules <strong>de</strong> masses i<strong>de</strong>ntiques m0 animées <strong>de</strong> vitesse opposées avant la collision.<br />
Dans un référentiel galiléen S, donnons-nous <strong>de</strong>ux particules isolées (1) et (2) i<strong>de</strong>ntiques se<br />
mouvant sur la même ligne droite avec <strong>de</strong>s vitesses v(1) et v(2) opposées : v(2) = −v(1). On peut<br />
toujours choisir l’origine O et l’axe Ox 1 <strong>de</strong> telle sorte que le mouvement <strong>de</strong>s <strong>de</strong>ux particules<br />
s’effectue sur Ox 1 et que la collision frontale se produise en O. On appelle m0 la masse <strong>de</strong><br />
chaque particule inci<strong>de</strong>nte. On suppose que la collision est un choc tel que les <strong>de</strong>ux particules<br />
fusionnent parfaitement en donnant une particule unique ayant une masse M (choc mou). Il<br />
résulte immédiatement <strong>de</strong> la conservation <strong>de</strong> la quantité <strong>de</strong> mouvement totale que la particule<br />
résultante est au repos par rapport au référentiel S. Pour simplifier, nous posons<br />
v = v 1 (1) = −v 1 (2). (5.14)<br />
Pour déterminer la masse M <strong>de</strong> la particule résultante, décrivons la collision dans le référentiel<br />
galiléen S ′ se mouvant avec la vitesse v(1) par rapport au référentiel S. Nous supposons que les<br />
axes <strong>de</strong> S et <strong>de</strong> S ′ sont disposés comme on l’a représenté sur la Fig. 4.1 du chapitre précé<strong>de</strong>nt.<br />
Par rapport à S ′ , la vitesse v1′ (1) <strong>de</strong> la particule (1) est nulle et la vitesse v1′<br />
(2) <strong>de</strong> la particule (2)<br />
est selon la loi <strong>de</strong> composition <strong>de</strong>s vitesses énoncée par les éqs. (4.35) (w doit être remplacé ici<br />
par v) :<br />
v 1′ −v − v<br />
(2) =<br />
1 − v(−v)<br />
c2 = − 2v<br />
1 + v2<br />
c2 . (5.15)<br />
La vitesse <strong>de</strong> la particule résultante par rapport à S ′ est évi<strong>de</strong>mment −v. La conservation<br />
<strong>de</strong> la quantité <strong>de</strong> mouvement totale se traduit donc dans S ′ par l’équation<br />
−<br />
<br />
<br />
1<br />
−<br />
<br />
m0<br />
c 2<br />
4v2 <br />
1+ v2<br />
c2 2 2v<br />
1 + v2<br />
c 2<br />
= − Mv<br />
<br />
1 − v2<br />
c2 . (5.16)<br />
Après une division <strong>de</strong>s <strong>de</strong>ux membres par −v et un petit calcul, (5.16) donne pour la masse<br />
<strong>de</strong> la particule résultant <strong>de</strong> la collision :<br />
M = 2m0<br />
<br />
1 − v2<br />
c2 . (5.17)<br />
Cette formule montre que la masse M <strong>de</strong> la particule résultant d’un choc parfaitement mou,<br />
i.e. sans rebond, est plus gran<strong>de</strong> que la somme <strong>de</strong>s masses m0 <strong>de</strong>s particules inci<strong>de</strong>ntes. D’où<br />
la conclusion fondamentale : le principe newtonien stipulant que la masse inerte d’un système<br />
est égale à la somme <strong>de</strong>s masses inertes <strong>de</strong>s particules constituant ce système ne peut être<br />
maintenu.<br />
Nous allons voir que la relation (5.17) permet d’établir l’équivalence entre masse inerte et<br />
énergie au repos à condition d’admettre la validité <strong>de</strong>s trois hypothèses suivantes :<br />
65
1.— On peut attribuer à toute particule <strong>de</strong> masse inerte m une énergie définie par une<br />
relation <strong>de</strong> la forme<br />
E = Ec + Er, (5.18)<br />
où Ec est l’énergie cinétique donnée par (5.11) et Er est l’énergie au repos <strong>de</strong> la particule.<br />
2.— L’énergie au repos d’une telle particule dépend uniquement <strong>de</strong> sa masse inerte. Il résulte<br />
alors du principe d’équivalence <strong>de</strong>s référentiels galiléens que Er est indépendante du référentiel<br />
galiléen. Autrement dit, Er est une fonction universelle <strong>de</strong> m, ce qui nous permet <strong>de</strong> poser<br />
Er = Er(mc 2 ). (5.19)<br />
3.— La fonction universelle Er(mc 2 ) est une fonction continue <strong>de</strong> m telle que<br />
Er(0) = 0. (5.20)<br />
Il est possible <strong>de</strong> déterminer la fonction Er(mc2 ) en écrivant la conservation <strong>de</strong> l’énergie<br />
totale. Dans le référentiel S, on a en effet d’après (5.18) et (5.19) :<br />
⎛ ⎞<br />
2m0c 2<br />
⎜ 1<br />
⎜<br />
⎝<br />
<br />
1 − v2<br />
c2 ⎟<br />
− 1⎟<br />
⎠ + 2Er(m0c 2 ) = Er(Mc 2 ). (5.21)<br />
Compte tenu <strong>de</strong> (5.17), (5.21) s’écrit<br />
Er(Mc 2 ) − Mc 2 = 2 <br />
Er(m0c 2 ) − m0c 2<br />
. (5.22)<br />
Posons M = 2m1. La relation (5.22) s’écrit alors<br />
Er(2m1c 2 ) − 2m1c 2 = 2Er(m0c 2 ) − 2m0c 2 . (5.23)<br />
Cette relation doit être vérifiée pour toute masse m0 et pour toute masse m1 ≥ m0 puisque<br />
v peut être choisie arbitrairement entre 0 et c. Pour m1 = m0, (5.23) donne<br />
Er(2m0c 2 ) = 2Er(m0c 2 ) (5.24)<br />
La relation (5.24) entraîne évi<strong>de</strong>mment Er(2m1c 2 ) = 2Er(m1c 2 ) puisque la fonction E(mc 2 )<br />
est universelle. L’équation (5.23) peut donc s’écrire après division <strong>de</strong>s <strong>de</strong>ux membres par 2 :<br />
Er(m1c 2 ) − Er(m0c 2 ) = m1c 2 − m0c 2 . (5.25)<br />
Il résulte immédiatement <strong>de</strong> l’équation (5.25) et <strong>de</strong> l’hypothèse 3 que la fonction universelle<br />
Er(m) est donnée par la célèbre relation<br />
Er(mc 2 ) = mc 2 . (5.26)<br />
Nous avons établi cette relation en étudiant le choc mou <strong>de</strong> <strong>de</strong>ux particules, mais nous<br />
aurions pu par exemple remplacer les <strong>de</strong>ux particules par <strong>de</strong>ux sphères matérielles i<strong>de</strong>ntiques<br />
subissant un choc mou. C’est pourquoi on admet la validité générale du postulat qui suit.<br />
Postulat 5.3.1 (Principe <strong>de</strong> l’inertie <strong>de</strong> l’énergie) Tout système physique <strong>de</strong> masse inerte<br />
m possè<strong>de</strong> une énergie au repos Er = mc 2 . Réciproquement, tout système possédant une énergie<br />
totale au repos Er a une masse inerte m = Er/c 2 .<br />
Le postulat 5.3.1 s’est avéré en excellent accord avec l’expérience. Cette extension du principe<br />
<strong>de</strong> l’inertie <strong>de</strong> l’énergie est à la base, on le sait, <strong>de</strong> l’exploitation <strong>de</strong> l’énergie nucléaire et<br />
permet d’expliquer le rayonnement <strong>de</strong>s étoiles.<br />
66
5.4 Relations entre l’énergie et la quantité <strong>de</strong> mouvement<br />
d’une particule<br />
Il résulte <strong>de</strong> ce qui précè<strong>de</strong> qu’on peut attribuer à toute particule <strong>de</strong> masse inerte m et <strong>de</strong><br />
vecteur vitesse v une énergie E et une quantité <strong>de</strong> mouvement p respectivement définies par<br />
et<br />
E = Er + Ec = mc2<br />
<br />
1 − v2<br />
c2 (5.27)<br />
p = mv<br />
<br />
1 − v2<br />
c2 . (5.28)<br />
L’énergie E peut s’exprimer en fonction <strong>de</strong> m et <strong>de</strong> p. Formons en effet le carré <strong>de</strong> chacun<br />
<strong>de</strong>s membres <strong>de</strong> (5.28). Il vient :<br />
p 2 = m2v2 1 − v2<br />
c2 ,<br />
ce qui entraîne<br />
m 2 c 2 + p 2 = m 2 c 2 + m2v2 1 − v2<br />
c2 = m2c2 1 − v2<br />
c2 . (5.29)<br />
Rapprochée <strong>de</strong> l’expression <strong>de</strong> l’énergie donnée par (5.27), l’équation (5.29) montre que<br />
l’énergie d’une particule s’exprime en fonction <strong>de</strong> la masse et <strong>de</strong> la quantité <strong>de</strong> mouvement par<br />
la relation<br />
E =<br />
<br />
m 2 c 4 + c 2 p 2 . (5.30)<br />
On peut également exprimer le vecteur quantité <strong>de</strong> mouvement en fonction <strong>de</strong> l’énergie E<br />
et du vecteur vitesse v. En effet, l’équation (5.27) donne<br />
m<br />
<br />
1 − v2<br />
c2 = E<br />
c 2.<br />
En substituant (5.31) dans (5.28), il vient donc :<br />
p = E<br />
c 2v.<br />
(5.31)<br />
(5.32)<br />
Les relations (5.30) et (5.32) sont fondamentales en théorie <strong>de</strong>s particules <strong>de</strong> masse non<br />
nulle. Elles permettent également d’élaborer la théorie <strong>de</strong>s particules <strong>de</strong> masse nulle, comme<br />
nous allons le voir maintenant.<br />
5.5 Particules <strong>de</strong> masse nulle<br />
67
Les formules obtenues jusqu’ici montrent que si la masse d’une particule est supposée = 0,<br />
l’énergie et la quantité <strong>de</strong> mouvement sont <strong>de</strong>s quantités réelles si et seulement si la vitesse |v|<br />
<strong>de</strong> la particule est inférieure à c. Nous pouvons en conclure qu’une particule <strong>de</strong> masse inerte m<br />
réelle non nulle a une ligne d’univers du genre temps.<br />
Peut-il exister <strong>de</strong>s particules <strong>de</strong> masse nulle ? Les formules (5.27) et (5.28) montrent qu’une<br />
particule <strong>de</strong> masse nulle se mouvant avec une vitesse inférieure à c possè<strong>de</strong> une énergie et une<br />
quantité <strong>de</strong> mouvement toutes <strong>de</strong>ux nulles. Or, un objet ne transportant ni énergie ni quantité<br />
<strong>de</strong> mouvement ne semble pas pouvoir constituer une entité physique observable. Le formalisme<br />
<strong>de</strong> la théorie rend toutefois possible l’existence <strong>de</strong> masses nulles transportant une énergie et une<br />
quantité <strong>de</strong> mouvement différentes <strong>de</strong> zéro. On voit en effet que poser m = 0 dans l’ équation<br />
(5.30) entraîne la relation<br />
E = c|p|<br />
qui est compatible avec l’équation (5.32) et avec la condition E = 0 si la vitesse <strong>de</strong> la particule<br />
est égale à la vitesse fondamentale c. Nous pouvons donc énoncer la proposition suivante.<br />
Proposition 5.5.1 Une particule se mouvant avec une vitesse égale à c est une particule <strong>de</strong><br />
masse nulle. L’énergie E et la quantité <strong>de</strong> mouvement p d’une telle particule sont liées par la<br />
relation :<br />
|p| = E<br />
. (5.33)<br />
c<br />
On notera que la relation fondamentale (5.33) peut encore s’écrire <strong>de</strong> manière équivalente<br />
E2 c2 − p2 = 0. (5.34)<br />
Nous avons vu qu’on pouvait admettre expérimentalement que la vitesse <strong>de</strong> propagation<br />
<strong>de</strong> la lumière dans le vi<strong>de</strong> est égale à la vitesse fondamentale. Par ailleurs, l’étu<strong>de</strong> <strong>de</strong> l’effet<br />
photoélectrique a conduit Einstein à admettre que l’énergie transportée par une on<strong>de</strong> électromagnétique<br />
monochromatique <strong>de</strong> fréquence ν est distribuée en paquets discrets ou quanta d’énergie<br />
E = hν, où h est la constante <strong>de</strong> Planck2 . Ces quanta d’énergie lumineuse sont appelés <strong>de</strong>s<br />
photons. La relativité restreinte conduit donc à admettre que les photons sont <strong>de</strong>s particules <strong>de</strong><br />
masse nulle.<br />
Il résulte <strong>de</strong> (5.33) qu’un photon d’énergie hν possè<strong>de</strong> une quantité <strong>de</strong> mouvement donnée<br />
par<br />
|p| = hν<br />
. (5.35)<br />
c<br />
5.6 Loi fondamentale <strong>de</strong> la dynamique<br />
Donnons-nous un référentiel galiléen S et considérons une particule <strong>de</strong> masse m soumise<br />
à <strong>de</strong>s forces dont la résultante dans S est le vecteur F. En physique prérelativiste, la loi<br />
fondamentale <strong>de</strong> la dynamique (ou secon<strong>de</strong> loi <strong>de</strong> Newton) se traduit par l’équation<br />
2 h = 6,626 × 10 −34 J.s.<br />
F = d(mv)<br />
. (5.36)<br />
dt<br />
68
qui redonne la relation bien connue<br />
F = ma, a = dv<br />
, (5.37)<br />
dt<br />
lorsque la masse m est invariable.<br />
La relation (5.36) suggère <strong>de</strong> formuler le postulat suivant, qui s’est avérée en excellent accord<br />
avec l’expérience :<br />
Postulat 5.6.1 (Principe fondamental <strong>de</strong> la dynamique relativiste) Dans un référentiel<br />
galiléen arbitraire, le mouvement d’une particule <strong>de</strong> masse inerte m soumise à <strong>de</strong>s forces <strong>de</strong><br />
résultante F est gouverné par l’équation<br />
F = dp<br />
dt<br />
Ce postulat entraîne la proposition qui suit.<br />
⎛<br />
⎞<br />
d ⎜ mv<br />
= ⎜<br />
dt<br />
⎝<br />
<br />
1 − v2<br />
c2 ⎟<br />
⎠ . (5.38)<br />
Proposition 5.6.1 Soit P une particule <strong>de</strong> masse m soumise à <strong>de</strong>s forces <strong>de</strong> résultante F. La<br />
variation <strong>de</strong> l’énergie E <strong>de</strong> la particule est lié à la puissance <strong>de</strong> la force résultante F par la<br />
relation :<br />
dE<br />
dt = F.v + c2 <br />
dm<br />
dt<br />
1 − v2<br />
.<br />
c2 (5.39)<br />
Démonstration <strong>de</strong> la proposition 5.6.1.— En utilisant la règle <strong>de</strong> dérivation <strong>de</strong> Leibniz, la<br />
loi <strong>de</strong> la dynamique (5.38) s’écrit<br />
à condition <strong>de</strong> poser 3<br />
F = dm<br />
dt<br />
v<br />
√<br />
1 − β2 m dv<br />
+ √<br />
1 − β2 dt +<br />
β = |v|<br />
c<br />
m<br />
(1 − β 2 ) 3/2<br />
1<br />
c2 <br />
v. dv<br />
<br />
v, (5.40)<br />
dt<br />
v<br />
= . (5.41)<br />
c<br />
Notant que v.dv/dt = c 2 βdβ/dt, on déduit <strong>de</strong> (5.40) que la puissance <strong>de</strong> F s’écrit<br />
Or, on voit que<br />
F.v = mc2<br />
√<br />
1 − β2 βdβ<br />
dt + mc2β2 (1 − β2 ) 3/2βdβ dt +<br />
mc2 √<br />
1 − β2 βdβ<br />
dt + mc2β2 (1 − β2 ) 3/2βdβ dt ≡<br />
≡<br />
β2 √<br />
1 − β2 c2dm . (5.42)<br />
dt<br />
mc2 (1 − β2 ) 3/2[1 − β2 + β 2 ]β dβ<br />
dt<br />
mc2 (1 − β2 ) 3/2βdβ dt<br />
3 On notera que la quantité β définie par (5.41) est relative à la particule, alors que la quantité β du chap. 4<br />
était relative au référentiel galiléen utilisé pour décrire le mouvement.<br />
69
Mais on vérifie facilement que<br />
mc2 (1 − β2 ) 3/2βdβ dt<br />
<br />
2 d mc<br />
= √ −<br />
dt 1 − β2 Substituons le second membre <strong>de</strong> (5.43) dans (5.42). Il vient<br />
Du fait que<br />
l’équation (5.44) s’écrit<br />
F.v = d<br />
<br />
2 mc<br />
√ −<br />
dt 1 − β2 1<br />
−√<br />
1 − β2 c2dm<br />
dt +<br />
1<br />
√ 1 − β 2 c2dm<br />
dt +<br />
β 2<br />
√ 1 − β 2 c2dm<br />
dt<br />
1<br />
√ 1 − β 2 c2dm<br />
dt<br />
β 2<br />
√ 1 − β 2 c2dm<br />
dt<br />
<br />
≡ − 1 − β2c 2dm<br />
dt<br />
F.v = d<br />
<br />
2 mc<br />
√ − c<br />
dt 1 − β2 2dm<br />
<br />
1 − β<br />
dt<br />
2<br />
(5.43)<br />
(5.44)<br />
Cette équation est équivalente à (5.39). C. Q. F. D.<br />
Lorsque la masse m reste invariable, l’énergie E figurant dans la formule (5.39) peut être<br />
remplacée par l’énergie cinétique Ec définie par (5.11). On a alors la relation<br />
dEc<br />
dt<br />
= F.v, (5.45)<br />
équation formellement analogue à la relation existant entre la variation d’énergie cinétique et la<br />
puissance <strong>de</strong> la force en mécanique newtonienne usuelle. L’équation (5.45) est souvent présentée<br />
comme une justification a posteriori du postulat fondamental 5.6.1.<br />
En multipliant le numérateur et le dénominateur par c 2 , l’équation (5.38) <strong>de</strong> la dynamique<br />
peut encore s’écrire<br />
F =<br />
m<br />
<br />
1 − v2<br />
c2 dv<br />
dt<br />
⎛<br />
⎞<br />
v d ⎜ mc<br />
+ ⎜<br />
c2. dt<br />
⎝<br />
2<br />
<br />
1 − v2<br />
c2 ⎟<br />
⎠ =<br />
m<br />
<br />
1 − v2<br />
c 2<br />
a + v<br />
c 2<br />
dE<br />
. (5.46)<br />
dt<br />
Remplaçons dE/dt par l’expression (5.39) dans (5.46). On voit que l’équation fondamentale<br />
<strong>de</strong> la dynamique peut s’écrire sous la forme<br />
F =<br />
m<br />
<br />
1 − v2<br />
c2 ⎡<br />
a + ⎣ (F.v)<br />
<br />
+ 1 −<br />
c2 v2<br />
c2 ⎤<br />
dm<br />
⎦ v. (5.47)<br />
dt<br />
L’équation (5.47) montre qu’en relativité le 3-vecteur force et le 3-vecteur accélération ne<br />
sont généralement pas colinéaires. On notera que si la masse <strong>de</strong> la particule <strong>de</strong>meure constante<br />
au cours <strong>de</strong> l’interaction, la colinéarité <strong>de</strong> F et <strong>de</strong> a se produit si et seulement si F est orthogonal<br />
à v ou parallèle à v.<br />
70
5.7 Particule chargée dans un champ électromagnétique<br />
Pour illustrer ce qui précè<strong>de</strong>, considérons une particule <strong>de</strong> charge électrique e en mouvement<br />
dans un champ électromagnétique donné 4 , caractérisé par un champ électrique E(t,x) et une<br />
induction magnétique B(t,x). On admet que le premier membre <strong>de</strong> l’équation fondamentale <strong>de</strong><br />
la dynamique s’i<strong>de</strong>ntifie à la force <strong>de</strong> Lorentz F = e [E + v × B]. Le mouvement <strong>de</strong> la particule<br />
satisfait donc l’équation 5<br />
⎛<br />
d<br />
⎝<br />
dt<br />
mv<br />
<br />
1 − v2<br />
c2 ⎞<br />
⎠ = e [E + v × B] . (5.48)<br />
Dans tout ce qui suit, on suppose que la masse <strong>de</strong> la particule est invariable. On notera que<br />
l’équation (5.48) se réduit à<br />
ma = e [E + v × B] (5.49)<br />
si la particule se meut avec une vitesse très petite par rapport à la vitesse fondamentale c.<br />
La partie <strong>de</strong> la force <strong>de</strong> Lorentz due à l’induction magnétique B est orthogonale au vecteur<br />
vitesse : seul le champ électrique fournit un travail. L’équation (5.39) s’écrit donc ici<br />
⎛<br />
d<br />
⎝<br />
dt<br />
mc2<br />
<br />
1 − v2<br />
c2 ⎞<br />
⎠ dt = e(E.v). (5.50)<br />
Dans la théorie <strong>de</strong> Maxwell, le champ électrique E(t,x) s’exprime à partir d’un potentiel<br />
V (t,x) et d’un potentiel vecteur A(t,x) par la relation<br />
où ∇V est le vecteur gradient du potentiel scalaire V . On a donc<br />
E = −∇V − ∂A<br />
, (5.51)<br />
∂t<br />
e(E.v) = −ev.∇V − ev. ∂A<br />
. (5.52)<br />
∂t<br />
Or, la dérivée totale <strong>de</strong> V (t,x) par rapport au temps le long <strong>de</strong> la ligne d’univers <strong>de</strong> la<br />
particule chargée est<br />
ce qui entraîne<br />
dV<br />
dt<br />
ev.∇V = e dV<br />
dt<br />
Substituons (5.54) dans (5.52). Il vient<br />
e(E.v) = −e dV<br />
dt<br />
∂V<br />
= v.∇V + , (5.53)<br />
∂t<br />
+ e∂V<br />
∂t<br />
− e∂V . (5.54)<br />
∂t<br />
− ev.∂A . (5.55)<br />
∂t<br />
4 On veut dire par là que le champ électromagnétique est imposé par un ou <strong>de</strong>s systèmes extérieurs et n’est en<br />
aucune manière influencé par la particule chargée considérée. On dit aussi que cette particule est une particule<br />
d’épreuve. On notera que cette approche n’est acceptable que si on peut négliger l’émission <strong>de</strong> radiation par la<br />
particule chargée.<br />
5 Toutes les quantités sont exprimées dans le sytème SI.<br />
71
Substituons maintenant (5.55) dans (5.50) . Nous obtenons la relation :<br />
qui s’écrit encore<br />
⎛<br />
d<br />
⎝<br />
dt<br />
mc2<br />
<br />
1 − v2<br />
c2 ⎞<br />
⎠ = −e dV<br />
dt<br />
⎛<br />
d<br />
⎝<br />
dt<br />
mc2<br />
<br />
1 − v2<br />
c2 ⎞<br />
+ e<br />
∂V<br />
∂t<br />
<br />
∂V<br />
+ eV ⎠ = e<br />
∂t<br />
− v.∂A<br />
∂t<br />
− v.∂A<br />
∂t<br />
<br />
<br />
(5.56)<br />
. (5.57)<br />
Le second membre <strong>de</strong> (5.57) n’est généralement pas une différentielle totale le long <strong>de</strong> la<br />
ligne d’univers <strong>de</strong> la particule. Il est donc en règle générale impossible <strong>de</strong> définir une énergie<br />
totale conservée pour une particule chargée soumise à un champ électromagnétique donné.<br />
Lorsque le champ électromagnétique est indépendant du temps (on dit aussi constant ou<br />
encore stationnaire), il est toutefois possible <strong>de</strong> définir une loi <strong>de</strong> conservation <strong>de</strong> l’énergie.<br />
Dans ce cas en effet, on peut choisir la jauge du champ <strong>de</strong> telle sorte que les potentiels V et A<br />
soient <strong>de</strong>s fonctions indépendantes du temps, ce qui entraîne la nullité du second membre <strong>de</strong><br />
(5.57). La quantité figurant entre les parenthèses dans le premier membre est alors constante<br />
au cours du mouvement <strong>de</strong> la particule. Nous pouvons donc énoncer la proposition qui suit.<br />
Proposition 5.7.1 Dans un champ électromagnétique indépendant du temps <strong>de</strong> potentiel V =<br />
V (x), le mouvement d’une particule chargée <strong>de</strong> masse invariable m et <strong>de</strong> charge e est tel que<br />
la relation <strong>de</strong> conservation<br />
mc2 <br />
1 − v2<br />
c2 + eV (x) = Cte (5.58)<br />
soit satisfaite.<br />
L’intégrale première (5.58) est évi<strong>de</strong>mment précieuse pour l’étu<strong>de</strong> du mouvement, comme<br />
on va le voir dans la section suivante.<br />
5.8 Un exemple : mouvement d’une charge dans un champ<br />
magnétique constant uniforme<br />
Supposons qu’il n’y ait pas <strong>de</strong> champ électrique et que le champ magnétique soit indépendant<br />
du temps6 . Le premier membre <strong>de</strong> (5.58) se confond alors avec l’énergie <strong>de</strong> la particule7 <br />
E =<br />
mc 2 /<br />
1 − v2<br />
c 2 puisqu’on peut toujours poser V = 0. On a dès lors l’intégrale première<br />
E = mc2<br />
<br />
1 − v2<br />
c2 = Cte. (5.59)<br />
6On notera que d’après les équations <strong>de</strong> Maxwell, E(t,x) = 0 entraîne ∂B(t,x)/∂t = 0 dans les régions<br />
vi<strong>de</strong>s <strong>de</strong> charges.<br />
7Dans cette section, nous utilisons la lettre calligraphique E pour l’énergie <strong>de</strong> la particule afin d’éviter toute<br />
confusion avec le champ électrique.<br />
72
Il est commo<strong>de</strong> décrire (5.38) en remplaçant p par son expression donnée par (5.32). On<br />
obtient ainsi l’équation du mouvement<br />
dp<br />
dt<br />
E<br />
=<br />
c2 dv<br />
dt<br />
= ev × B,<br />
soit en divisant les <strong>de</strong>ux membres par la constante E/c 2<br />
dv<br />
dt<br />
= ec2<br />
E<br />
(v × B). (5.60)<br />
On peut remplacer E par mc 2 lorsque la particule est <strong>de</strong> vitesse très petite par rapport à c<br />
(approximation non relativiste). Lae rapport ec 2 /E se réduit alors à e/m.<br />
Lorsque le champ magnétique constant est en outre supposé uniforme, on peut poser<br />
B = Bk, (5.61)<br />
où B est une constante et k un vecteur unitaire constant. A condition <strong>de</strong> poser<br />
l’équation du mouvement (5.60) s’écrit alors<br />
dv<br />
dt<br />
ω = eBc2<br />
, (5.62)<br />
E<br />
= ω(v × k). (5.63)<br />
La quantité ω est appelée fréquence synchrotron ou encore fréquence <strong>de</strong> gyration. On notera<br />
que pour une particule <strong>de</strong> masse donnée, la fréquence synchrotron dépend <strong>de</strong> la vitesse <strong>de</strong> la<br />
particule. Il suit en effet <strong>de</strong> (5.59) que<br />
ω = eB<br />
m<br />
1<br />
, (5.64)<br />
Γ<br />
où Γ est le facteur <strong>de</strong> Lorentz <strong>de</strong> la particule (cf. Chap. 3). La quantité eB/m est appelée<br />
fréquence cyclotron.<br />
À titre d’exercice, on déduira <strong>de</strong> cette équation que la trajectoire <strong>de</strong> la particule est une<br />
hélice dont l’axe est parallèle au vecteur B et dont le rayon R est donné par<br />
R = E(v⊥)0<br />
, (5.65)<br />
e|B|c2 où (v⊥)0 est la valeur absolue <strong>de</strong> la projection du vecteur vitesse initiale <strong>de</strong> la particule sur un<br />
plan orthogonal à B.<br />
Pour démontrer cette relation, on pourra au choix expliciter et intégrer les équations (5.63)<br />
dans un système d’axes orthonormés (O,x 1 ,x 2 ,x 3 ) tel que Ox 3 soit parallèle à B, ou bien<br />
utiliser une métho<strong>de</strong> vectorielle fondée sur la décomposition du vecteur vitesse v <strong>de</strong> la particule<br />
en un vecteur v|| parallèle à B et un vecteur v⊥ orthogonal à B.<br />
La formule (5.65) est à la base <strong>de</strong> la conception <strong>de</strong>s synchrocyclotrons et <strong>de</strong>s synchrotrons,<br />
accélérateurs <strong>de</strong> particules permettant d’obtenir <strong>de</strong>s vitesses relativistes. Le complexe du CERN<br />
73
près <strong>de</strong> Genève abrite plusieurs synchrotrons, dont le plus grand du mon<strong>de</strong>, le Large Hadron<br />
Colli<strong>de</strong>r (LHC), inauguré en 2008.<br />
Lorsque |v| est très faible <strong>de</strong>vant c, on a E ≈ mc 2 . La relation (5.65) se réduit alors à<br />
R ≈ m(v⊥)0<br />
e|B|<br />
(5.66)<br />
Cette relation approchée est suffisante pour rendre compte du fonctionnement <strong>de</strong>s cyclotrons,<br />
qui sont <strong>de</strong>s accélérateurs <strong>de</strong> particules limités à <strong>de</strong>s vitesses petites <strong>de</strong>vant c.<br />
74
Chapitre 6<br />
Dynamique relativiste (II)<br />
Dans le chapitre précé<strong>de</strong>nt, nous avons montré comment on peut édifier la dynamique<br />
relativiste <strong>de</strong>s particules en maintenant la distinction entre l’espace affine à trois dimensions<br />
associé à un référentiel galiléen arbitraire et le temps dans le même référentiel. Le but <strong>de</strong> ce<br />
nouveau chapitre est formuler les équations <strong>de</strong> la dynamique en termes <strong>de</strong> vecteurs et <strong>de</strong> tenseurs<br />
sur l’espace-temps <strong>de</strong> Minkowski. Cette reconstruction est en fait indispensable pour développer<br />
une dynamique <strong>de</strong>s milieux continus, et préparer ainsi le terrain aux théories relativistes <strong>de</strong> la<br />
gravitation.<br />
6.1 Quadri-vecteur vitesse unitaire d’une particule<br />
6.2 Quadrivecteur impulsion-énergie<br />
6.3 Quadrivecteur accélération<br />
6.4 Loi <strong>de</strong> la dynamique en formalisme quadridimensionnel<br />
6.5 Dynamique <strong>de</strong>s milieux continus<br />
75
Chapitre 7<br />
Gravitation et relativité<br />
La gravitation est une interaction qui rend les corps interdépendants les uns <strong>de</strong>s autres,<br />
indépendamment <strong>de</strong> leurs charges électriques ou <strong>de</strong>s actions <strong>de</strong> contact qu’ils peuvent subir.<br />
Dans le chapitre 5, nous avons supposé <strong>de</strong> manière explicite l’absence <strong>de</strong> cette interaction pour<br />
énoncer le principe d’équivalence <strong>de</strong>s référentiels galiléens (ou principe <strong>de</strong> relativité). Il nous<br />
allons voir maintenant que les idées relativistes entraînent inéluctablement une modification<br />
radicale <strong>de</strong> notre conception <strong>de</strong> l’interaction gravitationnelle. Nous commençons par exposer la<br />
théorie <strong>de</strong> Newton dans le cadre préeinsteinien.<br />
7.1 La théorie newtonienne <strong>de</strong> la gravitation<br />
Dans ce chapitre, nous considérons uniquement <strong>de</strong>s particules <strong>de</strong> masse invariable.<br />
Loi newtonienne <strong>de</strong> la gravitation.— Soient P1 et P2 <strong>de</strong>ux particules quelconques dont<br />
les vecteurs position respectifs sont <strong>de</strong>s fonctions du temps x1(t) et x2(t). La particule P1 exerce<br />
sur la particule P2 une force attractive dont l’expression F 12(t) à l’instant t est donnée par :<br />
F 12(t) = −G<br />
m1m2<br />
|x2(t) − x1(t)| 2<br />
x2(t) − x1(t)<br />
, (7.1)<br />
|x2(t) − x1(t)|<br />
où m1 et m2 sont les masses inertes respectives <strong>de</strong> P1 et P2 et G est une constante universelle,<br />
appelée constante <strong>de</strong> la gravitation. La particule P2 exerce sur P1 une force F 21(t) = −F 12(t).<br />
Rappelons qu’on appelle masse inerte d’une particule P le coefficient m figurant dans<br />
l’énoncé <strong>de</strong> la loi fondamentale <strong>de</strong> la dynamique galiléenne<br />
F étant la résultante <strong>de</strong>s forces agissant sur P à l’instant t.<br />
F = ma, a(t) = d2 x(t)<br />
dt 2 , (7.2)<br />
La loi <strong>de</strong> gravitation (7.1) présente un certain nombre <strong>de</strong> propriétés fondamentales qu’il<br />
importe <strong>de</strong> dégager.<br />
76
P1.— La force gravitationnelle newtonienne est une action à distance. La théorie newtonienne<br />
ne fournit en effet aucune hypothèse plausible permettant <strong>de</strong> concevoir la gravitation<br />
comme une action <strong>de</strong> contact.<br />
P2.— Du fait <strong>de</strong> la décroissance <strong>de</strong> |F | selon une loi <strong>de</strong> puissance <strong>de</strong> la distance, la gravitation<br />
est une interaction dite <strong>de</strong> portée infinie, par opposition aux forces décroissant exponentiellement,<br />
qui sont dites <strong>de</strong> portée finie (interaction décrite par un potentiel <strong>de</strong> Yukawa, par<br />
exemple).<br />
P3.— En accord avec l’invariance galiléenne, la propagation <strong>de</strong> la gravitation s’effectue avec<br />
une vitesse infinie. On dit encore que l’interaction gravitationnelle newtonienne est instantanée.<br />
P4.— L’expression (7.1) est vali<strong>de</strong> qu’il y ait ou non d’autres masses. La théorie newtonienne<br />
admet donc qu’il n’y a pas d’effet d’écran. C’est pourquoi on généralise la formule (7.1) en<br />
posant que la force gravitationnelle exercée par une distribution volumique <strong>de</strong> matière sur une<br />
particule <strong>de</strong> masse m en x à l’instant t est donnée par :<br />
<br />
F(x,t) = −Gm<br />
V (t)<br />
ρ(x ′ ,t)<br />
|x − x ′ | 2<br />
x − x ′<br />
|x − x ′ | d3 x ′ , (7.3)<br />
où ρ(x ′ ,t) est la <strong>de</strong>nsité volumique <strong>de</strong> masse inerte et V (t) est le volume occupé par la distribution<br />
considérée à l’instant t.<br />
P5.— On démontre que l’équation (7.3) peut s’écrire sous la forme :<br />
F(x,t) = ∇xU(x,t), (7.4)<br />
où ∇x désigne l’opérateur gradient opérant au point x et U est la fonction définie par<br />
<br />
ρ(x<br />
U(x,t) = G<br />
V (t)<br />
′ ,t)<br />
|x − x ′ | d3x ′ . (7.5)<br />
La fonction U(x,t) est appelée le potentiel <strong>de</strong> gravitation créé à l’instant t par la distribution<br />
matérielle répartie dans le volume V (t). On montre qu’à l’extérieur du volume V (t), U(x,t) est<br />
solution <strong>de</strong> l’équation <strong>de</strong> Laplace :<br />
∆2U = 0, (7.6)<br />
et qu’à l’intérieur du volume V empli <strong>de</strong> matière, U(x,t) vérifie l’équation <strong>de</strong> Poisson :<br />
∆2U(x,t) = −4πGρ(x,t), (7.7)<br />
où ∆2 est l’opérateur laplacien, défini en coordonnées cartésiennes orthonormées par<br />
∆2U(x,t) = δij<br />
∂ 2 U<br />
∂xi∂xj = ∂2U (∂x1 ) 2 + ∂2U (∂x2 ) 2 + ∂2U 77<br />
(∂x 3 ) 2.<br />
(7.8)
P6.— Les quantités m1 et m2 figurant dans l’équation (7.1) sont les masses inertes <strong>de</strong>s<br />
particules P1 et P2, avons-nous dit. Si nous supposons que le système constitué par les particules<br />
P1 et P2 est isolé, l’équation du mouvement <strong>de</strong> P2 est d’après (7.2) :<br />
m2<br />
d2x2(t) = −G<br />
dt2 m1m2<br />
|x2(t) − x1(t)| 2<br />
En divisant les <strong>de</strong>ux membres <strong>de</strong> (7.2) par m2, il vient l’équation :<br />
d2x2(t) = −G<br />
dt2 m1<br />
|x2(t) − x1(t)| 2<br />
x2(t) − x1(t)<br />
. (7.9)<br />
|x2(t) − x1(t)|<br />
x2(t) − x1(t)<br />
, (7.10)<br />
|x2(t) − x1(t)|<br />
dans laquelle la masse inerte m2 ne figure pas. On obtient bien entendu l’équation du mouvement<br />
<strong>de</strong> P1 en échangeant les rôles <strong>de</strong> m1 et m2 :<br />
d2x1(t) = G<br />
dt2 m2<br />
|x2(t) − x1(t)| 2<br />
x2(t) − x1(t)<br />
, (7.11)<br />
|x2(t) − x1(t)|<br />
et là encore, on constate l’absence <strong>de</strong> la masse inerte <strong>de</strong> la particule dont on décrit le mouvement.<br />
En mécanique newtonienne, les équations du mouvement <strong>de</strong>s particules P1 et P2 en interaction<br />
gravitationnelle ont la forme du système (7.10)-(7.11) dans n’importe quel référentiel<br />
galiléen. La loi <strong>de</strong> gravitation newtonienne satisfait donc le principe <strong>de</strong> relativité galiléenne.<br />
La loi (7.10) entraîne que <strong>de</strong>ux particules <strong>de</strong> masses inertes distinctes lâchées en un point<br />
donné au même instant avec <strong>de</strong>s vecteurs vitesse i<strong>de</strong>ntiques restent en coïnci<strong>de</strong>nce, pourvu<br />
que ces <strong>de</strong>ux particules soient seulement soumises à <strong>de</strong>s forces gravitationnelles. Cette caractéristique<br />
fondamentale <strong>de</strong> l’interaction gravitationnelle, postulée par Newton, est en fait<br />
remarquablement vérifiée avec un précision <strong>de</strong> 10 −13 par l’expérience en laboratoire. On l’appelle<br />
le principe d’équivalence faible ou selon la terminologie que nous adopterons la propriété<br />
d’universalité <strong>de</strong> la loi <strong>de</strong> chute libre. On parle d’universalité car nul objet n’échappe à la force<br />
gravitationnelle : il n’existe aucun moyen <strong>de</strong> construire une cage <strong>de</strong> Faraday gravitationnelle.<br />
Soulignons que par chute libre, nous entendons le mouvement d’une particule qui n’est soumise<br />
à aucune autre force que la gravitation.<br />
Historiquement, la propriété d’universalité <strong>de</strong> la loi <strong>de</strong> chute libre a servi <strong>de</strong> fil directeur<br />
pour introduire les théories métriques <strong>de</strong> la gravitation. Pour l’instant, nous nous contenterons<br />
<strong>de</strong> noter à quel point il est surprenant que les quantités m1 et m2 figurant dans (7.1) soient les<br />
masses inertes <strong>de</strong>s particules P1 et P2. A priori, une loi <strong>de</strong> force centrale attractive en inverse<br />
du carré <strong>de</strong> la distance <strong>de</strong>vrait s’écrire<br />
F 12 = −G M(a) 1 M (p)<br />
2<br />
|x2 − x1| 2<br />
x2 − x1<br />
, (7.12)<br />
|x2 − x1|<br />
où M (a)<br />
1 désignerait la masse grave (ou gravitationnelle) active créant la force F 12 et M (p)<br />
2<br />
désignerait la masse grave (ou gravitationnelle) passive subissant l’action <strong>de</strong> la masse active<br />
M (a)<br />
1 . Naturellement, la force F 21 agissant sur la particule P1 <strong>de</strong>vrait s’écrire<br />
F 21 = G M(p) 1 M (a)<br />
2<br />
|x2 − x1| 2<br />
78<br />
x2 − x1<br />
, (7.13)<br />
|x2 − x1|
M (p)<br />
1 étant la masse grave passive <strong>de</strong> la particule P1 et M (a)<br />
2 la masse grave active <strong>de</strong> la particule<br />
P2. Il n’y a aucune raison d’i<strong>de</strong>ntifier la masse grave active et la masse grave passive avec la<br />
masse inerte qui est une notion introduite indépendamment <strong>de</strong> la gravitation. On peut tout au<br />
plus limiter l’arbitraire sur le rapport (masse grave active)/(masse grave passive) en se référant<br />
au principe <strong>de</strong> l’égalité <strong>de</strong> l’action et <strong>de</strong> la réaction. Il découle en effet immédiatement <strong>de</strong>s<br />
équations (7.12) et (7.13) et <strong>de</strong> F 12 + F 21 = 0 que<br />
M (a)<br />
1<br />
M (p)<br />
1<br />
= M(a) 2<br />
M (p)<br />
2<br />
= constante universelle. (7.14)<br />
La loi <strong>de</strong> Newton ne se contente pas <strong>de</strong> postuler (7.14) : elle i<strong>de</strong>ntifie purement et simplement<br />
sans aucunement l’expliquer la masse inerte d’une particule avec sa masse grave passive (à une<br />
constante multiplicative universelle près, bien entendu, prise ici égale à l’unité).<br />
P7.— Il est enfin un caractère <strong>de</strong> la gravitation qui reste encore très énigmatique : la<br />
force gravitationnelle est extrêmement faible. La constante <strong>de</strong> la gravitation ayant pour valeur<br />
numérique G = 6, 67 × 10 −11 m 3 .s −2 .kg −1 , le rapport <strong>de</strong> la force gravitationnelle et <strong>de</strong> la force<br />
électrostatique qu’exercent l’un sur l’autre <strong>de</strong>ux protons est donné par<br />
Fgrav<br />
Felec<br />
mp étant la masse du proton et e sa charge.<br />
= 4πε0G m2 p<br />
e 2 ≈ 8, 3 × 10−37 ,<br />
7.2 Analyse critique <strong>de</strong> la théorie newtonienne<br />
La théorie newtonienne a permis une <strong>de</strong>scription remarquablement précise d’un ensemble<br />
impressionnant <strong>de</strong> phénomènes physiques (mouvements et figures <strong>de</strong>s corps célestes, comportements<br />
<strong>de</strong>s flui<strong>de</strong>s, etc.). Pourtant, il est clair qu’en dépit <strong>de</strong> ses succès, la conception newtonienne<br />
présente <strong>de</strong> graves défauts internes et s’est en outre trouvée en contradiction avec l’observation<br />
dès la secon<strong>de</strong> moitié du XIX e siècle.<br />
Incohérences conceptuelles<br />
1.— Nous avons vu que la théorie newtonienne décrit la gravitation comme une action à<br />
distance. Or, ce point <strong>de</strong> vue est acceptable comme <strong>de</strong>scription mathématique, mais pas comme<br />
théorie “fondamentale”. Il y a en effet action seulement là où il y a un être pour effectuer<br />
cette action. L’idée d’action à distance est donc inintelligible, comme l’a souligné le philosophe<br />
Leibniz, contemporain <strong>de</strong> Newton 1 .<br />
2.— Un autre défaut tout aussi grave <strong>de</strong> la conception newtonienne est <strong>de</strong> considérer la<br />
gravitation comme une interaction se propageant avec une vitesse infinie et d’entrer ainsi en<br />
1 Newton a reconnu ce point, tout en soulignant qu’il n’avait pu trouver un mécanisme physique plausible<br />
pour expliquer l’attraction par <strong>de</strong>s actions <strong>de</strong> contact.<br />
79
contradiction frontale avec la relativité restreinte 2 , qui s’est révélée en parfait accord avec<br />
l’expérience. La théorie <strong>de</strong> la gravitation doit donc être profondément modifiée. Par analogie<br />
avec la théorie <strong>de</strong> l’électromagnétisme proposée par Maxwell, il est naturel <strong>de</strong> supposer que<br />
la gravitation est un champ ayant une propagation s’effectuant avec une vitesse cg finie. Si<br />
on admettait en outre que l’interaction gravitationnelle satisfait au principe <strong>de</strong> relativité dans<br />
l’espace-temps <strong>de</strong> Minkowski, on <strong>de</strong>vrait même en conclure que cg = c et s’attendre notamment<br />
à l’existence d’on<strong>de</strong>s gravitationnelles se propageant avec la vitesse fondamentale, comme l’avait<br />
déjà vu H. Poincaré dès 1905 3 .<br />
3.— L’équation <strong>de</strong> Poisson (7.7) couple le potentiel <strong>de</strong> gravitation avec la <strong>de</strong>nsité ρ <strong>de</strong><br />
masse inerte. Or, la relativité restreinte montre que toutes les formes d’énergie contribuent<br />
à la masse d’un système matériel. Une théorie cohérente <strong>de</strong>vrait donc considérer toutes les<br />
distributions d’énergie comme <strong>de</strong>s sources du champ gravitationnel. Par exemple, un champ<br />
électromagnétique <strong>de</strong>vrait engendrer un champ gravitationnel.<br />
4.— Il serait peu cohérent d’admettre qu’une distribution d’énergie puisse créer un champ<br />
gravitationnel sans subir l’action du champ créé par une autre distibution d’énergie (dans<br />
le cas contraire, il existerait <strong>de</strong>s situations physiques dans lesquelles le principe d’égalité <strong>de</strong><br />
l’action et <strong>de</strong> la réaction serait violé, ce qui pourrait entraîner la possibilité du mouvement<br />
perpétuel, par ex.). Une théorie viable <strong>de</strong>vrait donc prévoir qu’une masse <strong>de</strong> matière comme le<br />
Soleil courbe un rayon lumineux tout comme elle incurve la trajectoire d’une planète ou d’une<br />
comète. L’introduction <strong>de</strong>s quanta <strong>de</strong> lumière ou photons conforte ce point <strong>de</strong> vue. N’oublions<br />
pas que <strong>de</strong>s calculs <strong>de</strong> déflexion <strong>de</strong> la lumière avaient déjà été tentés dans le cadre newtonien<br />
par Cavendish (1784) et Soldner (1801) précisément en supposant une structure corpusculaire<br />
<strong>de</strong> la lumière.<br />
Désaccord historique avec l’observation<br />
Avant même l’irruption <strong>de</strong>s idées relativistes, la théorie newtonienne présentait un grave<br />
désaccord avec les observations astronomiques. Dès 1859, Le Verrier avait en effet mis en<br />
évi<strong>de</strong>nce une avance résiduelle du périhélie <strong>de</strong> Mercure qu’il estimait être <strong>de</strong> l’ordre <strong>de</strong> 38”/siècle,<br />
inexpliquée par la mécanique céleste. L’existence <strong>de</strong> ce désaccord fut confirmé ultérieurement<br />
par Newcomb (1882, 1895), puis par Doolitle (1912). La valeur actuellement admise pour<br />
l’avance non newtonienne du périhélie <strong>de</strong> Mercure est 42,98”/siècle. Diverses explications ad<br />
hoc furent proposées en restant dans le cadre <strong>de</strong> la physique galiléenne : existence d’une planète<br />
intramercurielle (Vulcain), perturbation produite par un nuage <strong>de</strong> poussières à l’origine <strong>de</strong> la<br />
lumière zodiacale 4 , modification <strong>de</strong> la loi <strong>de</strong> gravitation visant à se rapprocher d’un modèle<br />
électrodynamique, etc. Ces tentatives ne purent cependant pas s’imposer, soit parce qu’elles<br />
ne furent pas confirmées par l’observation (on n’a jamais observé <strong>de</strong> planète intramercurielle),<br />
2 Notons que même avant l’apparition <strong>de</strong>s théories relativistes, la propagation instantanée <strong>de</strong> la gravitation<br />
était très difficilement acceptable. Comment concevoir en effet que si je bouge mon stylo, l’univers entier en soit<br />
instantanément informé ? Le son, les on<strong>de</strong>s sismiques, la lumière se propagent avec une vitesse finie. Pourquoi<br />
la gravitation ferait-elle exception ?<br />
3 Cf. Sur la dynamique <strong>de</strong> l’électron, Rendiconti <strong>de</strong>l Circolo mathematico di Palermo, t. 21, 1906. Réédité par<br />
J. Gabay, <strong>Paris</strong>.<br />
4 Déjà une hypothèse <strong>de</strong> matière noire...<br />
80
soit parce qu’elles contenaient trop d’arbitraire (poussières, modèles inspirés par l’electrodynamique)<br />
ou manquaient <strong>de</strong> cohérence interne.<br />
7.3 Introduction <strong>de</strong>s théories métriques<br />
À l’évi<strong>de</strong>nce, les conceptions relativistes exigent l’abandon <strong>de</strong> la théorie newtonienne <strong>de</strong><br />
la gravitation. De prime abord, il peut sembler naturel <strong>de</strong> chercher à construire une (ou <strong>de</strong>s)<br />
nouvelle(s) théorie(s) du champ <strong>de</strong> gravitation en conservant le cadre <strong>de</strong> l’espace-temps <strong>de</strong><br />
Minkowski. Cette démarche a suscité <strong>de</strong> nombreux travaux 5 . On sait aujourd’hui que cette<br />
construction est possible. Elle s’avère toutefois beaucoup moins simple conceptuellement que<br />
la démarche consistant à munir la variété <strong>de</strong>s événements d’une métrique plus générale que la<br />
métrique <strong>de</strong> Minkowski, selon l’approche initiée par Einstein. C’est cette approche géométrique<br />
que l’on retient ici.<br />
L’abandon du cadre spatio-temporel <strong>de</strong> Minkowski est motivé par un constat simple : le<br />
caractère universel <strong>de</strong> l’interaction gravitationnelle rend le principe d’inertie invérifiable. En<br />
effet, pour être considérée comme isolée, une particule <strong>de</strong>vrait être située à une distance infinie<br />
<strong>de</strong> toutes les concentrations matérielles, <strong>de</strong> manière à ne subir aucune action gravitationnelle<br />
mesurable. Or, rien n’indique que la matière et l’énergie <strong>de</strong> l’univers soit contenue dans un<br />
volume borné en <strong>de</strong>hors duquel il y aurait un “vi<strong>de</strong>” d’extension spatiale indéfinie. Nous pouvons<br />
donc accepter l’idée qu’il faut abandonner le principe d’inertie tel que nous l’avons formulé au<br />
chap. 3 et le remplacer par un principe qui tienne compte d’emblée du fait qu’une particule<br />
dépourvue <strong>de</strong> charge électrique, <strong>de</strong> moment magnétique et <strong>de</strong> “spin” n’est pas isolée mais<br />
effectue toujours un mouvement <strong>de</strong> chute libre dans un champ <strong>de</strong> gravitation.<br />
Quel serait ce nouveau principe ? Dans la section 7.1, nous avons souligné qu’une particule<br />
en chute libre tombe selon une loi <strong>de</strong> mouvement indépendante <strong>de</strong> sa masse inerte (propriété<br />
d’universalité <strong>de</strong> la loi <strong>de</strong> chute libre). Une manière naturelle d’expliquer cette indépendance<br />
serait <strong>de</strong> caractériser le mouvement <strong>de</strong> chute libre par une loi purement géométrique ne faisant<br />
pas intervenir la masse. Or, il se trouve que la relativité restreinte fournit d’emblée une indication<br />
précise <strong>de</strong> ce que peut être une telle loi. Dans le chap. 3, nous avons en effet montré que la<br />
ligne d’univers d’une particule en mouvement rectiligne uniforme par rapport à un référentiel<br />
galiléen arbitraire réalisait un extremum (en fait un maximum) <strong>de</strong> ds. Cette condition signifie<br />
que le mouvement d’une particule isolée dans un espace-temps dépourvu <strong>de</strong> gravitation est<br />
défini par le principe variationnel 6<br />
<br />
δ<br />
<br />
dx<br />
ηµν<br />
µ<br />
dℓ<br />
dxν dℓ = 0, (7.15)<br />
dℓ<br />
x µ = x µ (ℓ) étant les équations paramétriques <strong>de</strong> la ligne d’univers et les points x1 et x2 entre<br />
lesquels on calcule l’intégrale étant maintenues fixes quand on effectue la variation. L’équation<br />
5 dans l’espoir notamment <strong>de</strong> construire une théorie quantique du champ <strong>de</strong> gravitation analogue à<br />
l’électrodynamique quantique, mais ces tentatives n’ont pas jusqu’ici été couronnées <strong>de</strong> succès.<br />
6 sous réserve qu’on choisisse <strong>de</strong>s coordonnées galiléennes.<br />
81
(7.15) peut donc être considérée comme la formulation variationnelle du principe d’inertie dans<br />
l’espace-temps <strong>de</strong> Minkowski.<br />
Nous sommes ainsi conduits au problème préliminaire suivant :<br />
Problème préliminaire.— Étant donnée une variété <strong>de</strong>s événements dans laquelle l’interaction<br />
gravitationnelle n’est pas négligeable, peut-on se donner un intervalle élémentaire ds2 plus général que la métrique <strong>de</strong> Minkowski tel que le principe variationnel7 <br />
δ ds = 0 (7.16)<br />
ren<strong>de</strong> compte <strong>de</strong> la chute libre <strong>de</strong>s corps d’épreuve selon la loi <strong>de</strong> Newton en première approximation?<br />
La réponse à cette question exige certaines définitions et soulève plusieurs problèmes distincts<br />
qu’il faut analyser séparément.<br />
Particule d’épreuve.— Il nous faut d’abord préciser ce qu’on appelle une particule d’épreuve<br />
(on dit aussi une particule-test).<br />
Définition 7.3.1 Une particule d’épreuve est un corps électriquement neutre ayant un champ<br />
gravitationnel propre négligeable et <strong>de</strong>s dimensions si petites que ses paramètres “internes”<br />
(charges 8 , moment magnétique, moment cinétique intrinsèque, etc.) ont une influence négligeable<br />
sur son mouvement.<br />
Cette restriction <strong>de</strong>s postulats fondamentaux aux particules d’épreuve vient <strong>de</strong> ce que les<br />
développements ultérieurs <strong>de</strong>s théories relativistes <strong>de</strong> la gravitation ont montré qu’une particule<br />
qui possè<strong>de</strong> certains caractères <strong>de</strong> “structure interne” comme un moment cinétique interne n’a<br />
pas les mêmes équations <strong>de</strong> mouvement qu’une particule qui en est dépourvue.<br />
Quel type <strong>de</strong> ds 2 choisir ?.— Il est nécessaire <strong>de</strong> spécifier quel type <strong>de</strong> métrique pourrait<br />
éventuellement généraliser la métrique <strong>de</strong> Minkowski <strong>de</strong> manière à rendre compte <strong>de</strong> la<br />
gravitation.<br />
1. Un premier critère <strong>de</strong> choix repose sur le théorème suivant que nous énonçons sans<br />
démonstration 9 .<br />
Théorème 7.3.1 Soit (V4,g) une variété riemannienne <strong>de</strong> dimension 4. Un point x étant<br />
choisi arbitrairement dans V4, il existe <strong>de</strong>s systèmes <strong>de</strong> coordonnées locales y β qui permettent<br />
d’écrire le ds 2 en x sous la forme<br />
ds 2 p<br />
= (dy<br />
α=0<br />
α ) 2 −<br />
3<br />
(dy<br />
β=p+1<br />
β ) 2 , (7.17)<br />
p étant un entier caractéristique <strong>de</strong> la métrique tel que 0 ≤ p ≤ 3.<br />
7 Chaque fois que nous invoquons un principe variationnel dans ce chapitre, il est sous-entendu que les<br />
points <strong>de</strong> V4 entre lesquels on calcule l’intégrale curviligne sont maintenues fixes lorsqu’on effectue la variation,<br />
exactement comme pour l’équation (7.15).<br />
8 La somme algébrique <strong>de</strong> ces charges doit bien entendu être nulle pour assurer la neutralité électrique globale.<br />
9 Cette propriété découle du fait que la matrice (gµν) est symétrique et inversible, donc diagonalisable.<br />
82
L’entier σ = 2(p + 1) − 4 s’appelle la signature <strong>de</strong> la métrique g sur V4 (la signature d’une<br />
métrique sur une variété <strong>de</strong> dimension n serait σ = 2(p + 1) − n, avec 0 ≤ p ≤ n − 1). Pour<br />
que le ds 2 réduit à (7.17) en x ait la forme du ds 2 <strong>de</strong> Minkowski, il faut que la métrique g soit<br />
<strong>de</strong> signature σ = −2. Nous supposerons donc désormais que la métrique susceptible <strong>de</strong> décrire<br />
l’action d’un champ <strong>de</strong> gravitation est précisément <strong>de</strong> signature −2, ce qui entraîne p = 0. Ces<br />
métriques sont dites lorentziennes ou encore hyperboliques normales.<br />
2. Dans un domaine D <strong>de</strong> la variété V4 où se manifeste un champ gravitationnel, le principe<br />
variationnel (7.16) ne doit pas se réduire au principe (7.15), puisque ce <strong>de</strong>rnier conduit au<br />
principe d’inertie. Il ne doit donc pas exister <strong>de</strong> systèmes <strong>de</strong> coordonnées locales dans lesquelles<br />
les gµν se réduisent à leurs valeurs galiléennes ηµν en tout point <strong>de</strong> D. Une métrique qui satisfait<br />
à cette condition est dite douée <strong>de</strong> courbure dans le domaine D, alors que la métrique <strong>de</strong><br />
Minkowski est dite plate. Le point <strong>de</strong> vue développé ici conduit donc à considérer la gravitation<br />
comme une manifestation <strong>de</strong> la courbure d’une métrique lorentzienne.<br />
Il faut souligner que cette conclusion ne contredit en rien le théorème 7.3.1, qui exprime<br />
la possibilité d’une forme minkowskienne <strong>de</strong> la métrique en un point arbitraire, sans que cela<br />
implique que le même système <strong>de</strong> coordonnées va donner une forme minkowskienne en tout<br />
autre point.<br />
De quelle nature sont les lignes d’univers <strong>de</strong>s particules matérielles ?.– Pour que<br />
la quantité ds figurant dans (7.16) soit réelle, il faut que le ds 2 correspondant soit > 0. Par<br />
analogie avec les principes <strong>de</strong> la relativité restreinte dégagés dans le chapitre 3, nous sommes<br />
ainsi conduits à proposer les définitions et à poser au moins à titre provisoire les postulats<br />
suivants :<br />
Définition 7.3.2 Une courbe <strong>de</strong> l’espace-temps (V4,g) est dite du genre temps si ds 2 > 0 le<br />
long <strong>de</strong> cette courbe.<br />
Postulat 7.3.1 Les lignes d’univers <strong>de</strong>s particules matérielles sont <strong>de</strong>s courbes du genre temps.<br />
Ce postulat est une généralisation immédiate du fait que la ligne d’univers d’une particule<br />
matérielle <strong>de</strong> l’espace-temps <strong>de</strong> Minkowski est toujours du genre temps. Il s’applique bien<br />
entendu aux observateurs ponctuels.<br />
Nous pouvons maintenant généraliser la définition et le postulat relatifs au temps propre<br />
énoncés dans le chapitre 3.<br />
Définition 7.3.3 (Définition du temps propre) Soit une particule matérielle P <strong>de</strong> ligne<br />
d’univers C. Le laps <strong>de</strong> temps propre <strong>de</strong> P écoulé entre les événements x1 et x2 appartenant à<br />
C est la quantité τ12[C] définie par<br />
τ12[C] = 1<br />
x2<br />
ds, (7.18)<br />
c x1<br />
où l’intégrale du second membre est calculée le long <strong>de</strong> la ligne C.<br />
Lorsque la ligne d’univers C est décrite par les équations paramétriques x α = x α (ℓ) dans un<br />
système <strong>de</strong> coordonnées locales arbitraires (x α ), l’expression du temps propre τ12[C] est donnée<br />
83
par l’intégrale curviligne :<br />
τ12[C] = 1<br />
ℓ2 <br />
gµν(x<br />
c ℓ1<br />
α (ℓ)) ˙x µ ˙x ν dℓ, ˙x µ = dxµ (ℓ)<br />
, (7.19)<br />
dℓ<br />
où ℓ1 et ℓ2 sont respectivement les valeurs <strong>de</strong> ℓ pour x1 et x2.<br />
Cette définition s’applique à toutes les particules matérielles, même si leur mouvement n’est<br />
pas une chute libre. On notera que le paramètre ℓ <strong>de</strong> la ligne C peut être choisi <strong>de</strong> manière<br />
arbitraire. Il est clair en effet que l’intégrale figurant dans le second membre <strong>de</strong> l’équation (7.19)<br />
ne dépend pas du choix <strong>de</strong> paramétrage <strong>de</strong> C.<br />
Postulat 7.3.2 (Hypothèse <strong>de</strong>s horloges) La quantité τ12[C] définie par (7.18) ou (7.19)<br />
est le temps délivré par une horloge atomique idéale comouvante avec la particule P entre les<br />
événements x1 et x2, que la particule soit en chute libre ou non.<br />
Nature <strong>de</strong>s lignes d’univers <strong>de</strong>s particules d’épreuve en chute libre.– La généralisation<br />
la plus naturelle <strong>de</strong> la relativité restreinte consiste à admettre que la chute libre d’une particule<br />
est gouvernée par le principe variationnel suivant.<br />
Postulat 7.3.3 La ligne d’univers d’une particule matérielle d’épreuve en chute libre est une<br />
courbe <strong>de</strong> genre temps dont les équations paramétriques x α = x α (ℓ) satisfont le principe varia-<br />
tionnel :<br />
<br />
δ<br />
ℓ étant un paramètre arbitraire.<br />
<br />
ds = 0 ⇐⇒ δ<br />
<br />
gµν(xα (ℓ)) dxµ<br />
dℓ<br />
dxν dℓ = 0, (7.20)<br />
dℓ<br />
Toute courbe <strong>de</strong> genre temps qui satisfait (7.20) coïnci<strong>de</strong> avec une géodésique <strong>de</strong> genre temps<br />
<strong>de</strong> l’espace-temps (V4,g) 10 .<br />
Compte tenu <strong>de</strong> la définition 7.3.3, on peut également dire que la ligne d’univers d’une<br />
particule d’épreuve en chute libre satisfait la condition<br />
<br />
δ dτ = 0. (7.21)<br />
On obtient ainsi une généralisation d’une propriété vérifiée en relativité restreinte par les<br />
particules isolées (particules en mouvement inertiel). L’effet “voyageur <strong>de</strong> Langevin” se retrouve<br />
donc ici.<br />
La propriété qu’ont les rayons lumineux en relativité restreinte d’être <strong>de</strong>s droites isotropes<br />
<strong>de</strong> la métrique <strong>de</strong> Minkowski peut se généraliser en admettant le postulat suivant 11 .<br />
Postulat 7.3.4 Les rayons lumineux sont <strong>de</strong>s géodésiques isotropes 12 du ds 2 , c’est-à-dire <strong>de</strong>s<br />
géodésiques le long <strong>de</strong>squelles ds 2 = 0.<br />
10 On utilise ici le théorème C.2.5 énoncé dans l’annexe C.<br />
11 On notera que ce postulat peut en fait se déduire <strong>de</strong>s équations <strong>de</strong> Maxwell formulées dans le cadre <strong>de</strong>s<br />
théories métriques.<br />
12 Se reporter à l’annexe C, sect. C.2 pour la définition <strong>de</strong>s géodésiques isotropes. Soulignons sans insister ici<br />
que le principe variationnel (7.20) ne peut être vali<strong>de</strong> pour ces géodésiques.<br />
84
Peut-on retrouver la loi <strong>de</strong> Newton en première approximation ?– Cherchons maintenant<br />
comment doit s’écrire la métrique pour qu’on puisse retrouver en première approximation<br />
le mouvement newtonien d’une particule à partir du principe variationnel (7.20). Pour retrouver<br />
un principe d’action minimale pour une particule <strong>de</strong> masse unité, il faut multiplier ds par −c.<br />
Nous écrirons donc (7.20) sous la forme<br />
⎛<br />
<br />
δ ⎝−c<br />
<br />
gµν(xα (ℓ) dxµ<br />
dℓ<br />
dxν ⎞<br />
⎠ dℓ = 0, (7.22)<br />
dℓ<br />
ℓ étant un paramètre arbitraire <strong>de</strong> la ligne d’univers le long <strong>de</strong> laquelle l’intégrale du second<br />
membre est calculée. Si on prend le temps coordonnée t = x0 /c comme paramètre, on voit<br />
que (7.22) est formellement équivalent au principe variationnel δ Ldt = 0 formulé avec le<br />
lagrangien<br />
L(x i , ˙x j ,t) = −c 2<br />
<br />
g00(xk ,t) + 2<br />
c g0i(xk ,t) ˙x i + 1<br />
c2gij(x k ,t) ˙x i ˙x j , (7.23)<br />
où les quantités ˙x j sont définies par<br />
˙x j = dxj<br />
. (7.24)<br />
Pour comparer avec la théorie newtonienne, nous allons supposer que le champ gravitationnel<br />
est faible partout. Cette hypothèse consiste à admettre qu’il existe <strong>de</strong>s systèmes <strong>de</strong><br />
coordonnées locales x µ tels que les composantes gµν du tenseur métrique s’écrivent<br />
dt<br />
gµν(x) = ηµν + hµν(x), (7.25)<br />
où ηµν = diag (1, −1, −1, −1) et où les hµν(x) sont <strong>de</strong>s termes perturbateurs très petits :<br />
|hµν(x)| ≪ 1. La métrique écrite sous la forme (7.25) est alors très voisine <strong>de</strong> la métrique <strong>de</strong><br />
Minkowski ds 2 Mink = ηµνdx µ dx ν . Pour cette raison, on appelle les x µ figurant dans le second<br />
membre <strong>de</strong> (7.25) <strong>de</strong>s coordonnées quasi galiléennes.<br />
Nous allons supposer en outre que le mouvement <strong>de</strong> la particule d’épreuve est très lent par<br />
rapport au système <strong>de</strong> coordonnées quasi galiléennes x µ . On a donc | ˙x j |/c ≪ 1.<br />
Sous ces <strong>de</strong>ux hypothèses, le lagrangien (7.23) s’écrit en première approximation :<br />
L(x i , ˙x j ,t) = −c 2<br />
<br />
≈ −c 2 + 1<br />
2<br />
3<br />
( ˙x<br />
i=1<br />
i ) 2 + 1<br />
c2hij ˙x i ˙x j<br />
1/2<br />
3<br />
( ˙x<br />
i=1<br />
i ) 2 − c2<br />
2 h00 + ... (7.26)<br />
1 + h00 + 2<br />
c h0i ˙x i − 1<br />
c 2<br />
Or, en théorie newtonienne, le lagrangien d’une particule <strong>de</strong> masse unité dans un champ<br />
gravitationnel <strong>de</strong> potentiel U(x,t) est :<br />
LN = 1<br />
2<br />
3<br />
( ˙x<br />
i=1<br />
i ) 2 + U(x,t) + C , (7.27)<br />
C étant une constante arbitraire 13 . La comparaison <strong>de</strong> (7.26) et (7.27) montre immédiatement<br />
qu’il suffit <strong>de</strong> poser<br />
h00(x) ≈ − 2U(x,t)<br />
c 2 + C ′ , h0i ≈ 0, hij ≈ 0 (7.28)<br />
13 L’énergie potentielle n’est en effet définie qu’à une constante arbitraire près.<br />
85
pour retrouver la loi <strong>de</strong> gravitation newtonienne en première approximation, C ′ étant une<br />
constante arbitraire. Si on suppose comme nous le ferons désormais que la métrique (7.25)<br />
coïnci<strong>de</strong> avec la métrique <strong>de</strong> Minkowski à l’infini, il faudra poser C ′ = 0, ce qui entraîne<br />
h00(x) ≈ − 2U(x,t)<br />
c 2 . (7.29)<br />
La réponse au problème préliminaire posé ci-<strong>de</strong>ssus est donc positive si la métrique lorentzienne<br />
satisfait le postulat suivant :<br />
Postulat 7.3.5 Lorsque le champ gravitationnel est créé par N corps, il existe une classe <strong>de</strong><br />
systèmes <strong>de</strong> coordonnées locales x α = (x 0 ,x) tels que la métrique prenne en première approximation<br />
la forme :<br />
ds 2 <br />
= 1 − 2U<br />
c2 <br />
(dx 0 ) 2 − (dx 1 ) 2 − (dx 2 ) 2 − (dx 3 ) 2 , (7.30)<br />
où U est le potentiel newtonien engendré par l’ensemble <strong>de</strong>s N masses, tel qu’il est défini par<br />
l’équation (7.5).<br />
On notera que la métrique (7.30) se réduit à la métrique <strong>de</strong> Minkowski lorsque U(x,t) = 0.<br />
Une telle conclusion était évi<strong>de</strong>nte par avance, puisqu’en l’absence <strong>de</strong> champ <strong>de</strong> gravitation,<br />
une particule en chute libre est isolée et son mouvement est en conséquence purement inertiel.<br />
Les résultats ci-<strong>de</strong>ssus encouragent donc la construction d’un cadre théorique dans lequel<br />
les mouvements d’une particule d’épreuve seraient entièrement définis par les géodésiques d’une<br />
métrique g <strong>de</strong> signature −2. La restitution <strong>de</strong> la loi newtonienne en première approximation<br />
n’est cependant pas suffisante à elle seule pour vali<strong>de</strong>r la démarche, car elle ne nous a pas fait<br />
découvrir une nouvelle conséquence susceptible d’être vérifiée expérimentalemnt. Heureusement,<br />
une telle conséquence existe : c’est l’effet Doppler gravitationnel (dit aussi effet Eintein).<br />
7.4 Une conséquence <strong>de</strong> l’approximation newtonienne :<br />
l’effet Doppler gravitationnel<br />
Nous nous contenterons ici <strong>de</strong> raisonner sur un champ gravitationnel stationnaire. Par champ<br />
stationnaire, nous entendons un champ tel qu’il existe <strong>de</strong>s systèmes <strong>de</strong> coordonnées locales dans<br />
lesquels les potentiels <strong>de</strong> gravitation gµν ne dépen<strong>de</strong>nt pas du “temps”, i.e. <strong>de</strong> la coordonnée<br />
que nous avons appelée x 0 : <strong>de</strong> tels systèmes <strong>de</strong> coordonnées sont dits adaptés au caractère stationnaire.<br />
Pour simplifier, nous allons admettre que ce champ est décrit avec une approximation<br />
suffisante par la métrique (7.30) avec un potentiel U indépendant <strong>de</strong> t = x 0 /c.<br />
Supposons que l’on dispose d’un émetteur A susceptible d’émettre un certain type <strong>de</strong> signaux<br />
en un point xA <strong>de</strong> coordonnées spatiales fixes (x i A = const.) et que ces signaux soient captés par<br />
un récepteur B en un point xB lui aussi <strong>de</strong> coordonnées spatiales x i B fixes. La seule hypothèse<br />
faite sur le signal est que le temps <strong>de</strong> propagation entre A et B, soit tB − tA, est une quantité<br />
86
qui dépend uniquement <strong>de</strong>s coordonnées spatiales <strong>de</strong> A et <strong>de</strong> B, ce qu’on peut écrire 14<br />
tB − tA = T (xA,xB), (7.31)<br />
où x désigne le point <strong>de</strong> coordonnées spatiales (xi ) dans chaque hypersurface x0 = constante.<br />
Bien entendu, on admet que l’émetteur A et le récepteur B sont munis chacun d’une horloge<br />
standard comouvante, HA pour A et HB pour B. Appelons TA la pério<strong>de</strong> du signal émis en A,<br />
telle qu’elle est mesurée par l’horloge HA et cherchons à déterminer la pério<strong>de</strong> TB du signal<br />
reçu par B, telle qu’est mesurée par HB. Du fait que l’émetteur A est au repos, le temps propre<br />
le long <strong>de</strong> sa ligne d’univers s’obtient à partir du postulat 7.3.2 en posant dxi = 0 dans la<br />
métrique (7.30), ce qui donne<br />
<br />
dτA ≈ 1 − 2UA<br />
dt. (7.32)<br />
c2 On déduit immédiatement <strong>de</strong> (7.32) que la pério<strong>de</strong> TA du signal émis correspond au laps <strong>de</strong><br />
temps coordonnée ∆tA donné par<br />
∆tA ≈<br />
TA<br />
<br />
1 − 2UA<br />
c 2<br />
. (7.33)<br />
Le même raisonnement s’applique au récepteur B qui est également au repos. La liaison<br />
entre la pério<strong>de</strong> TB du signal reçu en B et le temps coordonnée ∆tB est fournie par une relation<br />
analogue à (7.33) :<br />
∆tB ≈ <br />
1 − 2UB<br />
c2 . (7.34)<br />
Or, on a ∆tB = ∆tA, puisque le temps <strong>de</strong> parcours entre l’émission et la réception ne dépend<br />
pas <strong>de</strong> l’instant d’émission (voir éq. (7.31)). En rapprochant (7.33) et (7.34), il vient :<br />
<br />
2UA<br />
TA <br />
≈ 1 − c<br />
TB<br />
2<br />
1 − 2UB<br />
c2 . (7.35)<br />
Cette formule montre qu’une horloge au repos en A semble ralentie à un observateur au<br />
repos qui l’observe en B, si le potentiel <strong>de</strong> gravitation est plus faible en B qu’en A. D’après<br />
(7.35) en effet, UA > UB =⇒ TB > TA.<br />
La fréquence ν d’un signal mesurée par un observateur est par définition l’inverse <strong>de</strong> la<br />
pério<strong>de</strong> <strong>de</strong> ce signal mesurée par l’observateur à l’ai<strong>de</strong> <strong>de</strong> son horloge standard. On déduit<br />
immédiatement <strong>de</strong> (7.35) que si νA désigne la fréquence du signal émis en A telle qu’elle est<br />
mesurée avec l’horloge standard HA, la fréquence νB du signal mesurée en B avec l’horloge<br />
standard HB est donnée par la relation :<br />
νB<br />
νA<br />
= TA<br />
TB<br />
TB<br />
<br />
2UA <br />
≈ 1 − c2 1 − 2UB<br />
c2 . (7.36)<br />
14 Une telle hypothèse restreint bien entendu la classe <strong>de</strong>s processus physiques que nous considérons comme<br />
<strong>de</strong>s signaux, mais l’important est qu’elle soit compatible avec le caractère stationnaire <strong>de</strong> la métrique. Il est clair<br />
par exemple que les signaux lumineux ou acoustiques ont cette propriété dans un environnement stationnaire.<br />
En revanche, il faut souligner que l’équation (7.31) n’a aucune raison d’être vraie si le champ gravitationnel varie<br />
au cours du temps : dans ce cas, tB − tA dépend aussi <strong>de</strong> l’instant d’émission tA, ou <strong>de</strong> l’instant <strong>de</strong> réception<br />
tB du signal.<br />
87
A l’extérieur du Soleil, on a U/c 2 ≤ 2, 12 × 10 −6 . On peut donc écrire à <strong>de</strong>s termes en 10 −12<br />
près<br />
νB<br />
≈ 1 −<br />
νA<br />
UA − UB<br />
c2 . (7.37)<br />
L’existence <strong>de</strong> l’effet Doppler gravitationnel a été prédite par Einstein dès 1907.<br />
Comme nous l’avons dit plus haut, la seule hypothèse faite sur le signal est celle qui est<br />
exprimée par l’équation (7.31). Il en résulte que la nature physique du signal n’intervient pas<br />
dans les seconds membres <strong>de</strong> (7.35), (7.36) et (7.37) : le signal peut être lumineux, acoustique,<br />
élastique ou s’effectuer par <strong>de</strong>s émissions à intervalles réguliers <strong>de</strong> particules matérielles produites<br />
par un appareil standard (un canon à électrons, par ex). Il faut toutefois souligner que<br />
cette propriété n’est pas générale car elle suppose que l’émetteur et le récepteur sont plongés<br />
dans un champ stationnaire et sont au repos par rapport à n’importe quel système <strong>de</strong> coordonnées<br />
adapté à la stationnarité du champ. Dans le cas général d’un champ gravitationnel<br />
variable, le rapport νB/νA dépendra <strong>de</strong> la nature du signal.<br />
Exemple 1.— On considère un atome au repos en un point A à la surface d’un corps à<br />
symétrie sphérique, dont une raie spectrale bien déterminée est observée en un point B au repos<br />
à l’infini. Le décalage spectral <strong>de</strong> la raie défini par<br />
est d’après (7.36)<br />
∆ν<br />
ν = νB − νA<br />
νA<br />
= νB<br />
νA<br />
− 1<br />
∆ν<br />
≈ −GM<br />
ν c2 , (7.38)<br />
R<br />
où M est la masse du corps central et R son rayon.<br />
Pour le Soleil, on a M = 1, 989 × 10 30 kg et R = 6, 96 × 10 8 m. La formule (7.38) donne<br />
∆ν<br />
ν ≈ 2, 12 × 10−6 . (7.39)<br />
Le signe moins montre que les raies émises sur le Soleil sont décalées vers le rouge pour<br />
un observateur au repos à l’infini. Un effet <strong>de</strong> cet ordre a été effectivement observé mais l’interprétation<br />
<strong>de</strong>s résultats est très délicate en raison <strong>de</strong>s nombreux effets parasites dus à la<br />
température et à l’atmosphère solaires. On a également observé un décalage <strong>de</strong>s raies spectrales<br />
émises par <strong>de</strong>s naines blanches, mais les résultats ont été encore plus incertains.<br />
Exemple 2.— On suppose maintenant que A est au niveau du sol et que B est à une<br />
altitu<strong>de</strong> h au <strong>de</strong>ssus <strong>de</strong> A. Du fait que UA − UB = gh, le décalage <strong>de</strong> fréquence ∆ν/ν défini<br />
comme dans l’exemple ci-<strong>de</strong>ssus est alors donné par la formule approchée<br />
∆ν<br />
ν<br />
≈ −gh , (7.40)<br />
c2 g étant l’accélération <strong>de</strong> la pesanteur. Pour h = 1m, on trouve au sol 15<br />
∆ν<br />
ν ≈ −10−16 .<br />
15 L’estimation ∆ν/ν ≈ 10 −16 pour ∆h = 1 m est à comparer avec la précision <strong>de</strong> l’ordre <strong>de</strong> 4 × 10 −16 en<br />
fraction <strong>de</strong> fréquence qui est obtenue avec les meilleures horloges atomiques actuelles.<br />
88
L’existence du glissement <strong>de</strong> fréquences donné par (7.40) fut vérifié dans le champ terrestre<br />
pour la première fois par Pound et Rebka en 1960 16 , puis <strong>de</strong> manière plus précise (1 %) par<br />
Pound et Sni<strong>de</strong>r en 1964 17 , en faisant “tomber” un rayon lumineux d’une hauteur <strong>de</strong> 22 m dans<br />
une tour <strong>de</strong> l’université <strong>de</strong> Harvard. Une vérification à 10 −4 près <strong>de</strong> la formule (7.37) a par la<br />
suite été faite avec un maser à hydrogène embarqué dans une fusée par Vessot, Levine et al. 18 .<br />
Il semble qu’on puisse aujourd’hui gagner au moins un facteur 30 sur le résultat <strong>de</strong> Vessot et al.<br />
en comparant une fontaine atomique à atomes <strong>de</strong> Césium refroidis embarquée dans un satellite<br />
avec une horloge atomique au sol (mission ACES en préparation).<br />
7.5 Conclusion<br />
La démarche conceptuelle consistant à décrire l’action <strong>de</strong> la gravitation par une métrique<br />
semble fructueuse et incite à poursuivre l’effort <strong>de</strong> reconstruction <strong>de</strong> la physique lorsqu’on prend<br />
en compte la gravitation. Il faut cependant être conscients que les postulats que nous venons<br />
d’introduire ne sont nullement suffisants pour construire une théorie unique. Ils constituent<br />
seulement le socle d’une classe très large (en fait infinie !) <strong>de</strong> théories que l’on appelle les théories<br />
métriques <strong>de</strong> la gravitation. Dans un tel cadre, les composantes gµν du tenseur métrique sont<br />
souvent appelées potentiels <strong>de</strong> gravitation en raison <strong>de</strong> leur rôle déterminant dans la <strong>de</strong>scription<br />
<strong>de</strong> l’interaction gravitationnelle.<br />
Dans les <strong>de</strong>ux chapitres qui suivent, nous allons expliciter un certain nombre d’effets prédits<br />
par ces théories et voir comment ces effets peuvent être utilisés pour discriminer les dites théories<br />
dans le cadre <strong>de</strong> ce qu’on appelle l’approximation postnewtonienne paramétrée <strong>de</strong> premier ordre<br />
(1PPN).<br />
16R. V. Pound & G. A. Rebka, Apparent weight of photons, Physical Review Letters, vol. 4, p. 337, 1960.<br />
17R. V. Pound & J. L. Sni<strong>de</strong>r, Effect of gravity on nuclear resonance, Physical Review Letters, vol. 13, p. 539,<br />
1964.<br />
18Voir R. F. C. Vessot, M. W. Levine et al., Physical Review Letters, vol. 45, p. 2081, 1980, et les références<br />
citées dans cet article.<br />
89
Chapitre 8<br />
Notion d’approximation<br />
postnewtonienne <strong>de</strong>s théories<br />
métriques<br />
Dans ce chapitre, nous étudions comment on peut définir une approximation postnewtonienne<br />
paramétrée <strong>de</strong>s théories métriques dans le cas simple d’une masse à symétrie sphérique<br />
isolée. Cette approche élémentaire s’avère suffisante pour calculer les effets les plus importants<br />
prévus par les théories métriques <strong>de</strong> la gravitation.<br />
8.1 Notion d’approximation postnewtonienne<br />
Comme on l’a vu à la fin du chapitre précé<strong>de</strong>nt, les vérifications expérimentales <strong>de</strong> l’effet<br />
Doppler gravitationnel dont on dispose aujourd’hui montrent que le concept <strong>de</strong> théorie métrique<br />
est viable et incite en conséquence à creuser l’idée. On ne peut cependant s’en tenir à la métrique<br />
quasi newtonienne (7.30), car l’étu<strong>de</strong> <strong>de</strong>s géodésiques <strong>de</strong> cette métrique conduit à une avance du<br />
périhélie <strong>de</strong> Mercure égale à 2/3 <strong>de</strong> l’avance effectivement observée. Or, il semble à première vue<br />
impossible <strong>de</strong> former une meilleur approximation <strong>de</strong> la métrique sans avoir développé une théorie<br />
complète <strong>de</strong> la gravitation, avec <strong>de</strong>s équations permettant <strong>de</strong> déterminer les dix potentiels gµν<br />
en fonction <strong>de</strong>s masses créant le champ. En conséquence, <strong>de</strong>vons-nous dès maintenant chercher<br />
à construire une théorie rigoureuse ou mieux encore une classe <strong>de</strong> théories rigoureuses pour<br />
tester l’idée que la gravitation puisse être décrite par une métrique ?<br />
Nous allons voir qu’il n’en est rien et qu’il est possible <strong>de</strong> progresser en développant une idée<br />
d’Eddington 1 . Nous pouvons tout d’abord déci<strong>de</strong>r <strong>de</strong> nous intéresser uniquement au champ <strong>de</strong><br />
gravitation engendré par une masse à symétrie sphérique (le Soleil par ex.) 2 . De plus, nous pouvons<br />
supposer que le champ est indépendant du temps, comme nous l’avons fait dans la section<br />
7.4. On peut montrer que sous ces hypothèses, il est toujours possible <strong>de</strong> choisir les coordonnées<br />
1 A. S. Eddington, The Mathematical Theory of Relativity, paragr. 47. Cambridge University Press, 1922.<br />
2 Cette approximation s’est avérée suffisante jusqu’ici pour la lumière, mais nous verrons qu’on ne peut s’en<br />
contenter pour le périhélie <strong>de</strong> Mercure.<br />
90
(x 0 ,x i ) <strong>de</strong> telle sorte que la métrique cherchée s’écrive sous la forme simple suivante 3 :<br />
ds 2 = A(r)(dx 0 ) 2 − B(r) <br />
(dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2<br />
, (8.1)<br />
où A(r) et B(r) sont <strong>de</strong>s quantités qui dépen<strong>de</strong>nt uniquement <strong>de</strong> la coordonnée radiale r définie<br />
par<br />
r =<br />
<br />
(x 1 ) 2 + (x 2 ) 2 + (x 3 ) 2 , (8.2)<br />
l’origine O <strong>de</strong>s coordonnées x i étant le centre <strong>de</strong> la masse attractive.<br />
Il faut noter que la réduction <strong>de</strong> la métrique à la forme (8.1) ne contenant que <strong>de</strong>ux fonctions<br />
inconnues A(r) et B(r) est un résultat rigoureux indépendant <strong>de</strong> la théorie lorsqu’on impose la<br />
symétrie sphérique statique. Nous pourrons donc utiliser cette forme quand nous chercherons à<br />
résoudre les équations <strong>de</strong> la relativité générale (équations d’Einstein) dans le cas <strong>de</strong> la symétrie<br />
sphérique.<br />
En second lieu, nous pouvons postuler que la métrique (8.1) doit se réduire à la métrique<br />
<strong>de</strong> Minkowski lorsqu’on s’éloigne indéfiniment <strong>de</strong> la masse centrale. Nous imposons donc les<br />
conditions <strong>de</strong> comportement asymptotique<br />
lim A(r) = 1, lim B(r) = 1. (8.3)<br />
r→∞ r→∞<br />
Le potentiel newtonien d’une masse M à symétrie sphérique est donné par<br />
U = GM<br />
r<br />
Compte tenu <strong>de</strong> (8.4), on doit avoir à l’approximation newtonienne<br />
A(r) = 1 − 2GM<br />
c 2 r<br />
. (8.4)<br />
+ · · ·, (8.5)<br />
le symbole + · · · correspondant à <strong>de</strong>s termes beaucoup plus petits que 2GM/c 2 r dans le système<br />
solaire. Nous voyons intervenir la quantité 2m définie par<br />
2m = 2GM<br />
c 2 . (8.6)<br />
La quantité 2m ayant la dimension d’une longueur, on l’appelle le rayon gravitationnel ou<br />
encore le rayon <strong>de</strong> Schwarzschild 4 du corps. A titre d’exemple, le rayon <strong>de</strong> Schwarzschild du<br />
Soleil vaut<br />
2m⊙ = 2, 953km, (8.7)<br />
à comparer avec le rayon R⊙ du Soleil, qui vaut 6, 96 × 105 km. En conséquence, la variable u<br />
sans dimension définie par<br />
u = m<br />
r<br />
(8.8)<br />
3 Pour la métrique (8.1), on a donc g00 = A(r), g0i = gi0 = 0, gij = −B(r)δij. Les coordonnées spatiales<br />
telles que la partie spatiale <strong>de</strong> la métrique soit <strong>de</strong> la forme F(x α ) (dx) 2 + (dx) 2 + (dx) 2 sont dites isotropiques<br />
ou encore isotropes.<br />
4 Il serait beaucoup plus approprié d’appeler 2m le paramètre d’échelle gravitationnel, car la notion <strong>de</strong> rayon<br />
<strong>de</strong>man<strong>de</strong> à être précisée, mais nous nous conformons à l’usage.<br />
91
est inférieure à m⊙/R⊙ = 2, 12 × 10 −6 dans le système solaire. Sur l’orbite <strong>de</strong> Mercure, u ≈<br />
2, 6 × 10 −8 .<br />
Il résulte <strong>de</strong> ces considérations que nous pouvons supposer que le champ gravitationnel est<br />
faible dans le système solaire et admettre en conséquence que la métrique (8.1) s’écarte très peu<br />
<strong>de</strong> la métrique <strong>de</strong> Minkowski. Il est compatible avec ces hypothèses d’admettre qu’à l’extérieur<br />
du Soleil, A et B figurant dans la métrique (8.1) sont <strong>de</strong>s fonctions analytiques <strong>de</strong> la variable<br />
u au voisinage <strong>de</strong> u = 0, qui correspond au domaine à l’infini <strong>de</strong> l’espace 5 . En conséquence, A<br />
et B peuvent être développés en séries <strong>de</strong> puissances entières <strong>de</strong> u. Nous pouvons donc poser<br />
A(r) = 1 − 2m 3β1 m<br />
+ 2βm2 −<br />
r r2 2<br />
3<br />
+ · · · ,<br />
r3 (8.9)<br />
B(r) = 1 + 2γ m 3δ m<br />
+<br />
r 2<br />
2<br />
γ2 m<br />
+<br />
r2 2<br />
3<br />
+ · · ·<br />
r3 (8.10)<br />
où β,γ,δ,β1,γ2,... sont <strong>de</strong>s constantes sans dimension que l’on appelle <strong>de</strong>s paramètres postnewtoniens,<br />
car leur introduction permet <strong>de</strong> décrire <strong>de</strong>s effets gravitationnels qui ne peuvent<br />
être prédits par l’approximation newtonienne. Les valeurs <strong>de</strong> ces paramètres vont dépendre <strong>de</strong><br />
la théorie métrique qu’on va considérer.<br />
Pour l’instant, nous n’avons pas construit une théorie métrique susceptible d’attribuer <strong>de</strong>s<br />
valeurs définies aux paramètres postnewtoniens. Nous allons donc considérer β, γ, δ, etc. comme<br />
<strong>de</strong>s quantités qu’il nous faudra déterminer en confrontant les effets prédits à partir <strong>de</strong> (8.9) et<br />
(8.10) avec <strong>de</strong>s observations ou <strong>de</strong>s expériences 6 .<br />
8.2 Quels termes faut-il retenir à l’approximation postnewtonienne?<br />
Pour étudier les effets mentionnés ci-<strong>de</strong>ssus, il est primordial <strong>de</strong> savoir quels sont les termes<br />
qu’on peut négliger dans les développements (8.9)-(8.10) en fonction <strong>de</strong> l’ordre d’approximation<br />
postnewtonienne que l’on désire atteindre. Nous allons voir que les termes à retenir ne sont pas<br />
les mêmes selon que l’on s’intéresse aux rayons lumineux (propagation “rapi<strong>de</strong>”) ou aux planètes<br />
du système solaire (corps “lents”).<br />
La déduction <strong>de</strong>s tests classiques repose sur l’étu<strong>de</strong> <strong>de</strong>s géodésiques <strong>de</strong> la métrique (8.1).<br />
C’est pourquoi nous allons effectuer la discussion en partant du principe variationnel qui définit<br />
les géodésiques d’un espace-temps (V4,g) vu dans le chap. 7. Rappelons que si nous prenons<br />
le temps coordonnée t = x 0 /c comme paramètre dans (7.22), la détermination <strong>de</strong>s géodésiques<br />
se ramène à la résolution <strong>de</strong>s équations du mouvement d’un système dynamique décrit par la<br />
fonction <strong>de</strong> Lagrange<br />
L(x i , ˙x j ,t) = −c 2<br />
<br />
g00(x k ,t) + 2<br />
c g0i(x k ,t) ˙x i + 1<br />
c 2gij(x k ,t) ˙x i ˙x j , (8.11)<br />
5 Notons que cette hypothèse d’analyticité ne va pas <strong>de</strong> soi. On pourrait supposer que A et B contiennent<br />
<strong>de</strong>s termes <strong>de</strong> portée finie du type potentiel <strong>de</strong> Yukawa, par exemple. On suppose ici que dans le domaine<br />
astronomique tout au moins, les termes <strong>de</strong> portée finie ont une action négligeable.<br />
6 Les coefficients numériques <strong>de</strong>vant β,γ,δ,β1,γ2,... sont choisis <strong>de</strong> telle sorte que l’on ait β = 1,γ = 1,δ =<br />
1,β1 = 1,γ2 = 1,... en relativité générale, comme on le verra dans le Chapitre 10.<br />
92
où les quantités ˙x j sont définies par<br />
˙x j = dxj<br />
. (8.12)<br />
dt<br />
Les équations différentielles <strong>de</strong>s géodésiques sont alors les équations <strong>de</strong> Lagrange associées<br />
à la fonction <strong>de</strong> Lagrange (8.11) :<br />
d<br />
dt<br />
<br />
∂L ∂ ˙x i<br />
− ∂ L<br />
= 0. (8.13)<br />
∂xi Pour la métrique (8.1), la fonction <strong>de</strong> Lagrange (8.11) s’écrit simplement<br />
L(x i , ˙x j ,t) = −c 2<br />
<br />
A(r) − 1<br />
c 2B(r)δij ˙x i ˙x j . (8.14)<br />
Sous les hypothèses que nous avons faites, les fonctions A(r) et B(r) peuvent être respectivement<br />
remplacées par les développements (8.9) et (8.10). À quel ordre doit-on arrêter ces<br />
développements pour avoir une approximation cohérente ?<br />
Supposons d’abord que nous voulions déterminer les rayons lumineux. Les quantités c −1 ˙x i<br />
sont <strong>de</strong> l’ordre <strong>de</strong> 1, puisque la vitesse <strong>de</strong> la lumière est <strong>de</strong> l’ordre <strong>de</strong> c (nous disons <strong>de</strong> l’ordre<br />
ce c et non égale à c car nous n’avons pas encore défini rigoureusement la notion <strong>de</strong> vitesse).<br />
On a donc<br />
1<br />
c 2δij ˙x i ˙x j ≈ 1 (8.15)<br />
dans (8.14). Il en résulte que les développements <strong>de</strong> A et <strong>de</strong> B doivent être arrêtés aux termes<br />
<strong>de</strong> même puissance <strong>de</strong> m/r. Ainsi, pour une <strong>de</strong>scription cohérente <strong>de</strong>s rayons lumineux, la<br />
première approximation postnewtonienne peut se contenter <strong>de</strong>s dévelopements<br />
A(r) = 1 − 2m<br />
r<br />
, B(r) = 1 + 2γm<br />
r<br />
, (8.16)<br />
tandis que l’approximation postpostnewtonienne nécessite les développements suivants<br />
A(r) = 1 − 2m<br />
r<br />
3δ<br />
+ 2βm2 , B(r) = 1 + 2γm +<br />
r2 r 2<br />
m2 . (8.17)<br />
r2 Il résulte <strong>de</strong> ces formules que la métrique quasi newtonienne (7.30) ne peut fournir une<br />
approximation cohérente pour la lumière : la déviation que l’on pourrait calculer à partir <strong>de</strong><br />
cette métrique ou <strong>de</strong> la dynamique newtonienne usuelle appliquée à <strong>de</strong>s corpuscules allant à la<br />
vitesse <strong>de</strong> la lumière n’est pas une approximation <strong>de</strong> la déviation prédite à partir <strong>de</strong> (8.16).<br />
Examinons maintenant le cas d’une planète ou <strong>de</strong> n’importe quel autre corps autogravitant<br />
dont l’orbite ne va jamais à l’infini (état <strong>de</strong> liaison gravitationnelle). Les équations <strong>de</strong> la<br />
dynamique newtonienne montrent que le carré <strong>de</strong> la vitesse d’un tel corps satisfait la relation<br />
ce qui entraîne<br />
v 2 ∼ GM<br />
r<br />
, (8.18)<br />
1<br />
c2δij ˙x i ˙x j ∼ m<br />
. (8.19)<br />
r<br />
93
On déduit <strong>de</strong> cette équivalence d’ordres <strong>de</strong> gran<strong>de</strong>ur que si on arrête le développement <strong>de</strong><br />
B au terme en m n /r n , il faut aller jusqu’au terme en m n+1 /r n+1 dans le développement <strong>de</strong> A.<br />
Ainsi la première approximation postnewtonienne cohérente pour les corps autogravitants en<br />
état <strong>de</strong> liaison gravitationnelle est définie par<br />
A(r) = 1 − 2m<br />
r<br />
l’approximation postpostnewtonienne correspond à<br />
A(r) = 1 − 2m<br />
r<br />
3β1<br />
+ 2βm2 −<br />
r2 2<br />
+ 2βm2 , B(r) = 1 + 2γm , (8.20)<br />
r2 r<br />
m3 3δ<br />
, B(r) = 1 + 2γm +<br />
r3 r 2<br />
m2 , (8.21)<br />
r2 et ainsi <strong>de</strong> suite.<br />
La forme approchée (8.20) est dite approximation 1PN <strong>de</strong> la métrique à symétrie sphérique<br />
statique (8.1) car le potentiel A = g00 contient un terme d’ordre (v/c) 2 ×(le terme m/r donnant<br />
l’approximation newtonienne). On a en effet m 2 /r 2 ≈ (v/c) 2 × m/r. Par extension, la forme<br />
(8.21) est dite approximation 2PN <strong>de</strong> la métrique, et on peut définir l’approximation kPN pour<br />
k ≥ 3 si besoin est. Pour abréger, on dit que les effets en v n /c n et en m n /r n sont d’ordre 1/c n ,<br />
ce que l’on dénote par O(1/c n ) ou plus simplement par O(n).<br />
8.3 Conclusion<br />
On voit que l’approximation 1PN <strong>de</strong> la métrique suffit pour déterminer les effets relativistes<br />
d’ordre 1/c 2 sur les rayons lumineux, mais qu’il faut impérativement considérer l’approximation<br />
2PN si on veut calculer les effets d’ordre 1/c 4 sur la lumière.<br />
94
Chapitre 9<br />
Quelques effets classiques prévus par<br />
les théories métriques<br />
Nous allons maintenant déterminer un certain nombre d’effets spécifiquement prédits à<br />
partir <strong>de</strong> la métrique postnewtonienne définie par (8.1) et (8.20) et pouvant servir <strong>de</strong> tests <strong>de</strong>s<br />
théories métriques : l’effet <strong>de</strong> retard dans la propagation <strong>de</strong>s signaux électromagnétiques, la<br />
déviation gravitationnelle <strong>de</strong>s rayons lumineux et l’avance séculaire relativiste du périhélie <strong>de</strong>s<br />
planètes.<br />
9.1 Temps <strong>de</strong> propagation d’un rayon lumineux entre<br />
<strong>de</strong>ux points<br />
Supposons qu’un photon émis au point xA à l’instant tA soit reçu en un point xB à l’instant<br />
tB (fig. 9.1). Du fait que la métrique (8.1) s’écarte légèrement <strong>de</strong> la métrique <strong>de</strong> Minkowski, on<br />
doit avoir<br />
x 0 B − x 0 A = c(tB − tA) = |xB − xA| + c∆T (xA,xB), (9.1)<br />
le terme c∆T (xA,xB) <strong>de</strong>vant s’annuler en l’absence <strong>de</strong> champ gravitationnel (GM = 0), <strong>de</strong><br />
telle sorte qu’on retrouve alors l’expression <strong>de</strong> x 0 B − x 0 A dans l’espace-temps <strong>de</strong> Minkowski. On<br />
a effectivement le théorème suivant.<br />
Proposition 9.1.1 Soit un photon émis en xA à l’instant tA et reçu en xB à l’instant tB dans<br />
un espace-temps statique à symétrie sphérique dont la métrique est écrite sous la forme :<br />
ds 2 <br />
= 1 − 2m<br />
<br />
+ · · · c<br />
r 2 dt 2 <br />
− 1 + 2γ m<br />
+ · · · dx<br />
r 12 + <br />
dx 22 + <br />
dx 32 <br />
, (9.2)<br />
les termes négligés étant d’ordre 1/c4 .<br />
Le temps <strong>de</strong> parcours tB − tA est donné par les expressions équivalentes<br />
tB − tA = RAB<br />
+ (γ + 1)GM<br />
c c3 <br />
rB + N AB.xB<br />
ln<br />
+ O(1/c<br />
rA + N AB.xA<br />
5 ), (9.3)<br />
= RAB<br />
+ (γ + 1)GM<br />
c c3 <br />
rA − N AB.xA<br />
ln<br />
+ O(1/c<br />
rB − N AB.xB<br />
5 ), (9.4)<br />
95
qui peuvent encore s’écrire sous la forme<br />
où 1<br />
et<br />
tB − tA = RAB<br />
c<br />
+ (γ + 1)GM<br />
c 3 ln<br />
rA = |xA|, rB = |xB|, nA = xA<br />
, nB = xB<br />
<br />
rA + rB + RAB<br />
+ O(1/c<br />
rA + rB − RAB<br />
5 ), (9.5)<br />
rA<br />
rB<br />
(9.6)<br />
RAB = |xB − xA|, N AB = xB − xA<br />
. (9.7)<br />
Il est clair que le terme relativiste logarithmique dans le second membre <strong>de</strong> (9.5) est toujours<br />
positif si A et B sont distincts, car on sait aujour’hui que γ + 1 est très voisin <strong>de</strong> 2. La durée<br />
du trajet d’un rayon lumineux entre <strong>de</strong>ux points est donc toujours supérieure au temps RAB/c<br />
que mettrait ce rayon en l’absence <strong>de</strong> champ gravitationnel. La mesure <strong>de</strong> cet effet <strong>de</strong> retard<br />
a été proposée comme test <strong>de</strong> la relativité générale par Shapiro dès 1964 2 . C’est pourquoi on<br />
appelle souvent cet effet l’effet Shapiro.<br />
Démonstration.— On peut donner une démonstration élémentaire <strong>de</strong>s formules (9.3)-(9.5)<br />
sans intégrer explicitement les équations différentielles <strong>de</strong>s géodésiques isotropes. Compte tenu<br />
<strong>de</strong> la forme (9.2) <strong>de</strong> la métrique, la propriété que ds 2 = 0 le long d’un rayon mumineux se<br />
traduit par la relation<br />
<br />
<br />
<br />
cdt = <br />
1 + 2γ m<br />
r<br />
1 − 2 m<br />
r<br />
RAB<br />
<br />
|dx| = 1 + (γ + 1) m<br />
<br />
|dx| + O(1/c<br />
r<br />
4 ), (9.8)<br />
où dx est le vecteur infinitésimal dx = (dx1 ,dx2 ,dx3 ) pris le long du rayon lumineux et |dx|<br />
la norme euclidienne usuelle <strong>de</strong> dx :<br />
|dx| =<br />
<br />
δijdx i dx j . (9.9)<br />
On peut toujours choisir le paramètre affine λ le long du rayon <strong>de</strong> telle sorte que λ = 0 en<br />
xA et λ = 1 en xB. Avec ce choix la trajectoire du rayon est alors décrite par une équation <strong>de</strong><br />
la forme<br />
x(λ) = RABN ABλ + xA + X(λ), (9.10)<br />
où RABN ABλ + xA est la droite reliant xA et xB (approximation d’ordre zéro) et X(λ)<br />
représente la perturbation gravitationelle subie par le rayon. La fonction X(λ) doit évi<strong>de</strong>mment<br />
satisfaire aux conditions aux limites<br />
X(0) = 0, X(1) = 0. (9.11)<br />
1 On notera que nA, nB et NAB sont <strong>de</strong>s vecteurs unitaires au sens usuel.<br />
2 I. I. Shapiro, Physical Review Letters, vol. 13, p. 789 (1964).<br />
96
A<br />
o<br />
N AB<br />
n A<br />
o<br />
O<br />
n B<br />
Fig. 9.1 – Retard gravitationnel <strong>de</strong>s rayons lumineux.<br />
D’après (9.8) et (9.10), la différence tB − tA a pour expression :<br />
tB − tA = 1<br />
<br />
1<br />
1 + (γ + 1)<br />
c 0<br />
m<br />
<br />
<br />
RABN AB +<br />
|x(λ)|<br />
dX<br />
dλ<br />
o<br />
B<br />
<br />
<br />
<br />
<br />
dλ + O(1/c5 ), (9.12)<br />
Les équations d’Euler-Lagrange <strong>de</strong>s géodésiques 3 entraînent que X(λ) est d’ordre 1/c 2 . En<br />
conséquence, dX/dλ est aussi d’ordre 1/c 2 . Du fait que nous voulons seulement calculer la<br />
contribution gravitationnelle d’ordre 1/c 3 dans tB − tA, nous pouvons donc négliger le terme<br />
(dX/dλ) 2 dans le calcul <strong>de</strong> |dx/dλ|, puisque ce terme est d’ordre 1/c 4 . Cette approximation<br />
donne : <br />
<br />
dx(λ) <br />
<br />
= RAB 1 +<br />
dλ N AB<br />
RAB<br />
d’où après substitution dans le second membre <strong>de</strong> (9.12) :<br />
tB − tA = RAB<br />
c<br />
<br />
1<br />
1 + (γ + 1)<br />
0<br />
m<br />
|x(λ)| + N AB<br />
RAB<br />
· dX<br />
<br />
dλ + O(1/c<br />
dλ<br />
4 ). (9.13)<br />
· dX<br />
<br />
dλ + O(1/c<br />
dλ<br />
5 ). (9.14)<br />
Or, la <strong>de</strong>rnière intégrale du second membre <strong>de</strong> (9.14) est nulle en raison <strong>de</strong>s conditions aux<br />
limites (9.11). En effet<br />
1 N AB<br />
0<br />
RAB<br />
En conséquence, (9.14) s’écrit<br />
tB − tA = RAB<br />
c<br />
3 Equations (C.19) <strong>de</strong> l’annexe C.<br />
· dX<br />
dλ dλ = N AB<br />
RAB<br />
+ (γ + 1)mRAB<br />
c<br />
97<br />
· [X(1) − ·X(0)] = 0. (9.15)<br />
1<br />
0<br />
dλ<br />
|x(λ)| + O(1/c5 ). (9.16)
Le terme m/|x(λ)| étant d’ordre 1/c 2 , on peut négliger la contribution <strong>de</strong> X(λ) dans |x(λ)|<br />
et poser simplement<br />
et<br />
m<br />
|x(λ)| =<br />
Compte tenu <strong>de</strong>s i<strong>de</strong>ntités<br />
on trouve<br />
m<br />
<br />
R 2 ABλ 2 + 2RAB(N AB.xA)λ + r 2 A<br />
R 2 AB + 2RAB.xA + r 2 A ≡ r 2 B<br />
RAB + N AB.xA ≡ (xB − xA).N AB + xA.N AB ≡ N AB.xB ,<br />
1<br />
m<br />
0<br />
dλ<br />
|x(λ)|<br />
<br />
m rB + N AB.xB<br />
= ln<br />
RAB rA + N AB.xA<br />
D’où l’expression <strong>de</strong> tB − tA donnée par (9.3).<br />
En utilisant l’i<strong>de</strong>ntité <strong>de</strong> “polarisation”<br />
on voit que<br />
Mais on a aussi l’i<strong>de</strong>ntité<br />
qui entraîne<br />
|x||y| + x.y ≡ 1 <br />
(|x| + |y|)<br />
2<br />
2 − (x − y) 2<br />
,<br />
rB + N AB.xB = rBRAB + RAB.xB<br />
RAB<br />
|x||y| + x.y ≡ 1 <br />
(x + y)<br />
2<br />
2 − (|x| − |y|) 2<br />
,<br />
rA + N AB.xA = rARAB + RAB.xA<br />
Il résulte <strong>de</strong> (9.19) et (9.20) que<br />
rB + N AB.xB<br />
rA + N AB.xA<br />
RAB<br />
<br />
+ O(1/c 5 ). (9.17)<br />
+ O(1/c 4 ). (9.18)<br />
= 1 (rA + RAB)<br />
2<br />
2 − r2 A<br />
. (9.19)<br />
RAB<br />
= 1 r<br />
2<br />
2 B − (rA − RAB) 2<br />
. (9.20)<br />
RAB<br />
= (rA + RAB) 2 − r2 A<br />
r2 B − (rA − RAB) 2 = rA + rB + RAB<br />
. (9.21)<br />
rA + rB − RAB<br />
L’équation (9.21) entraîne immédiatement (9.5). La formule (9.5) montre que la quantité<br />
tB − tA est inchangée lorsqu’on échange xA et xB (cette propriété est en fait liée au caractère<br />
statique <strong>de</strong> la métrique). On voit facilement en échangeant le rôle <strong>de</strong> A et <strong>de</strong> B que (9.3) peut<br />
également s’écrire sous la forme (9.4).<br />
L’expression (9.5) est très commo<strong>de</strong> pour évaluer le temps <strong>de</strong> parcours d’un photon entre<br />
une station terrestre et un satellite artificiel. Les expressions (9.3) ou (9.4) sont d’un emploi<br />
courant dans la modélisation <strong>de</strong> l’effet Shapiro dans le système solaire, mais il est <strong>de</strong>s cas où il<br />
est utile d’introduire la distance minimale entre le rayon lumineux et l’origine <strong>de</strong>s coordonnées.<br />
On peut alors se servir <strong>de</strong> l’expression <strong>de</strong> tB − tA fournie par le corollaire qui suit.<br />
98
Corollaire 9.1.1 Sous les hypothèses du théorème 9.1.1, le temps <strong>de</strong> parcours tB − tA peut<br />
encore s’écrire sous la forme :<br />
tB − tA = RAB<br />
c<br />
+(γ + 1) GM<br />
c3 ln rArB [1 + (nB − nA).N AB − (N AB.nA)(N AB.nB)]<br />
r2 + O(1/c<br />
c<br />
5 ),<br />
(9.22)<br />
où rc est la distance euclidienne entre le point O et la droite passant par les points xA et xB :<br />
rc = rArB<br />
RAB<br />
sin ψAB, (9.23)<br />
ψAB étant l’angle entre les vecteurs nA et nB.<br />
Dans le cas où A et B sont très éloignés <strong>de</strong> l’origine O et rc ≪ inf (rA,rB), on a avec une<br />
approximation suffisante<br />
tB − tA ≈ RAB<br />
c<br />
+ (γ + 1)GM<br />
c3 <br />
4rArB<br />
ln<br />
Démonstration.— Un raisonnement géométrique élémentaire montre que 4<br />
D’où :<br />
rB + N AB.xB<br />
rA + N AB.xA<br />
(N AB.xA) 2 = r 2 A − r 2 c<br />
= (rB + N AB.xB)(rA − N AB.xA)<br />
r 2 A − (N AB.xA) 2<br />
= rArB<br />
r 2 c<br />
r 2 c<br />
<br />
+ O(1/c 5 ). (9.24)<br />
[1 + (nB − nA)N AB − (N AB.nA)(N AB.nB)], (9.25)<br />
qui entraîne immédiatement (9.22) par substitution dans (9.3).<br />
Supposons que A et B soient très éloignés du Soleil et que le rayon lumineux passe très près<br />
<strong>de</strong> la surface solaire . Alors nB ≈ nA et N AB ≈ nB, ce qui entraîne<br />
1 + (nB − nA).N AB − (N AB.nA)(N AB.nB) ≈ 4.<br />
D’où (9.24) en substituant dans (9.22).<br />
L’équation (9.24) est l’expression <strong>de</strong> tB − tA que l’on a utilisée pour interpréter le décalage<br />
<strong>de</strong>s fréquences <strong>de</strong>s signaux radio échangés entre la Terre et la son<strong>de</strong> Cassini lors <strong>de</strong> son passage<br />
<strong>de</strong>rrière le Soleil. On a ainsi pu effectuer la meilleure détermination du paramètre γ obtenue à<br />
ce jour 5 :<br />
γ − 1 = (2, 1 ± 2, 3) × 10 −5 . (9.26)<br />
4 De même, on a (NAB.xB) 2 = r 2 B − r2 c .<br />
5 B. Bertotti, L. Iess & P. Tortura, Nature, vol. 425, p. 374 (2003).<br />
99
9.2 Équations <strong>de</strong>s géodésiques d’une métrique à symétrie<br />
sphérique statique<br />
Pour déterminer la déviation <strong>de</strong>s rayons lumineux et l’avance séculaire du périhélie, nous<br />
allons appliquer la théorie <strong>de</strong>s géodésiques exposée dans la section C.2 <strong>de</strong> l’annexe C. Nous<br />
utilisons une métrique à symétrie sphérique telle que (8.1), que nous recopions ici<br />
ds 2 = A(r)(dx 0 ) 2 − B(r) <br />
(dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2<br />
, (9.27)<br />
les quantités A(r) et B(r) étant pour l’instant <strong>de</strong>s fonctions différentiables arbitraires.<br />
Les calculs effectués dans cette section sont rigoureux.<br />
Introduisons les coordonnées sphériques r,θ,ϕ définies par<br />
x 1 = r sin θ cos ϕ, x 2 = r sin θ sin ϕ, x 3 = r cos θ . (9.28)<br />
La métrique (9.27) s’écrit alors sous la forme<br />
ds 2 = A(r)(dx 0 ) 2 − B(r)(dr 2 + r 2 dθ 2 + r 2 sin 2 θdϕ 2 ). (9.29)<br />
La fonction <strong>de</strong> Lagrange L correspondant à cette métrique est donnée par<br />
2L = A(r)( ˙x 0 ) 2 − B(r)(˙r 2 + r 2 ˙ θ 2 + r 2 sin 2 θ ˙ϕ 2 ), (9.30)<br />
où on utilise la notation ˙x = dx/dλ, λ étant un paramètre affine arbitraire <strong>de</strong> la géodésique.<br />
L’intégrale première 2L = K = const. s’écrit alors<br />
A(r)( ˙x 0 ) 2 − B(r)(˙r 2 + r 2 ˙ θ 2 + r 2 sin 2 θ ˙ϕ 2 ) = K , (9.31)<br />
avec K > 0 pour une géodésique du genre temps et K = 0 pour une géodésique isotrope.<br />
Du fait que L ne dépend explicitement ni <strong>de</strong> x 0 ni <strong>de</strong> ϕ (<strong>de</strong> telles variables sont dites<br />
cycliques ou ignorables), il existe <strong>de</strong>ux autres intégrales premières :<br />
∂L<br />
∂ ˙x 0 ≡ A(r) ˙x0 = E , (9.32)<br />
∂L<br />
∂ ˙ϕ ≡ −B(r)r2 sin 2 θ ˙ϕ = −L, (9.33)<br />
où E et L sont <strong>de</strong>s constantes d’intégration. Notons que L correspond au moment cinétique<br />
conservé en mécanique newtonienne.<br />
Pour obtenir un système complet d’équations du mouvement, il suffit d’adjoindre l’équation<br />
d’Euler-Lagrange pour la variable θ :<br />
d<br />
dλ [−B(r)r2 ˙ θ] + B(r)r 2 sin θ cos θ ˙ϕ 2 = 0. (9.34)<br />
En raison <strong>de</strong> la symétrie sphérique, on peut poser que le mouvement s’effectue dans un plan<br />
fixe passant par l’origine O. Il est alors possible <strong>de</strong> choisir l’orientation <strong>de</strong>s axes <strong>de</strong> telle sorte<br />
que la géodésique étudiée soit dans le plan équatorial d’équation<br />
θ = π<br />
. (9.35)<br />
2<br />
100
Avec ce choix d’axes, on a ˙ θ = 0 et la géodésique est alors déterminée par le système <strong>de</strong>s<br />
trois intégrales premières<br />
<br />
0 2 2 dx dr<br />
A(r) − B(r) − B(r)r<br />
dλ dλ<br />
2<br />
2 dϕ<br />
= K , (9.36)<br />
dλ<br />
A(r) dx0<br />
dλ<br />
B(r)r 2dϕ<br />
dλ<br />
De (9.37) et (9.38), on déduit :<br />
= E , (9.37)<br />
dx 0<br />
dλ<br />
= L. (9.38)<br />
= E<br />
A(r) ,<br />
dϕ<br />
dλ<br />
L<br />
=<br />
r2 . (9.39)<br />
B(r)<br />
Substituons ces expressions dans (9.36) et divisons <strong>de</strong>s <strong>de</strong>ux membres par B(r). Nous obtenons<br />
l’équation différentielle du premier ordre à variables séparables :<br />
2 dr E<br />
=<br />
dλ<br />
2<br />
L2<br />
−<br />
A(r)B(r) r2 1<br />
B2 K<br />
− . (9.40)<br />
(r) B(r)<br />
Deux cas sont à distinguer.<br />
1. L = 0. Dans ce cas ˙ϕ = 0, ce qui entraîne ϕ = constante. La géodésique est dite radiale.<br />
L’équation (9.40) se réduit alors à<br />
2 dr E<br />
=<br />
dλ<br />
2 K<br />
− . (9.41)<br />
A(r)B(r) B(r)<br />
En éliminant dλ entre (9.41) et la première équation <strong>de</strong> (9.39), il vient :<br />
<br />
dr<br />
dx0 2 = A(r)<br />
<br />
1 −<br />
B(r)<br />
K<br />
E2A(r) <br />
. (9.42)<br />
Cette équation du premier ordre à variables séparables permet <strong>de</strong> trouver la relation entre<br />
r et le temps coordonnée t sous forme <strong>de</strong> quadrature.<br />
2. L = 0. Dans ce cas, on peut éliminer dλ entre (9.40) et (9.38), ce qui donne :<br />
2 dr<br />
= r<br />
dϕ<br />
4<br />
<br />
2 E<br />
L2 1 K<br />
−<br />
A(r) L2 <br />
B(r) − 1<br />
r2 <br />
. (9.43)<br />
L’équation (9.43) est une équation différentielle du premier ordre à variables séparables<br />
qui permet en principe <strong>de</strong> déterminer l’angle ϕ en fonction <strong>de</strong> la variable radiale r lorsque les<br />
fonctions A(r) et B(r) sont connues. Il est toutefois plus pratique d’utiliser u = m/r comme<br />
fonction inconnue plutôt que r. En substituant dr = −mu−2du dans (9.43) et en multipliant<br />
les <strong>de</strong>ux membres par u4 , on obtient une équation qui peut s’écrire sous la forme :<br />
2 du<br />
dϕ<br />
= m2 E 2<br />
L 2<br />
B(u) m2<br />
− K<br />
A(u) L2 B(u) − u2 . (9.44)<br />
101
Cette équation différentielle est elle aussi à variables séparables. En prenant la racine carrée<br />
<strong>de</strong> chaque membre <strong>de</strong> (9.44), on obtient l’équation<br />
dϕ = ± <br />
du<br />
m2E2 L2 B(u) m2 − K A(u) L2 B(u) − u2 , (9.45)<br />
qui permet d’exprimer ϕ en fonction <strong>de</strong> u par une quadrature.<br />
L’intégration <strong>de</strong> l’équation (9.45) permet <strong>de</strong> déterminer l’angle <strong>de</strong> déviation <strong>de</strong> la lumière<br />
ainsi que l’avance du périhélie sous la forme d’une intégrale exacte. Pour obtenir une expression<br />
approchée <strong>de</strong> u (ou <strong>de</strong> r) en fonction <strong>de</strong> ϕ, il est toutefois commo<strong>de</strong> <strong>de</strong> différencier (9.44) par<br />
rapport à ϕ. On obtient ainsi<br />
2 du d<br />
dϕ<br />
2u d<br />
=<br />
dϕ2 du<br />
m 2 E 2<br />
L 2<br />
B(u)<br />
A(u)<br />
<br />
m2 du<br />
− K B(u) − 2udu . (9.46)<br />
L2 dϕ dϕ<br />
Si l’orbite ou le rayon lumineux ne sont pas circulaires, du/dϕ = 0 sauf au péricentre ou à<br />
l’apocentre. On peut alors diviser les <strong>de</strong>ux membres <strong>de</strong> (9.46) par 2du/dϕ. En faisant passer le<br />
terme u du second membre dans le premier membre, il vient :<br />
d2u 1<br />
+ u =<br />
dϕ2 2<br />
d<br />
du<br />
m 2 E 2<br />
L 2<br />
B(u)<br />
A(u)<br />
<br />
m2<br />
− K B(u) . (9.47)<br />
L2 L’équation (9.47) se prête mieux que l’équation (9.44) à <strong>de</strong>s calculs perturbatifs.<br />
9.3 Déviation <strong>de</strong> la lumière par une masse à symétrie<br />
sphérique<br />
On doit poser K = 0 pour un rayon lumineux. L’équation (9.44) se réduit alors à<br />
2 du<br />
=<br />
dϕ<br />
m2E2 L2 B(u)<br />
A(u) − u2 . (9.48)<br />
Nous posons que le rayon lumineux atteint le point le plus proche <strong>de</strong> l’origine (péricentre<br />
P) lorsque ϕ = 0 et nous appelons rp la valeur <strong>de</strong> r en ce point (fig. 9.2). La solution <strong>de</strong> (9.48)<br />
doit donc satisfaire aux conditions aux limites<br />
<br />
du<br />
= 0, up ≡ u|ϕ=0 =<br />
dϕ<br />
m<br />
. (9.49)<br />
ϕ=0<br />
En substituant ces expressions dans (9.48), on voit que la constante m2E2 /L2 est donnée<br />
par<br />
m2E2 L2 = u2 Ap<br />
p , (9.50)<br />
Bp<br />
où<br />
rp<br />
Ap = A(up), Bp = B(up). (9.51)<br />
102
L’équation (9.47) s’écrit donc maintenant<br />
d2u 1<br />
+ u =<br />
dϕ2 2 u2 Ap<br />
p<br />
Bp<br />
d<br />
du<br />
<br />
B(u)<br />
. (9.52)<br />
A(u)<br />
L’équation (9.52) est rigoureuse. Nous allons l’appliquer au calcul <strong>de</strong> la déviation <strong>de</strong> la<br />
lumière à l’approximation postnewtonienne du premier ordre en posant (voir chapitre 8) :<br />
A(u) = 1 − 2u + · · · , B(u) = 1 + 2γu + · · · . (9.53)<br />
Pour évaluer l’ordre <strong>de</strong> gran<strong>de</strong>ur <strong>de</strong>s différentes quantités intervenant dans les équations du<br />
mouvement, il est très commo<strong>de</strong> d’introduire le paramètre sans dimension ǫ défini par<br />
ǫ = up = m<br />
. (9.54)<br />
D’après ce que nous avons vu précé<strong>de</strong>mment, une quantité d’ordre ǫ est d’ordre 1/c 2 . Nous<br />
pourrons donc poser<br />
rp<br />
O(ǫ) ∼ O(1/c 2 ) = O(2), O(ǫ 2 ) ∼ O(1/c 4 ) = O(4). (9.55)<br />
Rappelons qu’on a ǫ ≤ 2, 13 × 10−6 à l’extérieur du Soleil.<br />
Il est clair que le second membre <strong>de</strong> (9.47) est d’ordre ǫ2 . À l’approximation du premier<br />
ordre en ǫ, l’équation (9.52) se réduit donc à<br />
d2u + u = 0. (9.56)<br />
dϕ2 La solution <strong>de</strong> cette équation satisfaisant aux conditions aux limites (9.49) est<br />
u = up cos ϕ ⇐⇒ rp = r cos ϕ, (9.57)<br />
ce qui montre que le rayon lumineux coïnci<strong>de</strong> avec la droite orthogonale en P au rayon vecteur<br />
joignant O et P. Pour calculer la déviation relativiste du rayon lumineux, il faut donc retenir<br />
les termes d’ordre ǫ2 dans le second membre <strong>de</strong> (9.52). À cet ordre d’approximation, il suffit <strong>de</strong><br />
prendre :<br />
Ap<br />
B(u)<br />
= 1 + O(ǫ),<br />
Bp<br />
A(u) = 1 + 2(γ + 1)u + O(ǫ2 ) =⇒ d<br />
<br />
B(u)<br />
= 2(γ + 1) + O(ǫ).<br />
du A(u)<br />
Compte tenu <strong>de</strong> (9.53), l’équation (9.52) <strong>de</strong>vient :<br />
d2u dϕ2 + u = (γ + 1)u2p = (γ + 1) m2<br />
r2 . (9.58)<br />
p<br />
La solution <strong>de</strong> cette équation satisfaisant aux conditions (9.49) est<br />
ce qui est équivalent à<br />
u = up {[1 − (γ + 1)up] cos ϕ + (γ + 1)up} , (9.59)<br />
r =<br />
rp<br />
. (9.60)<br />
[1 − (γ + 1)up] cos ϕ + (γ + 1)up<br />
103
δ/2 ^<br />
O P<br />
δ/2<br />
^<br />
Fig. 9.2 – Déviation d’un rayon lumineux par une masse centrale.<br />
L’équation (9.60) est l’équation polaire d’une branche d’hyperbole <strong>de</strong> paramètre p et d’excentricité<br />
e donnés par<br />
p =<br />
r 2 p<br />
(γ + 1)m = rp(e + 1), e =<br />
rp<br />
− 1.<br />
(γ + 1)m<br />
La déviation totale du rayon entre −∞ et ∞ est l’angle δ que forment les <strong>de</strong>ux asymptotes.<br />
Soit ϕ∞ la limite <strong>de</strong> l’angle ϕ lorsque r → ∞, i.e. u → 0. On a <strong>de</strong> façon évi<strong>de</strong>nte<br />
L’équation (9.59) donne donc pour δ/2<br />
up<br />
<br />
[1 − (γ + 1)up] cos<br />
Or, l’angle δ étant petit, on a l’approximation<br />
ϕ∞ = π<br />
2 +<br />
δ<br />
. (9.61)<br />
2<br />
<br />
π<br />
cos<br />
2 +<br />
<br />
δ δ<br />
≈ − sin<br />
2 2<br />
La substitution <strong>de</strong> (9.63) dans (9.62) montre immédiatement que<br />
<br />
π<br />
2 +<br />
<br />
δ<br />
+ (γ + 1)up = 0. (9.62)<br />
2<br />
δ<br />
≈ − . (9.63)<br />
2<br />
δ = 2(γ + 1) m<br />
+ O(ǫ 2 ), (9.64)<br />
rp<br />
104
soit<br />
Si γ = 1, on a<br />
δ = 2(γ + 1) GM<br />
c 2 rp<br />
+ O(4). (9.65)<br />
δ = 1, 75”. (9.66)<br />
pour un rayon lumineux frôlant le Soleil.<br />
La première observation <strong>de</strong> cet effet fut effectuée par Eddington lors <strong>de</strong> l’éclipse totale <strong>de</strong><br />
Soleil <strong>de</strong> 1919 et joua un grand rôle dans l’histoire <strong>de</strong> la théorie <strong>de</strong> la relativité générale, en dépit<br />
d’erreurs systématiques <strong>de</strong> l’ordre <strong>de</strong> 30% sur l’effet à mesurer. Ultérieurement, <strong>de</strong>s mesures <strong>de</strong><br />
déviation d’on<strong>de</strong>s émises par <strong>de</strong>s radio-sources et passant près du Soleil ont permis d’améliorer<br />
les estimations <strong>de</strong> γ. Ainsi, par exemple, Fomalont et Sramec ont-ils trouvé en 1976 grâce à<br />
une technique interférométrique 6<br />
γ = 1, 014 ± 0, 018. (9.67)<br />
Toutefois, l’exactitu<strong>de</strong> <strong>de</strong> ces mesures “historiques” est restée limitée, en raison principalement<br />
d’effets difficilement modélisables dus à la couronne solaire. Heureusement, les mesures <strong>de</strong><br />
type interférométriques (V.L.B.I.) se sont diversifiées et considérablement raffinées 7 et surtout,<br />
on a pu effectuer <strong>de</strong>s déterminations <strong>de</strong> γ extrêmement précises à partir <strong>de</strong> mesures radar entre<br />
la Terre et une planète ou une son<strong>de</strong>, et tout récemment par effet Doppler sur les liens radio<br />
avec la son<strong>de</strong> Cassini, comme nous l’avons signalé dans la section 9.1.<br />
9.4 Avance séculaire du périhélie d’une planète<br />
Pour étudier le mouvement du périhélie d’une planète, nous supposons ici que la planète<br />
est assimilable à une particule d’épreuve, ce qui revient à négliger l’influence <strong>de</strong> sa structure<br />
interne sur son mouvement. En outre, nous négligeons l’influence <strong>de</strong>s autres planètes et nous<br />
supposons que le Soleil est un corps isolé dans l’univers, engendrant un champ gravitationnel à<br />
symétrie sphérique statique. La ligne d’univers <strong>de</strong> la planète est alors une géodésique du genre<br />
temps <strong>de</strong> la métrique.<br />
Du fait que l’on peut choisir l’abscisse curviligne s comme paramètre affine sur toute<br />
géodésique du genre temps, nous posons<br />
K = 1<br />
dans les équations <strong>de</strong>s géodésiques, <strong>de</strong> sorte que (9.44) et (9.47) s’écrivent respectivement<br />
et<br />
2 du<br />
=<br />
dϕ<br />
m2E2 L2 B(u)<br />
A(u)<br />
d2u 1 m<br />
+ u =<br />
dϕ2 2<br />
2E2 L2 d<br />
du<br />
m2<br />
− B(u) − u2<br />
L2 <br />
B(u)<br />
A(u)<br />
(9.68)<br />
− 1 m<br />
2<br />
2<br />
L2 dB(u)<br />
. (9.69)<br />
du<br />
6 Voir E. B. Fomalont & R. A. Sramek, Physical Review Letters, vol. 36, p. 1475 (1976).<br />
7 Voir D. E. Lebach et al., Physical Review Letters, vol. 75, p.1439 (1995).<br />
105
Dans ce qui suit, nous supposons que l’orbite est quasi elliptique (fig. 9.3). Au cours du<br />
mouvement, la variable r va donc passer <strong>de</strong> sa valeur rp au périhélie à sa valeur ra à l’aphélie<br />
et on peut définir le <strong>de</strong>mi-grand axe a et l’excentricité e en posant :<br />
rp = a(1 − e), ra = a(1 + e). (9.70)<br />
En outre, nous imposons ϕ = 0 pour l’un <strong>de</strong>s périhélies, considéré comme périhélie <strong>de</strong><br />
référence. Nous appelons ϕa l’angle <strong>de</strong> l’aphélie qui succè<strong>de</strong> au périhélie <strong>de</strong> référence.<br />
La solution <strong>de</strong> (9.68) décrivant cette orbite doit satisfaire aux conditions aux limites suivantes<br />
:<br />
<br />
du<br />
= 0, up ≡ u|ϕ=0 = m<br />
; (9.71)<br />
dϕ<br />
<br />
du<br />
dϕ<br />
ϕ=0<br />
ϕ=ϕa<br />
= 0, ua ≡ u|ϕ=ϕaph<br />
rp<br />
m<br />
= . (9.72)<br />
ra<br />
Compte tenu <strong>de</strong> l’équation du mouvement (9.68), ces conditions aux limites s’écrivent :<br />
m2E2 Bp<br />
L 2<br />
Ap<br />
m2E2 Ba<br />
où Ap, Bp sont définis par (9.51), et Aa,Ba sont définies par<br />
L 2<br />
Aa<br />
− m2<br />
L 2 Bp − u 2 p = 0, (9.73)<br />
− m2<br />
L 2 Ba − u 2 a = 0, (9.74)<br />
Aa = A(ua), Ba = B(ua). (9.75)<br />
Les équations (9.51) et (9.75) constituent un système <strong>de</strong> <strong>de</strong>ux équations linéaires satisfaites<br />
par les <strong>de</strong>ux inconnues m 2 E 2 /L 2 et m 2 /L 2 . La résolution <strong>de</strong> ce système est aisée. Il vient :<br />
et<br />
m 2 E 2<br />
m2 =<br />
L2 ApAa<br />
=<br />
L2 Aa − Ap<br />
u 2 p<br />
Bp<br />
− u2 a<br />
Ba<br />
<br />
<br />
1 Ap<br />
u<br />
Aa − Ap Bp<br />
2 p − Aa<br />
u<br />
Ba<br />
2 <br />
a<br />
(9.76)<br />
. (9.77)<br />
Toutes les équations données jusqu’ici dans cette section sont rigoureuses et peuvent être<br />
appliquées dans n’importe quelle théorie métrique. Nous allons maintenant remplacer Ap, Bp,<br />
Aa et Ba par leurs développements postnewtoniens respectifs obtenus à partir <strong>de</strong><br />
A(u) = 1 − 2mu + 2βu 2 + · · · , B(u) = 1 + 2γu + · · · (9.78)<br />
Pour définir l’ordre <strong>de</strong> gran<strong>de</strong>ur <strong>de</strong>s différentes quantités intervenant dans notre problème,<br />
nous pouvons nous servir du paramètre up comme nous l’avons fait pour la lumière ou encore<br />
poser pour plus <strong>de</strong> commodité<br />
ǫ = m<br />
. (9.79)<br />
L’approximation du premier ordre par rapport à ǫ correspond à l’approximation newtonienne.<br />
Il faudra donc développer le second membre <strong>de</strong> (9.69) jusqu’au second ordre en ǫ. En<br />
a<br />
106
conséquence, il faut former le développement <strong>de</strong>s constantes du mouvement m 2 E 2 /L 2 et m 2 /L 2<br />
à l’ordre ǫ 2 . Un calcul <strong>de</strong> développements limités donne 8 :<br />
et<br />
m2 =<br />
L2 m 2 E 2<br />
=<br />
L2 m<br />
a(1 − e 2 ) +<br />
m<br />
a(1 − e 2 ) +<br />
m2 a2 (1 − e2 <br />
2[β − 2(γ + 1)](1 − e<br />
)<br />
2 ) + γ <br />
+ O(ǫ 3 ) (9.80)<br />
m2 a2 (1 − e2 <br />
2[β − 2(γ + 1)](1 − e<br />
)<br />
2 ) + γ + 1 <br />
+ O(ǫ 3 ). (9.81)<br />
La comparaison <strong>de</strong> (9.80) et (9.81) montre immédiatement que<br />
m2 L2 = m2E2 m<br />
+<br />
L2 2<br />
a2 (1 − e2 ) + O(ǫ3 ). (9.82)<br />
Substituons (9.82) dans (9.69). Nous obtenons l’équation du mouvement :<br />
d2u 1<br />
+ u =<br />
dϕ2 2<br />
m 2 E 2<br />
L 2<br />
d<br />
du<br />
<br />
B(u)<br />
−<br />
A(u)<br />
dB(u)<br />
<br />
du<br />
− 1<br />
2<br />
m 2<br />
a 2 (1 − e 2 )<br />
dB(u)<br />
du + O(ǫ3 ) (9.83)<br />
où la constante m 2 E 2 /L 2 doit être remplacée par son expression approchée (9.80). Cette<br />
constante étant du premier ordre en ǫ, il suffit <strong>de</strong> retenir le développement du premier ordre<br />
pour l’expression entre accola<strong>de</strong>s dans le second membre <strong>de</strong> (9.83). On a :<br />
soit<br />
D’où<br />
d<br />
du<br />
B(u)<br />
A(u) − B(u) = 2u + 2[2(γ + 1) − β]u2 + O(u 3 ).<br />
<br />
B(u)<br />
−<br />
A(u)<br />
dB(u)<br />
du = 2 + 4[2(γ + 1) − β]u + O(u2 ). (9.84)<br />
Pour terminer le calcul du second membre <strong>de</strong> (9.83), il suffit <strong>de</strong> noter que<br />
1<br />
2<br />
m 2<br />
a 2 (1 − e 2 )<br />
dB(u)<br />
du<br />
Substituons (9.84) et (9.85) dans (9.83). Il vient :<br />
d 2 u<br />
dϕ2 + u = m2E2 L<br />
= γ m2<br />
a 2 (1 − e 2 ) + O(ǫ3 ). (9.85)<br />
2 {1 + 2[2(γ + 1) − β]u} − γ m2<br />
a 2 (1 − e 2 ) + O(ǫ3 ),<br />
d2 <br />
u<br />
+ 1 − 2<br />
dϕ2 m2E2 L2 <br />
[2(γ + 1) − β] u = m2E2 m2<br />
− γ<br />
L2 a2 (1 − e2 . (9.86)<br />
)<br />
Dans le premier membre <strong>de</strong> (9.86), la constante m 2 E 2 /L 2 peut être remplacée par son<br />
expression approchée du premier ordre<br />
m 2 E 2<br />
=<br />
L2 8 On déduit aisément <strong>de</strong> ces formules que E 2 = 1 − m<br />
a + O(ǫ2 ) .<br />
m<br />
a(1 − e 2 ) + O(ǫ2 ). (9.87)<br />
107
Le second membre <strong>de</strong> (9.86) est quant à lui donné par<br />
m 2 E 2<br />
m2<br />
− γ<br />
L2 a2 (1 − e2 ) =<br />
m<br />
a(1 − e2 <br />
1 −<br />
)<br />
6m<br />
a(1 − e 2 )<br />
<br />
2(γ + 1) − β<br />
3<br />
(9.88)<br />
Substituons (9.87) et (9.88) dans (9.86). Nous obtenons finalement l’équation du mouvement<br />
approchée<br />
d2 <br />
u 6m<br />
+ 1 −<br />
dϕ2 a(1 − e2 <br />
2(γ + 1) − β m<br />
u =<br />
) 3 a(1 − e2 <br />
6m<br />
1 −<br />
) a(1 − e2 <br />
2(γ + 1) − β<br />
. (9.89)<br />
) 3<br />
Cette équation différentielle est <strong>de</strong> la forme u ′′ + ω 2 u = const., qu’il est facile d’intégrer. La<br />
solution <strong>de</strong> (9.89) correspondant à un périhélie atteint en ϕ = 0 est<br />
où ω est la constante définie par<br />
ω =<br />
u =<br />
m<br />
a(1 − e2 (1 + e cos ωϕ), (9.90)<br />
)<br />
<br />
<br />
<br />
6m<br />
1 −<br />
a(1 − e2 2(γ + 1) − β<br />
) 3<br />
≈ 1 −<br />
3m<br />
a(1 − e2 2(γ + 1) − β<br />
. (9.91)<br />
) 3<br />
Du fait que u = m/r, on déduit immédiatement <strong>de</strong> (9.90) qu’à l’approximation 1PN, l’orbite<br />
relativiste d’une planète autour du Soleil est décrite en coordonnées polaires (r,ϕ) par l’équation<br />
où ω est donné par (9.91) que l’on peut encore écrire<br />
r = a(1 − e2 )<br />
, (9.92)<br />
1 + e cos ωϕ<br />
ω = 1 − 3GM<br />
c2a(1 − e2 2(γ + 1) − β<br />
. (9.93)<br />
) 3<br />
Les expressions (9.92) et (9.93) sont correctes à <strong>de</strong>s termes d’ordre ε 2 près. On notera que<br />
l’orbite képlérienne prévue par la théorie newtonienne serait obtenue en posant ω = 1 dans<br />
(9.92) (on a alors l’équation d’une ellipse <strong>de</strong> foyer O, <strong>de</strong> <strong>de</strong>mi-grand axe a et d’excentricité e.)<br />
L’équation polaire (9.92) permet <strong>de</strong> déduire très facilement l’avance ∆ϕper du périhélie par<br />
révolution. En effet, ∆ϕper est défini par<br />
soit<br />
ω(2π + ∆ϕper) = 2π ,<br />
<br />
1<br />
∆ϕper = 2π − 1 . (9.94)<br />
ω<br />
En substituant (9.93) dans (9.94), il vient à <strong>de</strong>s termes d’ordre 1/c4 près<br />
∆ϕper = 6πGM<br />
c2a(1 − e2 2(γ + 1) − β<br />
) 3<br />
108<br />
rad/révolution. (9.95)
A<br />
Pour la planète Mercure, on a<br />
1<br />
A<br />
2<br />
O<br />
Fig. 9.3 – Avance séculaire du péricentre.<br />
6πGM⊙<br />
c 2 a(1 − e 2 )<br />
P<br />
3<br />
P<br />
2<br />
A<br />
P<br />
3<br />
1<br />
= 42, 98 ”/siècle . (9.96)<br />
Par ailleurs, l’avance séculaire résiduelle du périhélie <strong>de</strong> Mercure déduite <strong>de</strong>s observations<br />
est très voisine <strong>de</strong> 43 ”/siècle. Citons par exemple <strong>de</strong>ux résultats récents obtenus à partir <strong>de</strong><br />
<strong>de</strong>ux systèmes d’éphéméri<strong>de</strong>s, DE 405 et EPM 2000 :<br />
(∆ϕper) obs = 43, 004 ± 0, 002 ”/siècle (DE 405)<br />
= 43, 0115 ± 0, 0085 ”/siècle (EPM 2000) . (9.97)<br />
La comparaison <strong>de</strong> (9.95) et (9.96) montre que le rapport (2(γ + 1) − β)/3 prédit doit être<br />
très voisin <strong>de</strong> 1 pour que la théorie métrique soit acceptable. Il faut néanmoins tenir compte du<br />
moment quadrupolaire J2 du Soleil pour avoir une contrainte fiable sur la combinaison 2(γ +<br />
1)−β. Un calcul plus complet que celui que nous avons fait ci-<strong>de</strong>ssus montre que le déplacement<br />
du périhélie d’une planète ayant une orbite d’inclinaison i est donné par l’expression 9<br />
∆ϕper = 6πGM⊙<br />
c 2 a(1 − e 2 )<br />
2(γ + 1) − β<br />
3<br />
−<br />
R2 ⊙<br />
2ma(1 − e2 ) J2(3 sin 2 <br />
i − 1)<br />
rad/révolution, (9.98)<br />
où R⊙ est le rayon équatorial du Soleil. Pour Mercure, la prédiction théorique est alors donnée<br />
par<br />
<br />
2(γ + 1) − β<br />
∆ϕper = 42, 98 + 3 × 10<br />
3<br />
−4<br />
<br />
J2<br />
10−7 ”/siècle . (9.99)<br />
9 Voir par ex. S. Pireaux, J.-P. Rozelot & S. Godier, Astrophys. Space Sci., vol. 284, pp. 1159-1194 (2003).<br />
109
Il est malheureusement difficile <strong>de</strong> donner un intervalle <strong>de</strong> valeurs acceptables très serré<br />
pour la quantité [2(γ +1) −β]/3 car on ne connaît pas bien la valeur du moment quadrupolaire<br />
J2 du Soleil 10 . Il est cependant admis qu’on peut poser<br />
9.5 Que faire pour aller plus loin?<br />
<br />
<br />
1<br />
<br />
<br />
[2(γ + 1) − β] − 1<br />
≤ 0, 001. (9.100)<br />
3<br />
Ce chapitre a montré que l’hypothèse selon laquelle la gravitation est une manifestation <strong>de</strong><br />
la courbure d’une métrique conduit à prédire un certain nombre d’effets qui sont effectivement<br />
observés. Le schéma “phénoménologique” contenant <strong>de</strong>ux paramètre postnewtoniens β et γ<br />
proposé par Eddington permet <strong>de</strong> tester cette hypothèse avant même d’avoir formulé une théorie<br />
complète.<br />
Nous avons vu que les valeurs “simples” γ = 1 et β = 1 sont compatibles avec les mesures<br />
effectuées dans le système solaire. Nous pourrons donc considérer ces valeurs comme<br />
<strong>de</strong>s valeurs “standard”, sans oublier toutefois qu’aucune observation ne peut évi<strong>de</strong>mment les<br />
imposer <strong>de</strong> manière formelle. Il convient donc <strong>de</strong> gar<strong>de</strong>r à l’esprit qu’une classe étendue <strong>de</strong><br />
théories métriques va s’avérer envisageable, d’autant que nous n’avons pas étudié tous les tests<br />
présentement disponibles.<br />
Il est toutefois clair que nous ne pouvons nous contenter d’un tel schéma phénoménologique,<br />
et ce pour plusieurs raisons.<br />
1. Il est évi<strong>de</strong>mment simpliste <strong>de</strong> supposer qu’une planète comme Mercure par exemple est<br />
une particule ponctuelle <strong>de</strong> masse négligeable gravitant dans un champ à symétrie sphérique<br />
invariable au cours du temps. Mercure est un corps étendu ayant un champ gravitationnel propre<br />
en interaction non seulement avec le Soleil mais aussi avec tous les autres objets du système<br />
solaire, eux-mêmes en interaction avec le reste <strong>de</strong> l’Univers. En fait, le champ gravitationnel<br />
du système solaire est un champ dynamique, créé par <strong>de</strong>s corps étendus qui se déforment sans<br />
cesse en raison <strong>de</strong> leurs mouvements et <strong>de</strong> leurs interactions mutuelles.<br />
2. On sait <strong>de</strong>puis longtemps qu’il existe <strong>de</strong> nombreux sites astrophysiques dans lesquels le<br />
champ <strong>de</strong> gravitation ne peut être considéré comme faible (étoiles à neutrons, pulsars binaires,<br />
noyaux <strong>de</strong>s galaxies, etc.).<br />
3. Nous avons déjà souligné que la relativité restreinte “prédisposait” à considérer l’interaction<br />
gravitationnelle comme <strong>de</strong>vant se propager par on<strong>de</strong>s se déplaçant avec la vitesse c.<br />
4. Enfin, bien que nous ne puissions insister ici, la théorie <strong>de</strong> Newton dans sa formulation<br />
usuelle soulève beaucoup <strong>de</strong> difficultés quand on veut formuler les problèmes cosmologiques <strong>de</strong><br />
manière vraiment cohérente.<br />
Il est donc maintenant impératif <strong>de</strong> chercher une théorie ou une classe <strong>de</strong> théories qui<br />
apportent <strong>de</strong>s réponses précises aux quatre types <strong>de</strong> problèmes que nous venons d’évoquer et<br />
qui prédisent <strong>de</strong>s valeurs <strong>de</strong> β et γ suffisamment proches <strong>de</strong> 1 pour être en bon accord avec les<br />
observations.<br />
10 La plupart <strong>de</strong>s modèles du Soleil conduisent à <strong>de</strong>s valeurs est <strong>de</strong> l’ordre <strong>de</strong> quelques 10 −7 pour J2. On prend<br />
souvent J2 = (2 ± 0,4) × 10 −7 .<br />
110
Nous allons voir dans le chapitre suivant qu’il existe une théorie qui 1) décrit entièrement<br />
le champ <strong>de</strong> gravitation par une métrique, 2) prédit exactement γ = 1 et β = 1, 3) n’est en<br />
contradiction avec aucun autre test actuel. Cette théorie est la relativité générale 11 .<br />
11 L’affirmation que la relativité générale n’est contredite par aucun test ne signifie pas que cette théorie ne<br />
rencontre aucune difficulté. C’est ainsi que l’anomalie Pioneer n’a pas reçu d’interprêtation faisant consensus,<br />
et que la cosmologie dresse plusieurs défis. Mais aucun <strong>de</strong> ces problèmes ne peut être pour le moment considéré<br />
comme un test.<br />
111
Chapitre 10<br />
La relativité générale<br />
Dans le chapitre 7, nous avons formulé un cadre général définissant ce qu’on appelle les<br />
théories métriques <strong>de</strong> la gravitation. Nous avons souligné que la <strong>de</strong>scription complète du champ<br />
<strong>de</strong> gravitation ne se réduisait pas nécessairement à une métrique lorentzienne. Il existe cependant<br />
une théorie dans laquelle le champ <strong>de</strong> gravitation est entièrement décrit par la métrique et<br />
qui est en bon accord avec l’expérience et avec la quasi totalité <strong>de</strong>s observations, c’est la relativité<br />
générale, certainement la plus élégante <strong>de</strong> toutes les théories ayant survécu aux différents<br />
tests que l’on a pu mener jusqu’ici. Nous exposons brièvement la démarche qui conduit aux<br />
équations d’Einstein, puis nous montrons comment on détermine la métrique <strong>de</strong> Schwarzschild<br />
et quelques unes <strong>de</strong> ses conséquences astronomiques.<br />
10.1 Les équations d’Einstein<br />
Pour construire une théorie purement métrique <strong>de</strong> la gravitation, il faut formuler <strong>de</strong>s<br />
équations <strong>de</strong> champ gouvernant les composantes gµν <strong>de</strong> la métrique. Nous allons nous laisser<br />
gui<strong>de</strong>r par la théorie newtonienne <strong>de</strong> la gravitation.<br />
Nous avons rappelé dans le chapitre 7 que le potentiel newtonien U d’une distribution <strong>de</strong><br />
matière <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> masse inertielle ρ(x,t) vérifie l’équation <strong>de</strong> Laplace<br />
à l’extérieur <strong>de</strong> la matière, et vérifie l’équation <strong>de</strong> Poisson<br />
∆2U = 0 (10.1)<br />
∆2U = −4πGρ(x,t) (10.2)<br />
à l’intérieur <strong>de</strong>s masses, ∆2U étant l’opérateur laplacien défini par<br />
∆2U = ∂2 U<br />
(∂x 1 ) 2 + ∂2 U<br />
(∂x 2 ) 2 + ∂2 U<br />
(∂x 3 ) 2 = δij ∂iU∂jU , (10.3)<br />
où les coordonnées x i sont <strong>de</strong>s coordonnées cartésiennes orthonormées.<br />
Les équations aux dérivées partielles (10.1) et (10.2) sont du second ordre. Nous allons donc<br />
postuler que les équations satisfaites par la métrique sont aussi du second ordre.<br />
112
Du fait qu’il y a dix gµν indépendants 1 , il faut un système <strong>de</strong> dix équations aux dérivées<br />
partielles. Gouvernant un tenseur, ces équations doivent elles-mêmes être <strong>de</strong>s égalités <strong>de</strong> tenseurs.<br />
Ces tenseurs doivent être <strong>de</strong>ux fois contravariants (ou <strong>de</strong>ux fois covariants) et symétriques<br />
afin d’obtenir les dix relations souhaitées. Il est donc légitime <strong>de</strong> supposer que les équations<br />
cherchées sont <strong>de</strong> la forme<br />
S µν (g,∂g,∂ 2 g) = κT µν , (10.4)<br />
où S µν (g,∂g,∂ 2 g) est un tenseur construit uniquement avec les gµν, leurs dérivées premières et<br />
leurs dérivées secon<strong>de</strong>s, κ est une constante <strong>de</strong> couplage et T µν est un tenseur qui décrit les<br />
sources du champ gravitationnel.<br />
En observant le second membre <strong>de</strong> l’équation <strong>de</strong> Poisson (10.2), on pourrait penser que T µν<br />
doit être construit à partir <strong>de</strong> la <strong>de</strong>nsité <strong>de</strong> masse inertielle <strong>de</strong> la matière. Mais nous avons<br />
vu dans la section 7.2 qu’il y a <strong>de</strong> bonnes raisons d’admettre que non seulement la matière<br />
constituée d’atomes ou <strong>de</strong> particules, mais également toutes les autres formes d’énergie sont <strong>de</strong>s<br />
sources du champ <strong>de</strong> gravitation. En particulier, une distribution d’énergie électromagnétique<br />
telle qu’un faisceau lumineux par exemple doit créer un champ <strong>de</strong> gravitation.<br />
La relativité restreinte établit aussi que l’énergie divisée par c et la quantité <strong>de</strong> mouvement<br />
(ou impulsion) d’une particule constituent les composantes d’un quadrivecteur appelé<br />
le quadrivecteur impulsion-énergie. On peut montrer qu’on peut définir un quadrivecteur <strong>de</strong>nsité<br />
d’impulsion-énergie pour un champ quelconque (champ scalaire, champ électromagnétique,<br />
etc.). Il est donc naturel <strong>de</strong> penser que les composantes <strong>de</strong> l’impulsion <strong>de</strong> la matière et <strong>de</strong>s<br />
autres distributions d’énergie doivent aussi contribuer au champ <strong>de</strong> gravitation.<br />
Les raisons énumérées ci-<strong>de</strong>ssus conduisent à postuler que T µν doit être l’extension à un<br />
espace-temps muni d’une métrique douée <strong>de</strong> courbure <strong>de</strong> ce qu’on appelle un tenseur impulsionénergie<br />
en relativité restreinte. Nous nous contenterons d’indiquer ici que pour un flui<strong>de</strong> parfait 2<br />
<strong>de</strong> <strong>de</strong>nsité propre 3 d’énergie µc 2 et <strong>de</strong> pression p, le tenseur impulsion-énergie est <strong>de</strong> la forme<br />
où u µ est le quadrivecteur vitesse unitaire du flui<strong>de</strong> défini par<br />
T µν = (µc 2 + p)u µ u ν − pg µν , (10.5)<br />
u µ = dxµ<br />
ds<br />
, (10.6)<br />
les dérivées dx µ étant prises le long <strong>de</strong> la ligne d’univers <strong>de</strong> chaque particule du flui<strong>de</strong>. On<br />
notera que le vecteur u µ est tangent à la ligne d’univers d’une particule du flui<strong>de</strong>. En outre, u µ<br />
est unitaire car on a<br />
gµνu µ u ν dx<br />
= gµν<br />
µ dx<br />
ds<br />
ν<br />
ds = gµνdx µ dxν ds2 = ds2<br />
= 1. (10.7)<br />
ds2 Dans certains cas, on peut au moins en première approximation négliger la pression du<br />
flui<strong>de</strong>. Le tenseur impulsion-énergie (10.5) se réduit alors à<br />
T µν = µc 2 u µ u ν . (10.8)<br />
1 Ne pas oublier que les gµν sont symétriques.<br />
2 Un flui<strong>de</strong> est dit parfait lorsqu’on peut négliger les forces <strong>de</strong> frottement internes (viscosité) et les échanges<br />
<strong>de</strong> chaleur entre ses différentes parties. Le mouvement d’un flui<strong>de</strong> parfait est donc adiabatique.<br />
3 Par définition, la <strong>de</strong>nsité propre d’une quantité est la valeur <strong>de</strong> cette quantité par unité <strong>de</strong> volume dans le<br />
référentiel comouvant avec le flui<strong>de</strong>.<br />
113
On dit que (10.8) décrit un schéma matière pure ou incohérente.<br />
On peut aussi construire <strong>de</strong>s tenseurs impulsion-énergie décrivant un flui<strong>de</strong> avec courant<br />
d’entropie, un plasma, un champ électromagnétique, un champ scalaire, etc.<br />
On postule enfin que les dix composantes du tenseur impulsion-énergie figurant dans le<br />
second membre <strong>de</strong> (10.4) doivent satisfaire les quatre équations suivantes :<br />
∇µT µν = 0, (10.9)<br />
qui sont appelées équations <strong>de</strong> conservation. Ces quatre équations qu’il faut ajouter aux dix<br />
équations du champ (10.4) sont les équations du mouvement <strong>de</strong>s sources du champ <strong>de</strong> gravitation.<br />
Pour être compatible avec les équations <strong>de</strong> conservation (10.9), le tenseur S µν doit satisfaire<br />
les quatre équations<br />
∇µS µν = 0 (10.10)<br />
quelle que soit la métrique g, que cette métrique soit solution <strong>de</strong>s équations du champ (10.4)<br />
ou non. Autrement dit, les équations (10.10) doivent être <strong>de</strong>s i<strong>de</strong>ntités. Or, on démontre que<br />
les tenseurs S µν symétriques que l’on peut construire uniquement avec gµν, ∂αgλρ et ∂α∂βgστ et<br />
qui vérifient les i<strong>de</strong>ntités (10.10) sont nécessairement <strong>de</strong> la forme<br />
S µν = G µν − Λg µν , (10.11)<br />
où G µν est le tenseur d’Einstein défini par l’équation (C.68) <strong>de</strong> l’annexe C et Λ est une constante<br />
arbitraire. Rappelons que l’expression du tenseur d’Einstein est donnée par la formule<br />
où<br />
et<br />
G µν = R µν − 1<br />
2 Rgµν , (10.12)<br />
R µν = g µα g νβ Rαβ<br />
(10.13)<br />
R = g αβ Rαβ, (10.14)<br />
les quantités Rαβ étant les composantes covariantes du tenseur <strong>de</strong> Ricci explicitées par les<br />
équations (C.65) <strong>de</strong> l’annexe C.<br />
Les hypothèses faites ci-<strong>de</strong>ssus nous amènent donc au postulat fondamental suivant, énonçant<br />
les célèbres équations d’Einstein.<br />
Postulat 10.1.1 (Équations d’Einstein)<br />
a) Dans les régions <strong>de</strong> l’espace-temps balayées par une distribution <strong>de</strong> matière ou d’énergie<br />
décrite par un tenseur impulsion-énergie T µν , les potentiels <strong>de</strong> gravitation gµν sont solutions<br />
<strong>de</strong>s équations dites du cas intérieur<br />
G µν ≡ R µν − 1<br />
2 Rgµν = κT µν + Λg µν . (10.15)<br />
b) Dans les régions ne contenant aucune distribution <strong>de</strong> matière ou d’énergie, les potentiels<br />
<strong>de</strong> gravitation sont solutions <strong>de</strong>s équations dites du cas extérieur<br />
G µν ≡ R µν − 1<br />
2 Rgµν = Λg µν . (10.16)<br />
114
Dans les équations (10.15) et (10.16), κ est une constante <strong>de</strong> couplage gravitationnel définie<br />
par<br />
κ = 8πG<br />
c4 (10.17)<br />
et Λ est une constante appelée constante cosmologique.<br />
La formule (10.17) donnant la valeur <strong>de</strong> la constante <strong>de</strong> couplage κ est déterminée par la<br />
nécessité <strong>de</strong> retrouver la loi <strong>de</strong> gravitation newtonienne à l’approximation <strong>de</strong>s champs faibles.<br />
En revanche, la constante cosmologique Λ n’est actuellement reliée à aucune autre constante<br />
<strong>de</strong> la physique. La seule certitu<strong>de</strong> est que sa valeur est extrêmement faible et la rend <strong>de</strong> ce fait<br />
négligeable en <strong>de</strong>hors du contexte cosmologique. Son existence paraît liée à ce qu’on appelle<br />
l’énergie du vi<strong>de</strong> telle que la conçoit la théorie quantique <strong>de</strong>s champs, mais le problème majeur<br />
est que la valeur <strong>de</strong> Λ <strong>de</strong>vrait être énorme, au lieu d’être très faible. L’existence et la valeur<br />
phénoménologique <strong>de</strong> Λ constituent l’une <strong>de</strong>s gran<strong>de</strong>s énigmes <strong>de</strong> la physique théorique et <strong>de</strong> la<br />
cosmologie contemporaines (nature <strong>de</strong> énergie noire provoquant l’accélération <strong>de</strong> l’expansion).<br />
En notant que g µρ gµν = δ ρ ν entraîne g µν gµν = 4, on voit facilement que les équations d’Einstein<br />
peuvent encore s’écrire comme l’indique la proposition ci-<strong>de</strong>ssous.<br />
Proposition 10.1.1<br />
a) Dans le cas intérieur, les équations d’Einstein (10.15) sont équivalentes à<br />
R µν <br />
= κ T µν − 1<br />
2 Tgµν<br />
<br />
− Λg µν<br />
b) Dans le cas extérieur, les équations (10.16) sont équivalentes à<br />
(10.18)<br />
R µν = −Λg µν . (10.19)<br />
Les dix équations d’Einstein ne permettent pas à elles seules <strong>de</strong> résoudre un problème <strong>de</strong><br />
gravitation. Il faut impérativement leur ajouter les quatre équations du mouvement (10.9),<br />
qui peuvent être considérées comme <strong>de</strong>s conditions d’intégrabilité. Mais cette adjonction n’est<br />
elle-même pas suffisante. Il faut également écrire les relations entre les variables <strong>de</strong> champ<br />
définissant les sources (par ex. une équation d’état µ = f(p) pour un flui<strong>de</strong> parfait), ainsi que<br />
l’ensemble <strong>de</strong>s conditions aux limites nécessaires pour qu’une métrique solution <strong>de</strong>s équations<br />
d’Einstein ait un sens physique.<br />
10.2 La métrique <strong>de</strong> Schwarzschild extérieure<br />
Nous allons chercher les solutions <strong>de</strong>s équations d’Einstein à l’extérieur d’un corps massif<br />
à symétrie sphérique. Nous supposons que les solutions sont statiques, i.e. indépendantes du<br />
temps. En outre, nous négligeons la constante cosmologique. Enfin, nous supposons que la<br />
métrique tend à coïnci<strong>de</strong>r avec la métrique <strong>de</strong> Minkowski lorsqu’on s’éloigne indéfiniment du<br />
corps central. On dit que la métrique doit être asymptotiquement plate à l’infini spatial.<br />
115
Il est commo<strong>de</strong> d’exprimer la métrique dans un système <strong>de</strong> coordonnées locales sphériques<br />
(ρ,θ,ϕ). On peut montrer par <strong>de</strong>s arguments <strong>de</strong> symétrie que ces coordonnées peuvent toujours<br />
être choisies <strong>de</strong> telle sorte que la métrique ne contienne que <strong>de</strong>ux potentiels inconnus et s’écrive<br />
sous la forme<br />
ds 2 = e ν(ρ) (dx 0 ) 2 − e λ(ρ) dρ 2 − ρ 2 (dθ 2 + sin 2 θdϕ 2 ). (10.20)<br />
En un point infiniment éloigné <strong>de</strong> la source du champ, la métrique (10.20) doit coïnci<strong>de</strong>r<br />
avec la métrique <strong>de</strong> Minkowski écrite en coordonnées sphériques usuelles, c’est-à-dire :<br />
ds 2 = (dx 0 ) 2 − dρ 2 − ρ 2 (dθ 2 + sin 2 θdϕ 2 ). (10.21)<br />
Cette condition se traduit par les conditions aux limites<br />
lim ν(ρ) = 0, lim λ(ρ) = 0. (10.22)<br />
ρ→∞ ρ→∞<br />
Le calcul <strong>de</strong>s composantes contravariantes du tenseur d’Einstein correspondant à la métrique<br />
(10.20) s’effectue à partir <strong>de</strong>s expressions explicites <strong>de</strong> R µν et <strong>de</strong> R fournies par les équations<br />
(10.13) et (10.14) du présent chapitre et par les équations (C.65) <strong>de</strong> l’annexe C. Un calcul assez<br />
long mais sans difficulté particulière montre que les seules composantes contravariantes du<br />
tenseur d’Einstein correspondant à la métrique (10.20) non i<strong>de</strong>ntiquement nulles sont données<br />
par :<br />
G 00 = e−ν(ρ)<br />
ρ 2<br />
G 11 = e−λ(ρ)<br />
ρ 2<br />
G 22 = e−λ(ρ)<br />
ρ 2<br />
<br />
1 − e −λ(ρ) (1 − ρλ ′ ) <br />
, (10.23)<br />
<br />
e −λ(ρ) (1 + ρν ′ ) − 1 <br />
, (10.24)<br />
ν ′ − λ ′<br />
2ρ<br />
ν′′<br />
+<br />
2 + ν′ − λ ′<br />
2<br />
ν ′<br />
<br />
, (10.25)<br />
2<br />
G 33 ≡ 1<br />
sin 2 θ G22 , (10.26)<br />
où f ′ désigne la dérivée d’une fonction f(ρ) par rapport à ρ.<br />
Compte tenu <strong>de</strong> (10.23)-(10.26), le système <strong>de</strong>s équations d’Einstein du vi<strong>de</strong> (G µν = 0) se<br />
réduit aux trois équations suivantes :<br />
1 − e −λ(ρ) (1 − ρλ ′ ) = 0, (10.27)<br />
e −λ(ρ) (1 + ρν ′ ) − 1 = 0, (10.28)<br />
2(ν ′ − λ ′ ) + 2ρν ′′ + ρ(ν ′ − λ ′ )ν ′ = 0. (10.29)<br />
On vérifie facilement que (10.29) est conséquence <strong>de</strong> (10.27) et (10.28). L’équation (10.27)<br />
peut s’écrire sous la forme<br />
d <br />
e<br />
dρ<br />
−λ(ρ) ρ <br />
= 1. (10.30)<br />
L’intégration <strong>de</strong> (10.30) donne immédiatement e−λ(ρ) ρ = ρ + C, C étant une constante<br />
arbitraire. Il s’ensuit que<br />
e −λ(ρ) = 1 + C<br />
. (10.31)<br />
ρ<br />
116
Maintenant, additionnons membre à membre (10.27) et (10.28). Il vient :<br />
ν ′ + λ ′ = 0. (10.32)<br />
L’unique solution <strong>de</strong> (10.32) compatible avec les conditions aux limites (10.22) est<br />
On déduit <strong>de</strong> (10.31) et <strong>de</strong> (10.33) que<br />
ν + λ = 0 ⇐⇒ ν = −λ . (10.33)<br />
e ν(ρ) = e −λ(ρ) = 1 + C<br />
. (10.34)<br />
ρ<br />
Or, nous avons vu qu’on doit avoir g00 ≈ 1 − 2U/ρ loin <strong>de</strong> la masse centrale <strong>de</strong> manière à<br />
retrouver la loi <strong>de</strong> Newton en première approximation. Du fait qu’on a U ≈ GM/ρ pour un<br />
corps attractif <strong>de</strong> masse M à symétrie sphérique, il faut donc poser<br />
C = −2m , avec m = GM<br />
c 2 . (10.35)<br />
En substituant (10.35) dans (10.34), on voit que la solution à symétrie sphérique statique<br />
<strong>de</strong>s équations d’Einstein du vi<strong>de</strong> sans constante cosmologique s’écrit<br />
ds 2 <br />
= 1 − 2m<br />
<br />
(dx<br />
ρ<br />
0 ) 2 − dρ2<br />
1 − 2m<br />
ρ<br />
− ρ 2 (dθ 2 + sin 2 θdϕ 2 ). (10.36)<br />
Cette solution est célèbre : on l’appelle la métrique <strong>de</strong> Schwarzschild extérieure.<br />
Lorsqu’on ne néglige pas la constante cosmologique, les solutions <strong>de</strong>s équations d’Einstein<br />
du vi<strong>de</strong> G µν = Λg µν s’écrivant sous la forme (10.20) sont données par<br />
ds 2 =<br />
<br />
1 − 2m<br />
ρ<br />
Λ<br />
−<br />
3 ρ2<br />
<br />
(dx 0 ) 2 −<br />
1 − 2m<br />
ρ<br />
dρ 2<br />
− Λ<br />
3 ρ2 − ρ2 (dθ 2 + sin 2 θdϕ 2 ), (10.37)<br />
où m est une constante arbitraire que l’on peut encore interpréter comme un terme <strong>de</strong> masse<br />
centrée sur l’origine ρ = 0.<br />
On peut voir que Λ > 0 correspond à une force répulsive proportionnelle à ρ en première approximation,<br />
tandis que Λ < 0 correspond à une force attractive. Dans ce qui suit, on supposera<br />
Λ = 0.<br />
10.3 Forme isotropique <strong>de</strong> la métrique <strong>de</strong> Schwarzschild<br />
Il est possible d’écrire la métrique <strong>de</strong> Schwarzschild sous une forme isotropique (voir chapitre<br />
8) en effectuant le changement <strong>de</strong> coordonnée radiale défini par<br />
<br />
ρ = r 1 + m<br />
2 2r<br />
117<br />
= r + m + m2<br />
. (10.38)<br />
4r
On trouve<br />
ds 2 =<br />
<br />
m 1 − 2r<br />
1 + m<br />
2 (dx<br />
2r<br />
0 ) 2 <br />
−<br />
1 + m<br />
2r<br />
Un développement en puissances <strong>de</strong> m/r donne<br />
1 − m<br />
2r<br />
<br />
1 + m<br />
2r<br />
1 + m<br />
2r<br />
2<br />
4<br />
= 1 − 2m<br />
r<br />
= 1 + 2m<br />
r<br />
4 <br />
dr 2 + r 2 (dθ 2 + sin 2 θdϕ 2 ) <br />
. (10.39)<br />
+ 2m2 + ..., (10.40)<br />
r2 + 3<br />
2<br />
m2 + ... (10.41)<br />
r2 La comparaison <strong>de</strong>s développements (10.40) et (10.41) avec les développements postnewtoniens<br />
(8.21) montre immédiatement que γ = 1 et β = 1. On en conclut que la métrique <strong>de</strong><br />
Schwarzschild est en excellent accord avec les tests classiques. On notera par ailleurs que le<br />
paramètre postpostnewtonien δ = 1, ce qui est intéressant pour la théorie <strong>de</strong>s rayons lumineux<br />
à l’approximation dite 2PN.<br />
Nous allons maintenant montrer que ces valeurs <strong>de</strong> γ et β peuvent également s’obtenir en<br />
calculant directement la déflexion d’un rayon lumineux et l’avance séculaire du périhélie par<br />
<strong>de</strong>s intégrations approchées <strong>de</strong>s équations <strong>de</strong>s géodésiques <strong>de</strong> la métrique <strong>de</strong> Schwarzschild. On<br />
verra que les calculs sont beaucoup plus simples avec la forme (10.36) que les calculs effectués<br />
au chapitre 9 avec la forme isotropique <strong>de</strong> la métrique.<br />
10.4 Géodésiques <strong>de</strong> la métrique <strong>de</strong> Schwarzschild<br />
La fonction <strong>de</strong> Lagrange L correspondant à la métrique (10.36) a pour expression<br />
<br />
2L = 1 − 2m<br />
<br />
( ˙x<br />
ρ<br />
0 ) 2 −<br />
˙ρ2<br />
1 − 2m<br />
ρ<br />
− ρ 2 ˙ θ 2 − ρ 2 sin 2 θ ˙ϕ 2 , (10.42)<br />
où on utilise la notation ˙x = dx/dλ, λ étant un paramètre affine arbitraire <strong>de</strong> la géodésique.<br />
L’intégrale première 2L = K = const. s’écrit alors<br />
<br />
1 − 2m<br />
<br />
( ˙x<br />
ρ<br />
0 ) 2 −<br />
˙ρ2<br />
1 − 2m<br />
ρ<br />
− ρ 2 ˙ θ 2 − ρ 2 sin 2 θ ˙ϕ 2 = K , (10.43)<br />
avec K > 0 pour une géodésique du genre temps, K = 0 pour une géodésique isotrope et K < 0<br />
pour une géodésique du genre espace.<br />
Du fait que L ne dépend explicitement ni <strong>de</strong> x 0 ni <strong>de</strong> ϕ, il existe <strong>de</strong>ux autres intégrales<br />
premières :<br />
<br />
∂L<br />
≡ 1 −<br />
∂ ˙x 0 2m<br />
<br />
˙x<br />
ρ<br />
0 = E , (10.44)<br />
∂L<br />
∂ ˙ϕ ≡ −ρ2 sin 2 θ ˙ϕ = −L, (10.45)<br />
118
où E et L sont <strong>de</strong>s constantes d’intégration. Notons que E correspond à l’intégrale <strong>de</strong> l’énergie<br />
conservée et que L correspond au moment cinétique conservé en mécanique newtonienne.<br />
Pour obtenir un système complet d’équations du mouvement, il suffit d’ajouter l’équation<br />
d’Euler-Lagrange pour la variable θ :<br />
d<br />
dλ (−ρ2 ˙ θ) + ρ 2 sin θ cos θ ˙ϕ 2 = 0. (10.46)<br />
On peut montrer que le mouvement s’effectue dans un plan fixe passant par l’origine O en<br />
raison <strong>de</strong> la symétrie sphérique. Il est alors possible <strong>de</strong> choisir les axes <strong>de</strong> telle sorte que la<br />
géodésique étudiée soit dans le plan équatorial d’équation<br />
θ = π<br />
. (10.47)<br />
2<br />
Avec ce choix, on a ˙ θ = 0 et les géodésiques sont alors déterminée par le système <strong>de</strong>s trois<br />
intégrales premières<br />
et<br />
<br />
1 − 2m<br />
<br />
0 2<br />
dx<br />
−<br />
ρ dλ<br />
1<br />
1 − 2m<br />
2 dρ<br />
− ρ<br />
dλ ρ<br />
2<br />
2 dϕ<br />
= K , (10.48)<br />
dλ<br />
<br />
1 − 2m<br />
<br />
0 dx<br />
= E , (10.49)<br />
ρ dλ<br />
ρ 2dϕ<br />
dλ<br />
= L. (10.50)<br />
De (10.49) et (10.50), on déduit respectivement<br />
dx 0<br />
dλ<br />
dϕ<br />
dλ<br />
= E<br />
1 − 2m<br />
ρ<br />
(10.51)<br />
L<br />
= . (10.52)<br />
ρ2 Substituons (10.51) et (10.52) dans (10.48), puis multiplions les <strong>de</strong>ux membres <strong>de</strong> l’équation<br />
. Il vient :<br />
obtenue par 1 − 2m<br />
r<br />
2 dρ<br />
= E<br />
dλ<br />
2 <br />
− 1 − 2m<br />
<br />
2 L<br />
+ K . (10.53)<br />
ρ ρ2 En éliminant dλ entre (10.51) et (10.53), on obtient<br />
<br />
dρ<br />
dx0 2 <br />
= 1 − 2m<br />
2 <br />
1 − 1 −<br />
ρ<br />
2m<br />
<br />
2 L<br />
ρ E2 Enfin, en éliminant dλ entre (10.52) et (10.53), il vient :<br />
1 K<br />
+<br />
ρ2 E2 <br />
(10.54)<br />
<br />
2 dϕ L<br />
ρ = 1 −<br />
dx0 E<br />
2m<br />
<br />
, (10.55)<br />
ρ<br />
119
équation qui est à comparer avec la loi <strong>de</strong>s aires en mécanique newtonienne.<br />
Les équations (10.53)-(10.55) déterminent entièrement les solutions comprises dans le plan<br />
θ = π/2. Ces trois équations sont du premier ordre à variables séparables. On peut donc<br />
exprimer leur solution générale par quadrature.<br />
On notera également que les équations (10.51), (10.52), (10.53) et dθ/dλ = 0 fournissent les<br />
composantes dx µ /dλ du vecteur tangent à la géodésique solution.<br />
Deux cas sont à distinguer.<br />
1. L = 0. Dans ce cas ˙ϕ = 0, ce qui entraîne ϕ = constante. La géodésique est dite radiale.<br />
Les équations (10.53) et (10.54) se réduisent alors au système<br />
2 dρ<br />
dλ<br />
= E 2 <br />
− K 1 − 2m<br />
<br />
,<br />
ρ<br />
(10.56)<br />
<br />
dρ<br />
dx0 2 =<br />
<br />
1 − 2m<br />
2 <br />
1 −<br />
ρ<br />
K<br />
E2 <br />
1 − 2m<br />
<br />
.<br />
ρ<br />
(10.57)<br />
Ces <strong>de</strong>ux équation du premier ordre à variables séparables permettent d’exprimer le paramètre<br />
affine λ et la coordonnée temporelle x 0 en termes <strong>de</strong> fonctions élémentaires <strong>de</strong> la<br />
variable radiale ρ.<br />
2. L = 0. Dans ce cas, on peut éliminer dλ entre (10.53) et (10.50), ce qui donne :<br />
2 dρ<br />
= ρ<br />
dϕ<br />
4<br />
<br />
2 E<br />
− 1 −<br />
L2 2m<br />
<br />
1 K<br />
+<br />
ρ ρ2 L2 <br />
. (10.58)<br />
Les équations (10.58), (10.54) et (10.55) déterminent complètement les géodésiques contenues<br />
dans le plan θ = π/2. Ces équations différentielles sont du premier ordre à variables<br />
séparables, tout comme dans le cas où L = 0. Toutefois, les intégrales obtenues par quadrature<br />
s’expriment maintenant en toute rigueur par <strong>de</strong>s fonctions elliptiques, plus compliquées à utiliser<br />
que les fonctions dites élémentaires. C’est pourquoi nous nous contenterons ici <strong>de</strong> solutions<br />
approchées qui ont été jusqu’ici suffisantes pour les vérifications expérimentales effectuées dans<br />
le système solaire.<br />
Pour étudier les courbes solutions, on utilisera 4<br />
u = m/ρ (10.59)<br />
comme fonction inconnue plutôt que ρ. En substituant ρ = m/u et dρ = −mu−2du dans (10.58),<br />
puis en multipliant les <strong>de</strong>ux membres par u4 , on obtient une équation qui peut s’écrire sous la<br />
forme : 2 du<br />
=<br />
dϕ<br />
m2 (E2 − K)<br />
L2 + 2Km2<br />
L2 u − u2 + 2u 3 . (10.60)<br />
Cette équation différentielle est elle aussi à variables séparables. En prenant la racine carrée<br />
<strong>de</strong> chaque membre <strong>de</strong> (10.60), on obtient l’équation<br />
dϕ = ±<br />
du<br />
<br />
m 2 E 2<br />
L 2 − (1 − 2u) <br />
u2 + K m2<br />
, (10.61)<br />
4 On ne confondra pas la fonction u ici définie avec la quantité u = m/r introduite dans la section 9.2.<br />
120<br />
L 2
qui permet d’exprimer ϕ en fonction <strong>de</strong> u par une quadrature.<br />
10.5 Déviation <strong>de</strong>s rayons lumineux<br />
On doit poser K = 0 dans le cas <strong>de</strong> la lumière. Pour les rayons lumineux non radiaux,<br />
l’équation (10.60) se réduit alors à<br />
2 du<br />
=<br />
dϕ<br />
m2E2 L2 − u2 + 2u 3 . (10.62)<br />
Considérons un rayon lumineux venant <strong>de</strong> l’infini, atteignant le point le plus proche <strong>de</strong><br />
l’origine (péricentre) lorsque ϕ = ϕp et repartant vers l’infini lorsque ϕ croît à partir <strong>de</strong> ϕp (cf.<br />
fig. 9.2, chap. 9). L’analyse du signe du trinôme du troisième <strong>de</strong>gré en u dans le second membre<br />
<strong>de</strong> (10.62) montre que cette configuration est réalisable lorsque ρp > 3m. Appelons ρp la valeur<br />
<strong>de</strong> ρ correspondant au péricentre et posons<br />
La fonction u atteint son maximum au péricentre. On a donc<br />
u = up =⇒<br />
Il en résulte que la constante m 2 E 2 /L 2 est donnée par<br />
m 2 E 2<br />
up = m<br />
. (10.63)<br />
ρp<br />
2 du<br />
= 0. (10.64)<br />
dϕ u=up<br />
L 2 = u2 p − 2u 3 p . (10.65)<br />
Dans le mouvement considéré, ρ est une fonction croissante <strong>de</strong> ϕ après le passage du rayon<br />
par le péricentre. On a alors du/dϕ < 0 sur cette partie <strong>de</strong> la trajectoire. L’intégration <strong>de</strong><br />
(10.52) par quadrature est immédiate. Compte tenu <strong>de</strong> (10.65), il vient :<br />
up<br />
ϕ(u) − ϕp =<br />
u<br />
du<br />
<br />
u2 p − u2 − 2u3 . (10.66)<br />
p + 2u3 Lorsque ρ → ∞, u → 0. L’angle ϕ tend alors vers la valeur ϕ∞ définie par l’intégrale :<br />
up<br />
ϕ∞ − ϕp =<br />
0<br />
du<br />
<br />
u2 p − u2 − 2u3 . (10.67)<br />
p + 2u3 La différence ϕ∞ − ϕp est l’angle que fait l’asymptote avec le rayon vecteur joignant le<br />
centre O au péricentre. Par raison <strong>de</strong> symétrie, l’angle total formé par les <strong>de</strong>ux asymptotes est<br />
2(ϕ∞ − ϕp). La déviation totale δ subie par le rayon lumineux entre −∞ et ∞ peut se définir<br />
comme la différence 2(ϕ∞ −ϕp)−π. Il en résulte que la déviation du rayon lumineux est donnée<br />
par<br />
up<br />
δ = 2(ϕ∞ − ϕp) − π = 2<br />
0<br />
121<br />
du<br />
<br />
u2 p − u2 − 2u3 − π . (10.68)<br />
p + 2u3
Cette formule est rigoureuse. Pour former un développement <strong>de</strong> δ en puissances entières <strong>de</strong><br />
up = m/ρp, notons que up est une racine du polynôme du troisième <strong>de</strong>gré en u sous le le radical<br />
puisqu’on a du/dϕ = 0 lorsque u = up. On voit aisément que<br />
u 2 p − u 2 − 2u 3 p + 2u 3 ≡ (up − u) <br />
up + u − 2(u 2 p + upu + u 2 ) <br />
Compte tenu <strong>de</strong> (10.69), l’expression (10.68) donnant δ s’écrit<br />
up<br />
δ = 2<br />
0<br />
Effectuons le changement <strong>de</strong> variable :<br />
Compte tenu <strong>de</strong>s égalités<br />
l’expression <strong>de</strong> δ <strong>de</strong>vient<br />
≡ (up − u) <br />
(1 − 2up)(up + u) − 2u 2<br />
. (10.69)<br />
du<br />
<br />
(up − u) [(1 − 2up)(up + u) − 2u 2 ]<br />
− π . (10.70)<br />
u = up cos 2ψ , 0 ≤ ψ ≤ π<br />
. (10.71)<br />
4<br />
up − u = 2up sin 2 ψ , up + u = 2up cos 2 ψ ,<br />
π<br />
δ = 4<br />
4<br />
0<br />
dψ<br />
<br />
1 − 2up cos 2ψ + 1<br />
2 cos−2 ψ − π . (10.72)<br />
A l’extérieur du Soleil, on a up ≤ 2, 13 × 10 −6 , la borne supérieure <strong>de</strong> cette inégalité correspondant<br />
à ρp = ρ⊙, ρ⊙ étant le rayon du Soleil en coordonnées (ρ,θ,ϕ). On se contentera ici<br />
<strong>de</strong> développer le terme sous le signe somme au premier ordre par rapport à up, ce qui donne<br />
soit tous calculs faits<br />
π <br />
4 δ = 4 1 + up cos 2ψ +<br />
0<br />
1<br />
2 cos−2 <br />
ψ + O(u 2 <br />
p) dψ − π (10.73)<br />
δ = 4up = 4GM<br />
c 2 ρp<br />
La déviation totale d’un rayon rasant la surface solaire vaut donc<br />
<br />
δ⊙ = 4GM⊙<br />
c 2 ρ⊙<br />
+ O<br />
G 2 M 2 ⊙<br />
c 4 ρ 2 ⊙<br />
+ O(u 2 p). (10.74)<br />
= 1, 75”. (10.75)<br />
Compte tenu <strong>de</strong> (10.38), l’équation (10.74) s’écrit en terme <strong>de</strong> coordonnée radiale isotrope<br />
δ = 4GM<br />
c 2 rp<br />
+ O(4). (10.76)<br />
En comparant l’expression (10.76) <strong>de</strong> la déviation avec la formule (9.65), on voit que la<br />
relativité générale prévoit<br />
γ = 1. (10.77)<br />
122
Valeur <strong>de</strong> δ au second ordre.— Le calcul <strong>de</strong> la déviation δ à l’approximation du second<br />
ordre est simple à partir <strong>de</strong> (10.72). On obtient :<br />
δ = 4GM<br />
c 2 ρp<br />
+<br />
15π<br />
16<br />
<br />
− 1<br />
2 2GM<br />
+ O<br />
c 2 ρp<br />
<br />
3 3 G M<br />
c 6 ρ 3 p<br />
. (10.78)<br />
Le terme du second ordre correspond à une déviation <strong>de</strong> l’ordre <strong>de</strong> 7 microsecon<strong>de</strong>s d’arc<br />
pour un rayon rasant le Soleil. Il faut toutefois noter que si la valeur totale <strong>de</strong> la déviation est<br />
inchangée par les transformations <strong>de</strong> coordonnées 5 , l’expression formelle du terme du second<br />
ordre est par contre très “sensible” au système <strong>de</strong> coordonnées utilisé car la valeur <strong>de</strong> la variable<br />
radiale correspondant au péricentre change lorsqu’on passe d’un système <strong>de</strong> coordonnées à<br />
l’autre. Ainsi, la déviation obtenue en intégrant les équations <strong>de</strong>s géodésiques isotropes <strong>de</strong> la<br />
métrique écrite sous la forme (10.39) est donnée par<br />
δ = 4GM<br />
c 2 rp<br />
+<br />
15π<br />
32<br />
<br />
− 1<br />
2 2GM<br />
+ O<br />
c 2 rp<br />
<br />
3 3 G M<br />
c 6 r 3 p<br />
. (10.79)<br />
On vérifie aisément l’équivalence <strong>de</strong>s relations (10.78) et (10.79) en écrivant que ρp et rp<br />
sont liés par l’équation (10.38).<br />
10.6 Avance séculaire du périhélie d’une planète<br />
Pour étudier le mouvement du périhélie d’une planète, on admet ici que la planète est<br />
assimilable à une particule d’épreuve, ce qui revient à négliger l’influence <strong>de</strong> sa structure interne<br />
sur son mouvement. En outre, on néglige l’influence <strong>de</strong>s autres planètes et on suppose que le<br />
Soleil est à symétrie sphérique.<br />
On peut toujours choisir les coordonnées <strong>de</strong> telle sorte que le mouvement <strong>de</strong> la planète<br />
soit situé dans le plan θ = π/2. L’orbite <strong>de</strong> la planète est alors solution <strong>de</strong> l’équation (10.60).<br />
Puisque la ligne d’univers <strong>de</strong> la planète est une géodésique du genre temps, on peut choisir<br />
l’abscisse curviligne s comme paramètre affine, ce qui entraîne<br />
<strong>de</strong> sorte que (10.60) s’écrit<br />
K = 1,<br />
2 du<br />
=<br />
dϕ<br />
m2 (E2 − 1)<br />
L2 + 2m2<br />
L2 u − u2 + 2u 3 . (10.80)<br />
Nous raisonnons sur la <strong>de</strong>mi-révolution comprise entre le passage au péricentre P1 <strong>de</strong> coordonnées<br />
polaires (ρp,ϕp) et le passage à l’apocentre A1 <strong>de</strong> coordonnées polaires (ρa,ϕa) (cf. fig.<br />
9.3, chap. 9). Le mouvement est supposé s’effectuer dans le sens direct. On pose :<br />
up = m<br />
, ua = m<br />
. (10.81)<br />
ρp<br />
5 l’angle <strong>de</strong> déviation entre −∞ et ∞ est en effet une gran<strong>de</strong>ur intrinsèque indépendante <strong>de</strong>s coordonnées<br />
utilisées pour repérer les événements.<br />
123<br />
ρa
Durant la <strong>de</strong>mi-pério<strong>de</strong> considérée, la fonction u(ϕ) est décroissante. On a donc pendant<br />
cette <strong>de</strong>mi-pério<strong>de</strong> :<br />
du<br />
dϕ = −<br />
. (10.82)<br />
m 2 (E 2 −1)<br />
L 2<br />
+ 2m2<br />
L 2 u − u 2 + 2u 3<br />
En conséquence, l’angle ϕa − ϕp balayé par le rayon vecteur est donné par l’intégrale<br />
ub<br />
ϕa − ϕp =<br />
ua<br />
m 2 (E 2 −1)<br />
L 2<br />
du<br />
+ 2m2<br />
L 2 u − u 2 + 2u 3<br />
. (10.83)<br />
Par raison <strong>de</strong> symétrie, l’angle balayé par le rayon vecteur entre <strong>de</strong>ux passages successifs par<br />
un péricentre (i.e. pendant une révolution complète) est égal à 2(ϕa − ϕp). Cet angle vaudrait<br />
2π en théorie newtonienne. L’avance relativiste ∆ϕp du péricentre par révolution est donc par<br />
définition<br />
∆ϕp = 2(ϕa − ϕp) − 2π . (10.84)<br />
Pour évaluer ϕa − ϕp, il faut factoriser le polynôme P(u) du troisième <strong>de</strong>gré en u figurant<br />
dans l’intégrale (10.83). Les quantités up et ua définies par (10.81) sont racines <strong>de</strong> ce polynôme<br />
puisqu’on doit avoir (du/dϕ) 2 p = (du/dϕ) 2 a = 0. En désignant par u3 la troisième racine <strong>de</strong> P(u),<br />
on peut donc écrire<br />
m 2 (E 2 − 1)<br />
L 2<br />
+ 2m2<br />
L 2 u − u2 + 2u 3 = 2(up − u)(u − ua)(u3 − u). (10.85)<br />
Développons le second membre <strong>de</strong> (10.83) et comparons avec le premier membre. Il vient :<br />
d’où après simplification par u 2<br />
2u 2 (up + ua + u3) = −u 2 .<br />
u3 = 1<br />
2 − (up + ua). (10.86)<br />
Substituons (10.86) dans (10.85). Il vient :<br />
m 2 (E 2 − 1)<br />
L 2<br />
+ 2m2<br />
L 2 u − u2 + 2u 3 = (up − u)(u − ua)[1 − 2(up + ua) − 2u]. (10.87)<br />
Compte tenu <strong>de</strong> (10.87) et <strong>de</strong> (10.83), l’expression (10.84) donnant l’avance du péricentre<br />
est<br />
ub<br />
du<br />
∆ϕp = 2 <br />
− 2π .<br />
ua (up − u)(u − ua)[1 − 2(up + ua) − 2u]<br />
(10.88)<br />
Cette formule est rigoureuse.<br />
À l’approximation 1PN, la formule (10.88) donne<br />
ub<br />
∆ϕp = 2<br />
ua<br />
1 + (up + ua) + u<br />
<br />
(up − u)(u − ua) du − 2π + O(m2 /r 2 p). (10.89)<br />
Le calcul <strong>de</strong>s intégrales figurant dans le second membre <strong>de</strong> (10.89) est élémentaire. On<br />
obtient :<br />
∆ϕp = 3π(up + ua) + O(m 2 /ρ 2 p). (10.90)<br />
124
Au cours du mouvement, la variable ρ va passer <strong>de</strong> sa valeur ρp au périhélie à sa valeur<br />
ρa à l’aphélie. On peut définir le <strong>de</strong>mi-grand axe a∗ et l’excentricité e∗ dans le système <strong>de</strong><br />
coordonnées (ρ,θ,ϕ) en posant :<br />
On a donc<br />
up + ua =<br />
ρp = a∗(1 − e∗), ρa = a∗(1 + e∗). (10.91)<br />
m<br />
a∗(1 − e∗) +<br />
m<br />
a∗(1 + e∗) =<br />
2m<br />
a∗(1 − e2 . (10.92)<br />
∗)<br />
En substituant (10.92) dans (10.90), on obtient l’expression suivante pour l’avance du<br />
péricentre par révolution<br />
∆ϕp = 6πGM<br />
c 2 a∗(1 − e 2 ∗) + O(m2 /a 2 ∗) rad/révolution. (10.93)<br />
D’après la formule <strong>de</strong> transformation (10.38), les valeurs <strong>de</strong> a∗ et e∗ coïnci<strong>de</strong>nt avec les<br />
valeurs <strong>de</strong> a et e définies par les équations (9.70) à <strong>de</strong>s termes d’ordre 1/c 2 près. En conséquence,<br />
la comparaison <strong>de</strong> l’expression <strong>de</strong> ∆ϕp donnée par (10.93) avec la formule (9.95) donne à<br />
nouveau<br />
β = 1 (10.94)<br />
lorsqu’on tient compte <strong>de</strong> γ = 1.<br />
10.7 Horizon et trou noir<br />
Effet Doppler gravitationnel.— Soit une source A au repos en un point <strong>de</strong> coordonnées<br />
(rA,θA,ϕA) émettant un signal périodique. Supposons que le signal émis par cette source soit<br />
reçu par un observateur B au repos en un point <strong>de</strong> coordonnées (rB,θB,ϕB). Un raisonnement<br />
analogue à celui que nous avons fait dans la section 7.4 montrerait que la fréquence νB du signal<br />
observé par B est reliée à la fréquence propre νA du signal émis par A selon la formule<br />
νB<br />
νA<br />
<br />
<br />
<br />
=<br />
(g00)A<br />
(g00)B<br />
(10.95)<br />
dans n’importe quel espace-temps statique. Dans l’espace-temps <strong>de</strong> Schwarzschild, on a g00 =<br />
1 − 2m/ρ, ce qui entraîne<br />
<br />
<br />
2m<br />
νB 1<br />
− ρA = <br />
νA 1 − 2m .<br />
ρB<br />
(10.96)<br />
On notera que les formules (10.95) et (10.96) sont rigoureuses sous les hypothèses faites. La<br />
relation (10.96) donne bien entendu en première approximation la formule (7.37), puisqu’on a<br />
évi<strong>de</strong>mment dans le cas <strong>de</strong> la symétrie sphérique<br />
<br />
<br />
2m<br />
1<br />
− ρA <br />
1 − 2m<br />
ρB<br />
<br />
1<br />
≈ 1 − m<br />
ρA<br />
U étant le potentiel newtonien du corps central.<br />
− 1<br />
<br />
≈ 1 −<br />
ρB<br />
UA − UB<br />
c2 ,<br />
125
Horizon. Trou noir.— Fixons ρB supposé > 2m dans la formule exacte (10.96). On voit<br />
que le rapport νB/νA tend vers 0 lorsque ρA → 2m. Ainsi, plus une source statique est située prés<br />
<strong>de</strong> l’hypersurface ρ = 2m, plus son spectre <strong>de</strong> fréquences est perçu comme décalé vers le rouge.<br />
Si ρA = 2m, le décalage spectral vers le rouge vu par n’importe quel observateur extérieur<br />
B est infini, ce qui revient à dire que la source A <strong>de</strong>vient inobservable. On appelle horizon<br />
toute hypersurface dont chaque point serait vu comme infiniment décalé vers le rouge par tout<br />
observateur extérieur. L’espace-temps <strong>de</strong> Schwarzschild admet donc l’hypersurface d’équation<br />
ρ = 2m comme horizon.<br />
Il résulte <strong>de</strong> qui vient d’être dit que les événements ayant lieu sur l’hypersurface ρ = 2m<br />
sont inobservables par <strong>de</strong>s observateurs <strong>de</strong> coordonnée radiale ρ > 2m (observateurs extérieurs).<br />
Cette conclusion est corroborée par l’analyse <strong>de</strong> la propagation d’un signal lumineux dans<br />
l’espace-temps <strong>de</strong> Schwarzshild. Pour simplifier, nous considérons uniquement le cas où le signal<br />
se propage radialement. On peut alors utiliser (10.57) avec K = 0, ce qui donne<br />
dx 0 = ± dρ<br />
1 − 2m<br />
ρ<br />
= ± ρdρ<br />
, (10.97)<br />
ρ − 2m<br />
le signe étant + si le rayon s’éloigne <strong>de</strong> l’origine (rayon “sortant”) et − si le rayon se rapproche<br />
du centre (rayon “entrant”). L’intégration <strong>de</strong> (10.97) est immédiate. Si le signal est au point<br />
<strong>de</strong> coordonnée radiale ρi à l’instant ti = x 0 i/c, l’équation horaire <strong>de</strong> son mouvement est<br />
si le rayon est sortant et<br />
x 0 − x 0 <br />
<br />
<br />
i = ρ − ρi + 2m ln <br />
<br />
x 0 − x 0 <br />
<br />
<br />
i = ρi − ρ − 2m ln <br />
<br />
<br />
ρ − 2m <br />
<br />
, (10.98)<br />
ρi − 2m<br />
<br />
ρ − 2m <br />
<br />
<br />
ρi − 2m<br />
(10.99)<br />
si le rayon est entrant.<br />
La formule (10.98) montre que x 0 − x 0 i → ∞ lorsque ρi → 2m. Un signal radial envoyé<br />
par une source ponctuelle située sur l’horizon atteindrait un observateur extérieur à l’instant<br />
t = x 0 /c = ∞. Autant dire qu’un tel signal ne peut atteindre aucun observateur extérieur.<br />
Il résulte <strong>de</strong> ce qui précè<strong>de</strong> qu’un objet à symétrie sphérique <strong>de</strong> masse M et <strong>de</strong> rayon<br />
ρg = 2m = 2GM/c 2 serait invisible pour tout observateur <strong>de</strong> coordonnée radiale ρ > 2m. C’est<br />
cette propriété qui est à l’origine <strong>de</strong> la notion <strong>de</strong> trou noir en relativité générale.<br />
Observateur en chute libre radiale.— L’existence d’un horizon ayant les propriétés ci<strong>de</strong>ssus<br />
est assez déroutante pour notre intuition courante relative au temps et à l’espace. Mais<br />
nous allons voir que nous ne sommes pas au bout <strong>de</strong> nos surprises en examinant maintenant le<br />
mouvement radial d’une particule d’épreuve matérielle accompagnée par une horloge standard<br />
comouvante. La ligne d’univers <strong>de</strong> cette particule est une géodésique radiale <strong>de</strong> genre temps.<br />
On peut poser K = 1 dans (10.56) et (10.57) à condition <strong>de</strong> choisir le paramètre affine λ <strong>de</strong><br />
telle sorte que dλ = ds. Les équations (10.56) et (10.57) s’écrivent alors sous la forme<br />
ds = ±<br />
ρdρ<br />
<br />
(E 2 − 1)ρ 2 + 2mρ<br />
126<br />
(10.100)
et<br />
dx 0 Eρ<br />
= ±<br />
2dρ <br />
(ρ − 2m)<br />
(E 2 − 1)ρ 2 + 2mρ<br />
. (10.101)<br />
On peut intégrer explicitement (10.100) et (10.101) pour une valeur arbitraire <strong>de</strong> E. Pour<br />
simplifier, nous allons nous contenter d’examiner le cas où E 2 = 1. La variable radiale peut<br />
aller jusqu’à l’infini, la quantité dρ/dx 0 tendant alors vers 0 d’après (10.101). On dit que<br />
le mouvement radial correspondant est parabolique. L’intégration <strong>de</strong> (10.101) donne avec <strong>de</strong>s<br />
notations déjà introduites pour les rayons lumineux<br />
x 0 − x 0 <br />
2<br />
i = ±<br />
3 √ 2m ρ3/2 + 1<br />
<br />
√ √<br />
√ ρ<br />
1/2 ρ + 2m<br />
<br />
2mρ − 2m ln <br />
2<br />
√<br />
√ <br />
ρ − 2m<br />
ρi<br />
, (10.102)<br />
le signe + <strong>de</strong>vant le crochet correspondant à une particule qui s’éloigne du centre (particule<br />
sortante) et le signe − à une particule qui se rapproche du centre (particule entrante). Pour<br />
une particule sortante, (10.102) montre que x 0 − x 0 i → ∞ si ρi → 2m. Ce comportement est<br />
analogue à ce que nous avions trouvé pour la lumière, ce qui n’est pas surprenant : un rayon<br />
lumineux est plus rapi<strong>de</strong> que toute particule douée <strong>de</strong> masse...<br />
La surprise se produit en revanche quand on intègre (10.100). On a pour E 2 = 1 :<br />
s − si = c(τ − τi) = ± 2<br />
3 √ <br />
2m<br />
ρ 3/2 − ρ 3/2<br />
i<br />
<br />
, (10.103)<br />
τ étant le temps propre <strong>de</strong> la particule.<br />
La formule (10.103) montre que le temps propre <strong>de</strong> la particule reste fini lorsque ρi → 2m.<br />
Cette propriété remarquable est en fait vraie pour toutes les particules matérielles en chute libre<br />
dans l’espace-temps <strong>de</strong> Schwarzschild, que ces particules aient un mouvement radial ou non,<br />
quelle que soit la valeur <strong>de</strong> la constante du mouvement E. En conséquence, pour un observateur<br />
tombant dans un trou noir <strong>de</strong> Schwarzschild, la traversée <strong>de</strong> l’horizon s’effectue à une date finie<br />
<strong>de</strong> son échelle <strong>de</strong> temps propre. On ne discutera pas ici du <strong>de</strong>stin ultérieur d’un observateur<br />
effectuant une telle traversée. On indiquera seulement que cette traversée sera sans retour vers<br />
l’univers extérieur...<br />
127
Annexe A<br />
Espaces affines. Espaces euclidiens<br />
Cette annexe est consacrée à quelques rappels concernant la notion d’espace ponctuel affine<br />
à n dimensions, qui constitue une extension naturelle <strong>de</strong> notre intuition <strong>de</strong> l’espace géométrique<br />
usuel.<br />
A.1 Espaces affines<br />
A.1.1 Définition d’un espace affine<br />
Les espaces <strong>de</strong> la géométrie ordinaire tels que la droite, le plan et l’espace usuel à trois<br />
dimensions ne sont pas donnés dans notre intuition comme <strong>de</strong>s espaces vectoriels, mais comme<br />
<strong>de</strong>s ensemble dont les éléments sont appelés <strong>de</strong>s points. Toutefois, on voit dès l’enseignement<br />
secondaire que ces ensembles sont structurés <strong>de</strong> telle sorte qu’à tout couple <strong>de</strong> points (A,B)<br />
on fasse correspondre un et un seul vecteur d’origine A et d’extrémité B, noté −→<br />
AB, la correspondance<br />
étant telle que soient satisfaites les relations vectorielles usuelles. Ces espaces sont<br />
appelés <strong>de</strong>s espaces affines (réels) <strong>de</strong> dimensions 1, 2 ou 3, selon les cas. En fait la notion<br />
d’espace affine1 est aisément généralisable en dimension n arbitraire, comme on va le voir avec<br />
les définitions qui suivent.<br />
Définition A.1.1 Soit En un espace vectoriel réel <strong>de</strong> dimension n. Un ensemble An est appelé<br />
un espace affine réel à n dimensions associé à l’espace vectoriel En si à tout couple (x,y)<br />
d’éléments <strong>de</strong> An on peut faire correspondre un et un seul vecteur <strong>de</strong> En noté −→ xy, la loi <strong>de</strong><br />
correspondance ayant les propriétés suivantes :<br />
a) −→ xy = − −→ yx;<br />
b) −→ xz = −→ xy + −→ yz (relation <strong>de</strong> Chasles);<br />
c) Pour tout o ∈ An et pour tout X ∈ En, il existe un et un seul élément x ∈ An tel que<br />
−→ox = X.<br />
1 Pour souligner que les éléments d’un espace affine sont <strong>de</strong>s points, la terminologie espace ponctuel affine est<br />
parfois utilisée.<br />
128
Les éléments <strong>de</strong> An sont appelés <strong>de</strong>s points. On omettra dorénavant l’épithète réel.<br />
Il résulte immédiatement <strong>de</strong> la propriété a) et <strong>de</strong>s propriétés élémentaires <strong>de</strong>s espaces vectoriels<br />
que −→ xx = 0 pour tout x ∈ An.<br />
Exemple d’espace affine réel.– Donnons-nous un espace vectoriel réel En <strong>de</strong> dimension n.<br />
L’ensemble IR n peut être muni d’une structure d’espace ponctuel affine associé à En, et ce d’une<br />
infinité <strong>de</strong> façons distinctes. Choisissons en effet une base arbitraire <strong>de</strong> En, que nous noterons ei.<br />
Étant donné <strong>de</strong>ux points <strong>de</strong> IR n , x = (x 1 ,x 2 ,....,x n ) et y = (y 1 ,y 2 ,....,y n ), posons en utilisant<br />
la convention d’Einstein<br />
−→xy = (y i − x i )ei. (A.1)<br />
On vérifie aisément que la correspondance (x,y) → −→ xy définie par (A.1) possè<strong>de</strong> les propriétés<br />
qui munissent IR n d’une structure d’espace ponctuel affine associé à En.<br />
En fait, on voit par la démonstration qui précè<strong>de</strong> qu’il existe sur IR n autant <strong>de</strong> structures<br />
d’espace ponctuel affine associé à un espace vectoriel donné En qu’il existe <strong>de</strong> bases distinctes<br />
<strong>de</strong> l’espace En. Mais ces structures sont toutes isomorphes et peuvent en conséquence être<br />
“i<strong>de</strong>ntifiées”. En outre tous les espaces vectoriels réels <strong>de</strong> dimension n sont isomorphes et<br />
peuvent s’i<strong>de</strong>ntifier à l’espace vectoriel usuel (IR n , +,.) ( 2 ). C’est pourquoi on peut par un<br />
léger abus <strong>de</strong> langage i<strong>de</strong>ntifier un espace ponctuel affine réel An défini in abstracto comme<br />
ci-<strong>de</strong>ssus avec l’espace IR n <strong>de</strong>s n-uplets <strong>de</strong> nombres réels associé à l’espace vectoriel (IR n , +,.)<br />
selon la loi <strong>de</strong> correspondance (8.15), où ei est la base canonique <strong>de</strong> (IR n , +,.) définie par<br />
e1 = (1, 0,..., 0),e2 = (1, 1,..., 0),...,en = (0, 0,..., 1).<br />
A.1.2 Repère d’un espace affine<br />
Définition A.1.2 Soit An un espace affine associé à un espace vectoriel En. Un repère affine<br />
(ou cartésien) <strong>de</strong> An est l’ensemble constitué par un point o <strong>de</strong> An et une base {e1,e2,...,en} =<br />
{ei} <strong>de</strong> l’espace vectoriel En. Un tel repère est noté (o, {e1,e2,...,en}) ou en abrégé (o, {ei}).<br />
Le point o est appelé l’origine du repère.<br />
Définition A.1.3 Soient (o, {ei}) un repère <strong>de</strong> l’espace affine An et x un point arbitraire <strong>de</strong><br />
An. On appelle coordonnées cartésiennes (ou affines) <strong>de</strong> x par rapport au repère (o, {ei}) les<br />
composantes x i du vecteur −→ ox par rapport à la base {ei}.<br />
Autrement dit, le n-uplet (x 1 ,x 2 ,...,x n ) constitue les coordonnées cartésiennes d’un point<br />
x par rapport au repère (o, {ei}) si et seulement si<br />
−→ox = x i ei. (A.2)<br />
Il résulte <strong>de</strong> la propriété c) dans la définition 1 que le n-uplet (x 1 ,x 2 ,...,x n ) constituant<br />
les coordonnées cartésiennes <strong>de</strong> x est unique et que réciproquement, la donnée d’un n-uplet<br />
2 On appelle ainsi l’ensemble IR n <strong>de</strong>s n-uplets <strong>de</strong> nombres réels x = (x 1 ,x 2 ,...,x n ) muni <strong>de</strong> la structure<br />
d’espace vectoriel obtenue en définissant la somme <strong>de</strong> <strong>de</strong>ux n-uplets x = (x 1 ,x 2 ,...,x n ) et y = (y 1 ,y 2 ,...,y n )<br />
par x + y = (x 1 + y 1 ,x 2 + y 2 ,...,x n + y n ) et la multiplication d’un n-uplet x par un scalaire réel λ en posant<br />
λ.x = (λx 1 ,λx 2 ,...,λx n ).<br />
129
(x 1 ,x 2 ,...,x n ) définit un et un seul point x <strong>de</strong> An. Un repère étant choisi, on peut donc “i<strong>de</strong>ntifier”<br />
un point et ses coordonnées cartésiennes comme on le fait d’habitu<strong>de</strong> en géométrie<br />
ordinaire. Pour abréger, nous désignerons par (x i ) le n-uplet (x 1 ,x 2 ,...,x n ) et nous poserons<br />
souvent x = (x i ).<br />
Considérons <strong>de</strong>ux points x et y <strong>de</strong> An, <strong>de</strong> coordonnées affines respectives x i et y i par rapport<br />
au repère (o, {ei}). Il vient en appliquant les propriétés a) et b) :<br />
−→xy = −→ xo + −→ oy = −→ oy − −→ ox.<br />
D’où, en tenant compte tenu <strong>de</strong> la définition <strong>de</strong>s coordonnées d’un point <strong>de</strong> An et en utilisant<br />
les règles <strong>de</strong> calcul sur les espaces vectoriels :<br />
−→xy = y i ei − x i ei = (y i − x i )ei. (A.3)<br />
Les composantes du vecteur −→ xy par rapport à la base ei sont donc les n quantités y i − x i .<br />
C’est pourquoi on note fréquemment y − x le vecteur −→ xy :<br />
Avec cette notation, la propriété a) s’écrit<br />
et la relation <strong>de</strong> Chasles b) <strong>de</strong>vient<br />
A.1.3 Changements <strong>de</strong> repères<br />
y − x = −→ xy . (A.4)<br />
y − x = −(x − y) (A.5)<br />
z − x = (z − y) + (y − x). (A.6)<br />
Cherchons les relations existant entre les coordonnées cartésiennes d’un point arbitraire x<br />
par rapport à <strong>de</strong>ux repères distincts (o, {ei}) et (o ′ , {ej ′}).<br />
Nous pouvons poser pour les <strong>de</strong>ux bases {ei} et {ej ′} :<br />
les coefficients Ai j ′ et Aj′ i étant reliés par les relations<br />
ei = A j′<br />
i ej ′, ej ′ = Ai j ′ei, (A.7)<br />
A j′<br />
i A k j ′ = δk i ⇐⇒ A i j ′Al′<br />
i = δ l′<br />
′. (A.8)<br />
Soient xi et xj′ les coordonnées respectives du point x par rapport aux repères (o, {ei}) et<br />
(o ′ , {ej ′}). On a<br />
−→<br />
o ′ x = x j′<br />
ej ′ . (A.9)<br />
Or, le premier membre <strong>de</strong> (A.9) peut s’écrire<br />
j<br />
−→<br />
o ′ x = −→ o ′ o + −→ ox . (A.10)<br />
130
On peut poser<br />
et exprimer −→ ox par rapport à la base {ej ′} :<br />
−→<br />
o ′ o = a j′<br />
ej ′ (A.11)<br />
−→ox = x i ei = x i A j′<br />
i ej ′ . (A.12)<br />
Substituons (A.11) et (A.12) dans (A.10) et i<strong>de</strong>ntifions le résultat obtenu avec le second<br />
membre <strong>de</strong> (A.9). Nous obtenons la formule <strong>de</strong> transformation <strong>de</strong> coordonnées cartésiennes :<br />
x j′<br />
= A j′<br />
i x i + a j′<br />
. (A.13)<br />
Il est bien entendu possible d’exprimer les coordonnées xi en fonction <strong>de</strong>s xj′ . Posons<br />
−→<br />
oo ′ = a i ei<br />
et échangeons le rôle joué par les <strong>de</strong>ux repères. Il vient :<br />
A.2 Espace euclidien<br />
A.2.1 Définition d’un espace euclidien<br />
(A.14)<br />
x i = A i j ′xj′ + a i . (A.15)<br />
Un espace vectoriel En est dit euclidien lorsqu’on a défini un produit scalaire g(X,Y ) <strong>de</strong><br />
<strong>de</strong>ux vecteurs arbitraires X et Y sur cet espace. Un tel espace est généralement noté (En,g).<br />
Nous sommes ainsi conduits à définir un espace euclidien comme suit.<br />
Définition A.2.1 On appelle espace euclidien <strong>de</strong> dimension n un espace affine An dont l’espace<br />
vectoriel associé En est muni d’un produit scalaire g. Cet espace ponctuel est noté (An,g).<br />
On notera qu’on <strong>de</strong>vrait en toute rigueur parler d’un espace affine euclidien, mais on abrège...<br />
Dans un espace euclidien (An,g), on peut définir ce que l’on appelle par abus <strong>de</strong> langage le<br />
carré d’une distance ou d’un intervalle sxy entre <strong>de</strong>ux points arbitraires x et y en posant<br />
s 2 xy = g( −→ xy, −→ xy) = g(y − x,y − x), (A.16)<br />
relation qu’on peut encore écrire en utilisant la notation g(X,Y ) = X.Y :<br />
s 2 xy = −→ xy. −→ xy = (y − x).(y − x) = (y − x) 2 . (A.17)<br />
Un repère (o, {ei}) quelconque étant choisi, soient x i et y i les coordonnées respectives <strong>de</strong> x<br />
et y. À condition <strong>de</strong> poser<br />
gij = g(ei,ej) = ei.ej,<br />
131
l’expression <strong>de</strong> l’intervalle (A.17) par rapport au repère (o, {ei}) est donnée par la formule<br />
fondamentale<br />
s 2 xy = gij(y i − x i )(y j − x j ). (A.18)<br />
Si y est infiniment proche <strong>de</strong> x, on peut poser y i = x i + dx i . Le “carré” <strong>de</strong> l’intervalle<br />
élémentaire entre les <strong>de</strong>ux points s’exprime alors par la forme quadratique <strong>de</strong> différentielles<br />
ds 2 = gijdx i dx j . (A.19)<br />
Le ds 2 (A.19) est appelée la métrique <strong>de</strong> l’espace euclidien (An,g).<br />
A.2.2 Espace euclidien rapporté à un repère orthonormé<br />
Un repère (o, {ei}) <strong>de</strong> l’espace euclidien (An,g) sera dit orthonormé (au sens du produit<br />
scalaire g) si la base {ei} est orthonormée au sens <strong>de</strong> g, i.e. si on a<br />
avec<br />
gij = ηij, (A.20)<br />
ηij = ǫi = ±1 si i = j, ηij = 0 si i = j. (A.21)<br />
On montre qu’il existe un entier p ≥ 0 dépendant uniquement du produit scalaire g tel<br />
qu’on ait dans tout repère orthonormé au sens <strong>de</strong> g) :<br />
1 ≤ i ≤ p =⇒ ǫi = 1, p + 1 ≤ i ≤ n =⇒ ǫi = −1. (A.22)<br />
Il en résulte que dans tout repère orthonormé, le carré <strong>de</strong> l’intervalle s 2 xy s’écrit sous la forme<br />
simple<br />
s 2 xy = ηij(y i − x i )(y j − x j )<br />
= (y 1 − x 1 ) 2 + ... + (y p − x p ) 2 − (y p+1 − x p+1 ) 2 − ... − (y n − x n ) 2<br />
expression qui <strong>de</strong>vient pour <strong>de</strong>s points x = (x i ) et y = (x i + dx i ) infiniment voisins<br />
ds 2 = ηijdx i dx j = (dx 1 ) 2 + ... + (dx p ) 2 − (dx p+1 ) 2 − ... − (dx n ) 2<br />
(A.23)<br />
(A.24)<br />
L’entier σ = 2p−n s’appelle la signature du produit scalaire g. Désormais, nous appellerons<br />
aussi σ la signature du carré <strong>de</strong> l’intervalle s 2 xy défini par (3.13) ou encore la signature <strong>de</strong> la<br />
métrique ds 2 définie par (3.41).<br />
Soulignons que dans tout système <strong>de</strong> coordonnées affines fixé, les gij sont <strong>de</strong>s quantités<br />
indépendantes <strong>de</strong>s x i , c’est-à-dire <strong>de</strong>s constantes.<br />
Deux types d’espace ponctuels euclidiens sont particulièrement importants en physique<br />
théorique : les espaces proprement euclidiens et les espaces lorentziens ou hyperboliques, qu’on<br />
appelle le plus souvent espaces-temps <strong>de</strong> Minkowski (<strong>de</strong> dimension n) (cf. sect. A.4, infra).<br />
132
A.3 Espace proprement euclidiens<br />
Si l’espace vectoriel euclidien (En,g) associé à An est proprement euclidien (i.e. si g(X,X)<br />
est ¿ 0 pour tout vecteur X <strong>de</strong> En non nul), l’espace (An,g) est également dit proprement<br />
euclidien. La quantité s 2 xy définie par (A.16) ou (3.13) est alors strictement positive si les points<br />
x et y sont distincts. La racine carrée <strong>de</strong> s 2 xy définit en conséquence une distance au sens usuel<br />
entre les points x et y.<br />
Dans n’importe quel repère orthonormé <strong>de</strong> l’espace (An,g), l’expression (A.23) s’écrit<br />
s 2 xy = (y 1 − x 1 ) 2 + (y 2 − x 2 ) 2 + ... + (y n − x n ) 2 . (A.25)<br />
Cette expression est l’extension à n dimensions du théorème <strong>de</strong> Pythagore qui fon<strong>de</strong> la<br />
géométrie métrique ordinaire en coordonnées cartésiennes orthonormées. Le carré <strong>de</strong> la distance<br />
entre <strong>de</strong>ux points infiniment voisins est alors donné par<br />
où les quantités δij sont définies par<br />
ds 2 = δijdx i dx j = (dx 1 ) 2 + (dx 2 ) 2 + ... + ((dx n ) 2 . (A.26)<br />
δij = 1 si i = j, δij = 0 si i = j. (A.27)<br />
A.4 Espace-temps <strong>de</strong> Minkowski <strong>de</strong> dimension n<br />
Définition A.4.1 On appelle espace-temps <strong>de</strong> Minkowski <strong>de</strong> dimension n un espace euclidien<br />
à n dimensions muni d’une métrique η <strong>de</strong> signature 2 − n. La métrique η est appelée métrique<br />
<strong>de</strong> Minkowski.<br />
Un tel espace peut être noté (Mn,η), ou simplement (IR n ,η), selon le léger abus <strong>de</strong> langage<br />
signalé dans la sous-section 1.1. Les points d’un espace-temps <strong>de</strong> Minkowski <strong>de</strong> dimension 4<br />
sont souvent appelés points-événements pour une raison évi<strong>de</strong>nte.<br />
Dans un repère orthonormé arbitraire <strong>de</strong> (Mn,η), le carré <strong>de</strong> l’intervalle entre <strong>de</strong>ux points<br />
arbitraires x et y s’exprime sous la forme<br />
s 2 xy = (y 0 − x 0 ) 2 − (y 1 − x 1 ) 2 − ... − (y n−1 − x n−1 ) 2<br />
(A.28)<br />
en raison <strong>de</strong> la signature 2 − n. Pour insister sur le fait que la combinaison (A.28) ne contient<br />
qu’un signe +, on numérote <strong>de</strong> 0 à n−1 les indices relatifs aux coordonnées et aux composantes<br />
<strong>de</strong> vecteurs ou <strong>de</strong> tenseurs (au lieu <strong>de</strong> 1 à n, comme on le fait dans les autres espaces). On note<br />
que le numéro 0 correspond à la coordonnée “temporelle” et que les coordonnées x 1 ,x 2 ,...,x n−1<br />
sont “spatiales”. La métrique <strong>de</strong> l’espace-temps <strong>de</strong> Minkowski (Mn,η) s’écrit alors sous la forme<br />
ds 2 = (dx 0 ) 2 − (dx 1 ) 2 − ... − (dx n−1 ) 2 . (A.29)<br />
De plus, nous nous conformerons à l’usage consistant à représenter les indices susceptibles <strong>de</strong><br />
varier <strong>de</strong> 0 à n −1 par <strong>de</strong>s lettres grecques minuscules telles que α,β,γ,δ,λ,µ,ν,ρ,σ, etc. Ainsi<br />
133
x α signifie que l’on doit considérer l’ensemble <strong>de</strong>s n coordonnées x 0 ,x 1 ,...,x n−1 . En revanche,<br />
les indices susceptibles <strong>de</strong> prendre les valeurs 1, 2,...,n − 1 seront représentés par <strong>de</strong>s lettres<br />
latines minuscules telles que i,j,k,l,m,n, etc.<br />
Avec ces conventions, le carré <strong>de</strong> l’intervalle entre <strong>de</strong>ux points arbitraires x et y s’écrit par<br />
rapport à un repère orthonormé quelconque sous la forme particulièrement con<strong>de</strong>nsée<br />
où les coefficients ηαβ sont donnés par<br />
s 2 xy = ηαβ(y α − x α )(y β − x β ), (A.30)<br />
η00 = 1, η0i = ηi0 = 0, ηij = −δij. (A.31)<br />
La métrique <strong>de</strong> Minkowski (A.29) se réduit alors à l’expression<br />
comme on l’a vu en cours.<br />
ds 2 = ηαβdx α dx β , (A.32)<br />
134
Annexe B<br />
Analyse tensorielle<br />
B.1 Caractère non intrinsèque <strong>de</strong> la dérivation partielle<br />
usuelle<br />
Donnons-nous un champ <strong>de</strong> vecteurs contravariants arbitraire V , défini sur une région <strong>de</strong> la<br />
variété V4 ou sur V4 toute entière. On vérifie sans peine que les quantités ∂V µ /∂x α ne sont pas<br />
les composantes d’un tenseur mixte une fois covariant et une fois contravariant. Effectuons en<br />
effet une transformation <strong>de</strong> coordonnées arbitraire xα → xβ′ . Du fait que les V µ se transforment<br />
selon la loi<br />
les quantités ∂V ν′ /∂xγ′ sont données par<br />
V ν′<br />
∂V ν′<br />
∂x γ′ = ∂xα<br />
∂x γ′<br />
= ∂xν′<br />
∂x µ V µ ,<br />
∂<br />
∂xα <br />
ν ∂x ′ <br />
µ<br />
V . (B.1)<br />
∂x µ<br />
D’où la formule <strong>de</strong> transformation <strong>de</strong>s dérivées partielles <strong>de</strong>s composantes <strong>de</strong> V<br />
∂V ν′<br />
∂xγ′ = ∂xα<br />
∂xγ′ ∂xν′ ∂x µ<br />
∂V µ ∂xα<br />
+<br />
∂xα ∂xγ′ ∂ 2 x ν′<br />
∂x α ∂x µ V µ , (B.2)<br />
Lorsqu’on les compare aux équations (32) du chapitre précé<strong>de</strong>nt, les équations (B.2) montrent<br />
que les quantités ∂V µ /∂xα ne se transforment pas en général comme les composantes d’un ten-<br />
ν1...νl<br />
seur mixte <strong>de</strong> type (1, 1). Plus généralement, si Tµ1...µk<br />
est un tenseur <strong>de</strong> type (k,l), les<br />
ν1...νl<br />
quantités ∂Tµ1...µk<br />
/∂xα ne définissent pas un champ <strong>de</strong> tenseurs <strong>de</strong> type (k + 1,l). Un<br />
constat <strong>de</strong> même nature vaut pour les dérivées partielles ordinaires d’ordre supérieur à un.<br />
Il résulte <strong>de</strong> ce qui vient dit qu’on ne peut généralement pas considérer comme exprimant<br />
une loi physique <strong>de</strong>s équations égalant une dérivée partielle ordinaire d’un tenseur avec un autre<br />
tenseur. Supposons par exemple qu’on veuille formuler une loi sous la forme<br />
∂E µν<br />
∂x µ = Jν , (B.3)<br />
où E µν est un champ <strong>de</strong> tenseurs <strong>de</strong>ux fois contravariants représentant un champ physique<br />
créé par une source décrite par un vecteur contravariant J ν . Il est clair d’après ce qui a été<br />
135
dit plus haut que si l’équation (B.3) était satisfaite dans un système <strong>de</strong> coordonnées locales x α<br />
donné, elle ne pourrait l’être en général dans un autre système <strong>de</strong> coordonnées puisque le second<br />
membre se transforme comme les composantes d’un vecteur contravariant alors que le premier<br />
membre se transforme selon la formule (B.2). C’est pourquoi on ne peut retenir <strong>de</strong>s équations du<br />
type (B.3). On résout cette difficulté en définissant une nouvelle opération <strong>de</strong> dérivation partielle<br />
par rapport à x α qui donne un tenseur p +1 fois covariant et q fois contravariant lorsqu’elle est<br />
appliquée à un tenseur p fois covariant et q fois contravariant. Une telle opération est appelée<br />
une dérivation partielle covariante.<br />
B.2 Dérivation covariante<br />
Introduisons d’abord une notation très commo<strong>de</strong>. Soit Φ une fonction différentiable <strong>de</strong>s<br />
coordonnées xα . On posera<br />
∂µΦ = ∂Φ<br />
(B.4)<br />
pour désigner la dérivée partielle usuelle <strong>de</strong> Φ par rapport à x µ , et plus généralement, si Φ<br />
admet <strong>de</strong>s <strong>de</strong>rivées partielles d’ordre k :<br />
∂µ1...∂µkΦ =<br />
∂x µ<br />
∂x<br />
∂ k Φ<br />
µ1...∂x µk<br />
. (B.5)<br />
Définition B.2.1 Une dérivation partielle covariante par rapport à xα est une opération sur<br />
les champs <strong>de</strong> tenseurs notée ∇α possédant les propriétés suivantes :<br />
1) A tout champ <strong>de</strong> tenseurs k fois covariants et l fois contravariants <strong>de</strong> composantes<br />
ν1...νl Tµ1...µk<br />
, ∇α fait correspondre un champ <strong>de</strong> tenseurs k + 1 fois covariants et l fois contra-<br />
ν1...νl<br />
variants dont les composantes sont notées ∇αTµ1...µk<br />
.<br />
2) Si T et U sont tous <strong>de</strong>ux <strong>de</strong>s champs <strong>de</strong> tenseurs <strong>de</strong> type (k,l),<br />
<br />
<br />
ν1...νl ν1...νl<br />
ν1...νl<br />
ν1...νl<br />
∇α T + U = ∇αT + ∇αUµ1...µk<br />
. (B.6)<br />
µ1...µk<br />
µ1...µk<br />
µ1...µk<br />
3) ∇α obéit à la règle <strong>de</strong> Leibniz, i.e. si T et U sont <strong>de</strong>s champs <strong>de</strong> tenseurs <strong>de</strong> types<br />
respectifs (k,l) et (r,s), alors<br />
<br />
<br />
ν1...νl σ1...σs<br />
∇α Tµ1...µk<br />
.Uρ1...ρr<br />
<br />
<br />
ν1...νl<br />
σ1...σs<br />
= T ∇αU + <br />
<br />
ν1...νl σ1...σs<br />
∇αT U . (B.7)<br />
µ1...µk<br />
ρ1...ρr<br />
µ1...µk<br />
4) Pour toute fonction différentiable f sur Vn, ∇α se réduit à la dérivée partielle ordinaire<br />
par rapport à x α :<br />
∇αf = ∂αf. (B.8)<br />
5) Pour un champ <strong>de</strong> vecteurs contravariants arbitraire V µ , ∇αV µ est un champ <strong>de</strong> tenseurs<br />
mixtes <strong>de</strong> type (1,1) <strong>de</strong> la forme<br />
ρ1...ρr<br />
∇αV µ = ∂αV µ + Γ µ<br />
αβ V β , (B.9)<br />
où les coefficients Γ µ<br />
αβ constituent un système <strong>de</strong> n3 quantités dépendant uniquement <strong>de</strong>s coordonnées<br />
locales.<br />
136
Notons que les propriétés 3) et 4) entraînent que ∇α est un opérateur linéaire. En effet, si T<br />
et U sont tous <strong>de</strong>ux <strong>de</strong>s tenseurs <strong>de</strong> type (k,l) et si λ et µ sont <strong>de</strong>s constantes, on a en raison<br />
<strong>de</strong> la règle <strong>de</strong> Leibniz et <strong>de</strong> ∇αλ = ∇αµ = 0 :<br />
<br />
<br />
ν1...νl<br />
ν1...νl<br />
ν1...νl<br />
ν1...νl<br />
∇α λ T + µ U = λ ∇αT + µ ∇αUµ1...µk<br />
. (B.10)<br />
µ1...µk<br />
µ1...µk<br />
µ1...µk<br />
B.3 Expression explicite <strong>de</strong> la dérivée covariante d’un<br />
champ <strong>de</strong> tenseurs arbitraire<br />
Les propriétés ci-<strong>de</strong>ssus suffisent pour donner l’expression explicite <strong>de</strong> la dérivée covariante<br />
<strong>de</strong> n’importe quel champ <strong>de</strong> tenseurs.<br />
Dérivée covariante d’un champ <strong>de</strong> vecteurs covariants.— Soit Wµ un champ <strong>de</strong><br />
vecteurs covariants. Si V µ est un champ <strong>de</strong> vecteurs contravariants arbitraire, on peut écrire<br />
en appliquant les règles 3) et 5) :<br />
∇α(V µ Wµ) = V µ ∇αWµ + (∇αV µ )Wµ = V µ ∇αWµ + Wµ(∂αV µ + Γ µ<br />
αβ V β ). (B.11)<br />
Mais l’expression contractée V µ Wµ est une fonction scalaire sur la variété V4. En conséquence,<br />
on peut écrire d’après la propriété 4) :<br />
∇α(V µ Wµ) = ∂α(V µ Wµ) = V µ ∂αWµ + Wµ∂αV µ . (B.12)<br />
En comparant les troisièmes membres <strong>de</strong> (B.11) et (B.12), on voit qu’on a<br />
V µ ∇αWµ = V µ (∂αWµ − Γ ρ αµWρ)<br />
pour tout champ <strong>de</strong> vecteurs V µ . Il en résulte immédiatement que ∇αWµ est donnée par la<br />
relation<br />
∇αWµ = ∂αWµ − Γ ρ αµWρ . (B.13)<br />
Dérivée covariante d’un champ <strong>de</strong> tenseurs d’ordre <strong>de</strong>ux.— Soit T µν un champ <strong>de</strong><br />
tenseurs <strong>de</strong>ux fois contravariants. La multiplication contractée <strong>de</strong> ce champ <strong>de</strong> tenseurs par un<br />
champ <strong>de</strong> vecteurs covariants Wµ arbitraire fournit un champ <strong>de</strong> vecteurs covariants T µν Wµ<br />
dont on sait maintenant former la dérivation covariante par rapport à x α . Un raisonnement en<br />
tout point analogue à celui que nous avons fait ci-<strong>de</strong>ssus nous conduit à l’expression suivante :<br />
∇αT µν = ∂αT µν + Γ µ<br />
αβ T βν + Γ ν αβT µβ . (B.14)<br />
De même, on trouve pour un champ <strong>de</strong> tenseurs <strong>de</strong>ux fois covariants Tµν :<br />
Enfin, pour un champ <strong>de</strong> tenseurs mixtes T ν<br />
µ :<br />
∇αTµν = ∂αTµν − Γ ρ αµTρν − Γ ρ ανTµρ. (B.15)<br />
∇αT ν<br />
µ = ∂αT ν<br />
µ + Γ ν αβT β<br />
µ − Γ ρ αµT ν<br />
ρ . (B.16)<br />
Plus généralement, on a le théorème fondamental qui suit.<br />
137
Théorème B.3.1 La dérivée covariante d’un champ <strong>de</strong> tenseurs k fois covariants et l fois<br />
contravariants T ν1ν2...νl arbitraire a pour expression en coordonnées locales :<br />
∇αT<br />
µ1µ2...µk<br />
ν1ν2...νl<br />
µ1µ2...µk<br />
+Γ ν1<br />
= ∂αT<br />
σν2...νl<br />
ασTµ1µ2...µk<br />
ν1ν2...νl<br />
µ1µ2...µk<br />
+ Γ ν2<br />
ν1σ...νl<br />
ασTµ1µ2...µk<br />
+ ... + Γ νl<br />
ν1ν2...σ<br />
ασTµ1µ2...µk<br />
−Γ ρ αµ1T ν1ν2...νl<br />
ρµ2...µk − Γ ρ αµ2T ν1ν2...νl<br />
µ1ρ...µk − ... − Γ ρ αµkT ν1ν2...νl<br />
µ1µ2...ρ . (B.17)<br />
On notera le signe + chaque fois que l’indice <strong>de</strong> contraction dans les composantes <strong>de</strong> T est<br />
contravariant et le signe − chaque fois que l’indice <strong>de</strong> contraction est covariant.<br />
Remarque.— Il faut impérativement gar<strong>de</strong>r l’ordre <strong>de</strong>s indices dans les formules explicitant<br />
les dérivées covariantes. Ainsi, on n’a pas le droit d’écrire<br />
∇αV µ = ∂αV µ + Γ µ<br />
βα V β ,<br />
hormis dans le cas où Γ µ<br />
αβ = Γµ βα (cas d’une connexion symétrique, voir ci-<strong>de</strong>ssous, sect. 3).<br />
Corollaire B.3.1 La dérivée covariante du champ <strong>de</strong> tenseurs <strong>de</strong> Kronecker δ ν µ est nulle :<br />
En effet, (B.16) et ∂αδ ν µ = 0 entraînent que<br />
∇αδ ν µ = 0. (B.18)<br />
∇αδ ν µ = Γ ν αβδ β<br />
µ − Γ ρ αµδ ν<br />
ρ = Γ ν αµ − Γ ν αµ = 0, CQFD.<br />
Il résulte du corollaire B.3.1 et <strong>de</strong> la règle <strong>de</strong> Leibniz que l’opérateur <strong>de</strong> dérivation covariante<br />
∇α est “perméable” pour le tenseur <strong>de</strong> Kronecker. Ainsi, on a par ex. pour tout tenseur<br />
ν1...νq Tµ1...µp<br />
:<br />
<br />
∇α δ σ <br />
ν1...νq<br />
ρ T = δ σ ν1...νq<br />
ρ ∇αTµ1...µp<br />
. (B.19)<br />
µ1...µp<br />
B.4 Connexion linéaire<br />
Définition B.4.1 L’ensemble <strong>de</strong>s n3 quantités Γ µ<br />
αβ entrant dans l’expression d’une dérivation<br />
covariante définit une connexion linéaire sur la variété différentielle V4.<br />
Se donner une loi <strong>de</strong> dérivation covariante sur une variété équivaut donc à se donner une<br />
connexion linéaire. Pour cette raison, on donne aux fonctions Γ µ<br />
αβ (xρ ) le nom <strong>de</strong> coefficients<br />
<strong>de</strong> la connexion linéaire dans le système <strong>de</strong> coordonnées locales xρ . Bien entendu, il ne faut<br />
jamais perdre <strong>de</strong> vue que ces coefficients sont liés à la dérivation covariante ∇α utilisée : une<br />
dérivation covariante ∇α différente <strong>de</strong> ∇α induit <strong>de</strong>s coefficients <strong>de</strong> connexion Γ µ<br />
αβ (xρ ) différents<br />
<strong>de</strong>s Γ µ<br />
αβ (xρ ).<br />
138
par changement <strong>de</strong> coordonnées locales.—<br />
Les quantités ∇αV µ doivent se transformer comme les composantes d’un tenseur mixte <strong>de</strong> type<br />
(1, 1) lorqu’on effectue la transformation <strong>de</strong> coordonnées locales xα → xβ′ . Cette condition<br />
détermine complètement la loi <strong>de</strong> transformation <strong>de</strong>s coefficients Γ µ<br />
αβ , qui est donnée par le<br />
théorème qui suit.<br />
Transformation <strong>de</strong>s coefficients Γ µ<br />
αβ<br />
Théorème B.4.1 Lors d’une transformation <strong>de</strong> coordonnées xα → xβ′ , les coefficients Γ µ<br />
αβ se<br />
transforment selon la loi<br />
Γ ν′<br />
γ ′ ∂xα<br />
ǫ ′ =<br />
∂xγ′ qui peut encore s’écrire sous la forme<br />
Γ ν′<br />
γ ′ ∂xα<br />
ǫ ′ =<br />
∂xγ′ ∂x β<br />
∂x ǫ′<br />
∂x β<br />
∂x ǫ′<br />
∂xν′ ∂xα<br />
Γµ<br />
∂x µ αβ −<br />
∂xγ′ ∂x β<br />
∂x ǫ′<br />
∂xν′ Γµ<br />
∂x µ αβ + ∂2xρ ∂xγ′ ∂xǫ′ ∂2xν′ ∂xα , (B.20)<br />
∂xβ ∂xν′ . (B.21)<br />
∂xρ En échangeant le rôle joué par les coordonnées locales xα et xγ′ , les formules (B.20) et (B.21)<br />
donnent évi<strong>de</strong>mment les formules <strong>de</strong> transformation<br />
et<br />
Γ µ ∂xγ′<br />
αβ =<br />
∂xα Γ µ ∂xγ′<br />
αβ =<br />
∂xα ∂x ǫ′<br />
∂x β<br />
∂x ǫ′<br />
∂x β<br />
∂x µ<br />
∂xν′ Γ ν′<br />
γ ′ ∂xγ′<br />
ǫ ′ −<br />
∂xα ∂x ǫ′<br />
∂x β<br />
∂x µ<br />
∂x ν′ Γ ν′<br />
γ ′ ǫ ′ + ∂2 x σ′<br />
∂x α ∂x β<br />
∂ 2 x µ<br />
∂x γ′ ∂x ǫ′<br />
(B.22)<br />
∂x µ<br />
∂x σ′ . (B.23)<br />
Démonstration.– La dérivation partielle covariante d’un vecteur contravariant <strong>de</strong>vant définir<br />
un tenseur mixte <strong>de</strong> type (1, 1), les coefficients Γ µ<br />
αβ doivent se transformer <strong>de</strong> telle sorte que les<br />
relations<br />
ν′<br />
∂γ ′V + Γ ν′<br />
γ ′ δ′<br />
δ ′V = ∂xα<br />
∂xγ′ ∂xν′ ∂x µ<br />
<br />
∂αV µ + Γ µ<br />
αβV β<br />
(B.24)<br />
soint satisfaites pour un vecteur V µ arbitraire. Substituons la loi <strong>de</strong> transformation (B.2) dans<br />
l’éq. (B.24). Il vient :<br />
∂x α<br />
∂x γ′<br />
∂x ν′<br />
∂x µ ∂αV µ + ∂xα<br />
∂x γ′<br />
= ∂xα<br />
∂x γ′<br />
∂ 2 x ν′<br />
∂xα∂x µ V µ + Γ ν′<br />
γ ′ δ′<br />
δ ′V<br />
∂xν′ ∂x µ ∂αV µ + ∂xα<br />
∂xγ′ ∂xν′ Γµ<br />
∂x µ αβV β ,<br />
soit après simplification et changement <strong>de</strong> certains indices muets<br />
Γ ν′<br />
γ ′ δ′<br />
δ ′V = ∂xα<br />
∂xγ′ ∂xν′ Γµ<br />
∂x µ αβV β − ∂xα<br />
∂xγ′ Substituons maintenant V δ′<br />
tisfaite pour tout vecteur V β , on a nécessairement<br />
∂ 2 x ν′<br />
∂x α ∂x β V β . (B.25)<br />
= ∂xδ′ /∂xβV β dans (B.25). L’égalité obtenue <strong>de</strong>vant être sa-<br />
∂xδ′ Γν′<br />
∂xβ γ ′ ∂xα<br />
δ ′ =<br />
∂xγ′ ∂xν′ ∂xα<br />
Γµ<br />
∂x µ αβ −<br />
∂xγ′ 139<br />
∂2xν′ ∂xα . (B.26)<br />
∂xβ
Effectuons la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (B.26) par ∂xβ /∂xǫ′ . Compte<br />
tenu <strong>de</strong>s formules (19) du chapitre précé<strong>de</strong>nt, on obtient la loi <strong>de</strong> transformation (B.20).<br />
On peut écrire (B.20) sous une forme légèrement différente. La relation<br />
donne en effet par différentiation :<br />
∂<br />
∂xα <br />
β ∂x<br />
∂xǫ′ ∂x β<br />
∂x ǫ′<br />
∂xν′ ∂xβ <br />
≡ ∂xβ<br />
∂xǫ′ ∂xν′ = δν′<br />
∂xβ ǫ ′<br />
∂ 2 x ν′<br />
∂x α ∂x β + ∂2 x β<br />
∂x α ∂x ǫ′<br />
d’où on déduit après multiplication contractée par ∂x α /∂x γ′<br />
∂x α<br />
∂x γ′<br />
∂x β<br />
∂x ǫ′<br />
∂2xν′ ∂xα ∂xα<br />
= −<br />
∂xβ ∂xγ′ ∂ 2 x β<br />
∂x α ∂x ǫ′<br />
∂xν′ = 0,<br />
∂xβ ∂x ν′<br />
∂x β = − ∂2 x ρ<br />
∂x γ′ ∂x ǫ′<br />
∂xν′ . (B.27)<br />
∂xρ Compte tenu <strong>de</strong> (B.27), la formule <strong>de</strong> transformation (B.20) prend la forme (B.21). C.Q.F.D.<br />
B.5 Conséquences fondamentales <strong>de</strong>s formules <strong>de</strong> transformation<br />
<strong>de</strong>s coefficients <strong>de</strong> connexion<br />
1) Les formules <strong>de</strong> transformation obtenues dans la section précé<strong>de</strong>nte montrent qu’il suffit<br />
<strong>de</strong> se donner n3 fonctions arbitraires Γ µ<br />
αβ (x) dans un système <strong>de</strong> coordonnées locales lui-même<br />
arbitrairement choisi pour définir une connexion sur V4. En effet, les lois <strong>de</strong> transformation (B.20<br />
ou (B.21) permettent le calcul explicite <strong>de</strong>s coefficients <strong>de</strong> la connexion dans <strong>de</strong>s coordonnées<br />
locales xβ′ si on connaît explicitement les xβ′ en fonction <strong>de</strong>s xα . De plus, nous n’avons trouvé<br />
aucune contrainte sur les fonctions Γ µ<br />
αβ (x) <strong>de</strong> départ. Il en résulte qu’il existe une infinité <strong>de</strong><br />
connexions distinctes sur une variété donnée.<br />
2) Les coefficients Γ µ<br />
αβ ne se transforment pas comme les composantes d’un tenseur une fois<br />
contravariant et <strong>de</strong>ux fois covariant lors d’une transformation générale <strong>de</strong> coordonnées locales.<br />
On notera toutefois que les relations (B.21)-(B.23) se réduisent aux règles <strong>de</strong> transformation<br />
tensorielles lorsque les coordonnées xγ′ sont <strong>de</strong>s fonctions affines <strong>de</strong>s xα , i.e. lorsque<br />
les quantités Aγ′ α et bγ′ équivalentes aux relations<br />
qui entraînent<br />
d’après (B.23).<br />
x γ′<br />
= A γ′<br />
α x α + b γ′<br />
, (B.28)<br />
étant <strong>de</strong>s constantes arbitraires. Les équations (B.28) sont en effet<br />
Γ µ ∂xγ′<br />
αβ =<br />
∂xα ∂2xσ′ ∂xα = 0<br />
∂xβ ∂x ǫ′<br />
∂x β<br />
140<br />
∂x µ<br />
∂x ν′ Γ ν′<br />
γ ′ ǫ ′
3) La différence <strong>de</strong>s coefficients <strong>de</strong> <strong>de</strong>ux connexions est toujours un tenseur une fois contravariant<br />
et <strong>de</strong>ux fois covariant. On formera donc n’importe quelle connexion sur V4 en ajoutant<br />
un tenseur une fois contravariant et <strong>de</strong>ux fois covariant arbitraire à une connexion elle-même<br />
arbitrairement choisie. On retrouve ainsi qu’il existe une infinité <strong>de</strong> connexions linéaires sur une<br />
variété.<br />
4) L’égalité Γ µ<br />
αβ<br />
= Γµ<br />
βα<br />
entraîne Γν′ γ ′ ǫ ′ = Γν′ ǫ ′ γ ′. On dit qu’une connexion linéaire possédant<br />
cette propriété est symétrique. On dit encore pour <strong>de</strong>s raisons que nous n’expliciterons pas ici<br />
que cette connexion est sans torsion (ou <strong>de</strong> torsion nulle). Cette propriété est importante car<br />
nous verrons que la connexion utilisée dans les théories métriques est un connexion symétrique<br />
particulière (connexion dite riemannienne, définie dans le chapitre suivant).<br />
Les connexions symétriques vérifient l’important théorème suivant.<br />
Théorème B.5.1 Soient Γ µ<br />
αβ les coefficients d’une connexion symétrique arbitraire et x0 un<br />
point arbitrairement fixé sur la variété. Il est toujours possible <strong>de</strong> choisir un système <strong>de</strong> coordonnées<br />
locales xβ′ <br />
au voisinage <strong>de</strong> x0 tel que tous les coefficients <strong>de</strong> la connexion<br />
symétrique considérée soient nuls au point x0.<br />
<br />
Γ ν′<br />
γ ′ ǫ ′<br />
Démonstration.— Soit xα un système <strong>de</strong> coordonnées locales arbitraire au voisinage du point<br />
x0. Dans ce système, les coefficients <strong>de</strong> la connexion symétrique Γ prennent les valeurs <br />
Γ µ<br />
<br />
αβ<br />
0<br />
au point x0 = (xα 0). Effectuons la transformation <strong>de</strong> coordonnées définie par<br />
En raison <strong>de</strong> la symétrie <strong>de</strong> <br />
Γ µ<br />
αβ<br />
d’où on déduit : ∂ 2 x ν ′<br />
En outre, on a d’après (B.30) :<br />
ce qui entraîne <br />
α ∂x<br />
<br />
Γ µ<br />
<br />
αβ (x<br />
x0<br />
α′<br />
− x α )(x β′<br />
− x β ). (B.29)<br />
x µ′<br />
= x µ + 1<br />
2<br />
<br />
par rapport à α et β, on a :<br />
∂x γ′<br />
0<br />
∂xν′ ∂xβ = δν β + <br />
Γ ν<br />
<br />
λβ (x<br />
x0<br />
λ − x λ 0), (B.30)<br />
x0<br />
∂x α ∂x β<br />
<br />
x0<br />
<br />
µ ∂x ′ <br />
∂x ρ<br />
= δ α γ ′ ,<br />
x0<br />
= <br />
Γ ν<br />
<br />
αβ<br />
x0<br />
x0<br />
. (B.31)<br />
= δ µ ρ , (B.32)<br />
<br />
β ∂x<br />
∂x ǫ′<br />
x0<br />
= δ β<br />
ǫ ′ . (B.33)<br />
Substituons (B.31) et (B.33) dans la loi <strong>de</strong> transformation (B.20) écrite en x0 pour la<br />
connexion Γ. Il vient<br />
<br />
Γ ν′<br />
γ ′ ǫ ′<br />
<br />
= δ<br />
x0<br />
α γ δ β ǫ δ ν µ<br />
<br />
Γ µ<br />
<br />
αβ − δ<br />
x0<br />
α γ δ β ǫ<br />
141<br />
<br />
Γ ν<br />
<br />
αβ = 0, (B.34)<br />
x0
ce qui achève la démonstration.<br />
On notera que la transformation <strong>de</strong> coordonnées (B.29) ne change pas la valeur numérique<br />
<strong>de</strong>s composantes <strong>de</strong>s tenseurs au point x0 puisque les coefficients <strong>de</strong> transformation en ce point<br />
sont donnés par les éléments <strong>de</strong> matrice (B.32) et (B.33). On remarquera également que l’on a<br />
xα′ 0 = xα 0.<br />
La dérivée covariante partielle <strong>de</strong>s tenseurs en x0 associée à la connexion Γ possè<strong>de</strong> une<br />
expression particulièrement simple dans le système <strong>de</strong> coordonnées locales x µ′ défini par (B.29).<br />
Compte tenu <strong>de</strong> (B.34), il vient en effet pour un tenseur <strong>de</strong>ux fois contravariant par exemple<br />
<br />
∇α ′T µ′ ν ′<br />
x0<br />
= <br />
∂α ′T µ′ ν ′<br />
x0<br />
. (B.35)<br />
L’égalité <strong>de</strong> la dérivation covariante avec la dérivation partielle usuelle est très utile pour<br />
démontrer certaines i<strong>de</strong>ntités tensorielles. Toutefois, on se gar<strong>de</strong>ra bien entendu d’écrire que les<br />
équations (B.35) sont vraies dans un système <strong>de</strong> coordonnées locales arbitraire !<br />
B.6 Dérivée covariante totale le long d’une courbe<br />
Dans <strong>de</strong> nombreuses applications physiques (dynamique <strong>de</strong>s particules, mécanique <strong>de</strong> flui<strong>de</strong>s,<br />
relativité, ...), on a besoin <strong>de</strong> la dérivée totale d’un champ <strong>de</strong> vecteurs ou <strong>de</strong> tenseurs le long<br />
d’une courbe paramétrée. L’exemple le plus simple est le vecteur accélération d’une particule<br />
qu’on définit comme la dérivée covariante totale du vecteur vitesse le long <strong>de</strong> la ligne d’univers<br />
<strong>de</strong> la particule paramétrée par le temps propre.<br />
La dérivée totale doit être caractérisée d’une manière intrinsèque. C’est pourquoi on adopte<br />
la définition suivante, qui généralise la dérivée totale usuelle d’une fonction le long d’une courbe.<br />
Définition B.6.1 Soit C une courbe différentiable λ → C(λ) d’équations paramétriques<br />
x α = x α (λ). (B.36)<br />
Soit ˙x α = dxα /dλ le vecteur tangent à la courbe C. On appelle dérivée covariante totale d’un<br />
champ <strong>de</strong> tenseurs T <strong>de</strong> type (k,l) le long <strong>de</strong> C le tenseur <strong>de</strong> type (k,l) noté ∇<br />
dλ T ν1ν2...νl<br />
µ1µ2...µk<br />
et défini en chaque point x(λ) <strong>de</strong> C par les équations<br />
∇<br />
dλ T<br />
ν1ν2...νl<br />
µ1µ2...µk<br />
= ˙x α ν1ν2...νl<br />
∇αTµ1µ2...µk<br />
. (B.37)<br />
ν1ν2...νl<br />
Les quantités ∇αTµ1µ2...µk<br />
sont données par le second membre <strong>de</strong> la formule (B.17).<br />
Les composantes du champ <strong>de</strong> tenseurs T sur la courbe C peuvent être considérées comme<br />
<strong>de</strong>s fonctions du paramètre λ que l’on supposera toujours différentiables. On peut alors poser<br />
˙x α ∂αT<br />
ν1ν2...νl<br />
µ1µ2...µk<br />
= d<br />
dλ T<br />
ν1ν2...νl<br />
µ1µ2...µk , (B.38)<br />
la dérivée totale figurant dans le second membre étant prise le long <strong>de</strong> la courbe C. Il écoule<br />
alors <strong>de</strong> (B.38) et <strong>de</strong> (B.17) que si <strong>de</strong>ux champs <strong>de</strong> tenseurs du même type T et U coïnci<strong>de</strong>nt<br />
sur la courbe C, alors<br />
∇<br />
dλ T<br />
ν1ν2...νs<br />
µ1µ2...µr = ∇<br />
dλ U<br />
ν1ν2...νs<br />
µ1µ2...µr<br />
(B.39)<br />
142
en tout point <strong>de</strong> C. En d’autres termes, la dérivée covariante totale d’un champ <strong>de</strong> tenseurs T<br />
le long d’une courbe C ne dépend que <strong>de</strong>s valeurs <strong>de</strong> T sur la courbe C.<br />
Il résulte <strong>de</strong> (B.38) qu’on peut définir la dérivée covariante totale d’un tenseur qui est<br />
donné seulement sur une courbe paramétrée. Ainsi, par exemple, S µν étant un tenseur <strong>de</strong>ux fois<br />
contravariant défini en chaque point <strong>de</strong> C, on pose<br />
∇S µν<br />
dλ<br />
= dSµν<br />
dλ<br />
Pour un champ <strong>de</strong> vecteurs contravariants, on a simplement :<br />
relation que l’on peut encore écrire sous la forme :<br />
+ <br />
Γ µ<br />
αβ Sβν + Γ ν αβS µβ<br />
˙x α . (B.40)<br />
∇V µ<br />
dλ ≡ ˙xα ∇αV µ = ˙x α ∂αV µ + Γ µ<br />
αβ ˙xα V β , (B.41)<br />
∇V µ<br />
dλ<br />
= dV µ<br />
dλ<br />
+ Γµ<br />
αβ ˙xα V β . (B.42)<br />
La relation (B.42) fournit également la dérivée covariante totale d’un vecteur contravariant<br />
V que l’on a seulement défini sur C.<br />
Pour un champ <strong>de</strong> vecteurs covariants φ :<br />
∇φµ<br />
dλ ≡ ˙xα ∇αφµ = ˙x α ∂αφµ − Γ ρ αµ ˙x α φρ, (B.43)<br />
soit encore<br />
∇φµ dφµ<br />
=<br />
dλ dλ − Γραµ ˙x α φρ. (B.44)<br />
Cette <strong>de</strong>rnière relation donne aussi la dérivée covariante totale d’un vecteur covariant seulement<br />
défini sur C.<br />
B.7 Transport par parallélisme le long d’une courbe<br />
La notion <strong>de</strong> dérivée covariante totale d’un tenseur permet <strong>de</strong> définir le transport par parallélisme<br />
d’un champ <strong>de</strong> tenseurs le long d’une courbe. Nous allons nous restreindre au cas <strong>de</strong>s<br />
champs <strong>de</strong> vecteurs, le plus souvent rencontré.<br />
Cas <strong>de</strong>s vecteurs contravariants.— Pour les vecteurs contravariants, la définition du<br />
transport par parallélisme s’énonce comme suit.<br />
Définition B.7.1 Un champ <strong>de</strong> vecteurs contravariants V est dit transporté par parallélisme<br />
le long <strong>de</strong> la courbe C si sa dérivée covariante totale le long <strong>de</strong> C est nulle, i.e. si<br />
en chaque point <strong>de</strong> C.<br />
∇V µ<br />
dλ ≡ ˙xα ∇αV µ = 0 (B.45)<br />
143
D’après ce que nous avons vu dans la section 4, la condition <strong>de</strong> transport par parallélisme<br />
d’un vecteur contravariant V le long <strong>de</strong> la courbe C s’exprime par le système d’équations<br />
différentielles suivant :<br />
dV µ<br />
dλ<br />
+ Γµ<br />
αβ ˙xα V β = 0. (B.46)<br />
Cas <strong>de</strong>s vecteurs covariants.– La transposition aux vecteurs covariants est immédiate.<br />
Définition B.7.2 Un champ <strong>de</strong> vecteurs covariants φ est dit transporté par parallélisme le long<br />
<strong>de</strong> la courbe C si sa dérivée covariante totale le long <strong>de</strong> C est nulle, i.e. si<br />
en chaque point <strong>de</strong> C.<br />
∇φµ<br />
dλ ≡ ˙xα ∇αVµ = 0 (B.47)<br />
La condition <strong>de</strong> transport par parallélisme d’un vecteur covariant φ le long <strong>de</strong> C est donc<br />
donnée par le système d’équations différentielles<br />
que l’on comparera au système (B.46).<br />
dφµ<br />
dλ − Γρ αµ ˙x α φρ = 0, (B.48)<br />
B.8 Courbes autoparallèles d’une connexion<br />
La notion <strong>de</strong> tranport par parallélisme permet d’associer à chaque connexion une famille <strong>de</strong><br />
courbes appelées courbes autoparallèles, qui constituent la généralisation <strong>de</strong> la ligne droite <strong>de</strong> la<br />
géométrie affine usuelle. De ce fait, elles sont les candidates les plus naturelles pour s’i<strong>de</strong>ntifier<br />
aux lignes d’univers <strong>de</strong>s particules en chute libre dans un champ <strong>de</strong> gravitation.<br />
Définition B.8.1 Une courbe C : λ → C(λ) est dite autoparallèle si son vecteur tangent<br />
˙x α = dx α /dλ est tranporté par parallélisme le long d’elle-même, i.e. si les fonctions x α (λ)<br />
sont solution <strong>de</strong>s équations différentielles<br />
∇ ˙x µ<br />
dλ ≡ d2x µ dx<br />
+ Γµ<br />
dλ2 αβ<br />
α dx<br />
dλ<br />
β<br />
dλ<br />
= 0. (B.49)<br />
On voit immédiatement sur les éqs. (B.49) que les courbes autoparallèles sont déterminées<br />
uniquement par la partie symétrique <strong>de</strong> la connexion définie par<br />
puisqu’on a <strong>de</strong> manière évi<strong>de</strong>nte<br />
Γ µ<br />
αβ = 1 <br />
Γ<br />
2<br />
µ<br />
<br />
αβ + Γµ βα<br />
Γ µ<br />
αβ ˙xα ˙x β ≡ Γ µ<br />
αβ ˙x α ˙x β .<br />
Il s’ensuit immédiatement le théorème suivant.<br />
144<br />
(B.50)
Théorème B.8.1 Deux connexions linéaires ayant la même partie symétrique ont <strong>de</strong>s courbes<br />
autoparallèles i<strong>de</strong>ntiques.<br />
Il est équivalent <strong>de</strong> dire que les courbes autoparallèles d’une connexion sont déterminées uniquement<br />
par la partie symétrique <strong>de</strong> cette connexion (ou encore que la torsion d’une connexion<br />
n’a aucun influence sur ses courbes autoparallèles). Cette propriété joue un rôle fondamental<br />
dans le choix <strong>de</strong> connexion que l’on fait habituellement pour décrire l’influence <strong>de</strong> la gravitation<br />
sur une particule en chute libre.<br />
145
Annexe C<br />
Connexion et courbure sur une variété<br />
riemannienne<br />
Dans le chapitre précé<strong>de</strong>nt, nous avons exposé les bases <strong>de</strong> l’analyse tensorielle sur une<br />
variété V4 sans faire intervenir la notion <strong>de</strong> métrique qui avait été introduite dans le premier<br />
chapitre. Ici au contraire, nous supposons <strong>de</strong> façon essentielle que V4 est une variété munie<br />
d’une métrique g. On se souvient que le doublet (V4,g) est appelé une variété riemannienne.<br />
L’importance <strong>de</strong> ces espaces est primordiale en physique puisque les espaces-temps utilisés en<br />
relativité sont <strong>de</strong>s variétés riemanniennes particulières, dites lorentziennes.<br />
C.1 Connexion riemannienne<br />
Nous allons tout d’abord énoncer et démontrer le théorème d’existence et d’unicité qui<br />
“légitime” en quelque sorte les théories métriques <strong>de</strong> la gravitation.<br />
Théorème C.1.1 Sur une variété riemannienne (V4,g), il existe une et une seule connexion<br />
linéaire qui soit symétrique et qui préserve la valeur du produit scalaire <strong>de</strong> <strong>de</strong>ux vecteurs V et<br />
W transportés par parallélisme le long d’une courbe différentiable arbitraire. Les coefficients <strong>de</strong><br />
cette connexion s’écrivent en coordonnées locales<br />
où les quantités { ρ µν} sont définies par :<br />
Γ ρ µν = { ρ µν}, (C.1)<br />
{ ρ µν} = 1<br />
2 gρσ (∂µgνσ + ∂νgσµ − ∂σgµν). (C.2)<br />
La connexion déterminée par (C.1) et (C.2) s’appelle la connexion riemannienne <strong>de</strong> l’espacetemps<br />
(V4,g).<br />
Démonstration.— Supposons qu’une connexion Γ soit symétrique et vérifie la condition1 ∀V µ ∀W ν<br />
∇V µ<br />
ν <br />
∇W<br />
= 0 et = 0 =⇒<br />
dλ dλ d<br />
dλ (gµνV µ W ν <br />
) = 0 (C.3)<br />
1 Une connexion qui possè<strong>de</strong> la propriété (C.3) est appelée une connexion métrique. La connexion riemannienne<br />
est donc l’unique connexion qui soit à la fois métrique et symétrique.<br />
146
le long <strong>de</strong> n’importe quelle courbe C définie par les équations paramétriques<br />
x α = x α (λ) (C.4)<br />
en coordonnées locales xρ . Du fait que gµνV µ W ν est une quantité scalaire, sa dérivée totale<br />
usuelle peut être remplacée par sa dérivée covariante totale. Il vient donc en tenant compte <strong>de</strong><br />
(C.3) :<br />
d<br />
dλ (gµνV µ W ν ) = ∇<br />
dλ (gµνV µ W ν ) = ˙x λ ∇λgµνV µ W ν = 0. (C.5)<br />
L’équation (C.5) <strong>de</strong>vant être vali<strong>de</strong> quels que soient ˙x λ , V µ et W ν , il faut que les équations<br />
soient satisfaites en tout point. On a donc nécessairement<br />
∇λgµν = 0 (C.6)<br />
∇λgµν − ∇µgνλ − ∇νgλµ = 0. (C.7)<br />
Explicitons les relations (C.7) en utilisant l’équation (15) du chapitre II. Il vient, en tenant<br />
compte <strong>de</strong>s symétries <strong>de</strong> gµν et <strong>de</strong> Γ σ µν par rapport aux indices µ et ν :<br />
∇λgµν − ∇µgνλ − ∇νgλµ = ∂λgµν − Γ σ λµgσν − Γ σ λνgµσ − ∂µgνλ + Γ σ µνgσλ + Γ σ µλgνσ<br />
La <strong>de</strong>rnière ligne <strong>de</strong> (C.8) s’écrit encore<br />
−∂ν + Γ σ νλgσµ + Γ σ νµgλσ<br />
= 2Γ σ µνgλσ + ∂λgµν − ∂µgνλ − ∂νgλµ = 0. (C.8)<br />
Γ σ µνgλσ = 1<br />
2 (∂µgνλ + ∂νgλµ − ∂λgµν) . (C.9)<br />
La multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (C.9) par g λρ donne finalement, compte<br />
tenu <strong>de</strong> g λρ gλσ = δ ρ σ :<br />
Γ ρ µν = 1<br />
2 gρσ (∂µgνσ + ∂νgσµ − ∂σgµν) ≡ { ρ µν}. (C.10)<br />
Nous venons <strong>de</strong> démontrer l’unicité <strong>de</strong> la connexion riemannienne. Réciproquement, il est<br />
aisé <strong>de</strong> vérifier que la connexion définie par (C.10) vérifie (C.6). En utilisant l’équation (C.10)<br />
et la formule (15) du chapitre II, on obtient en effet les i<strong>de</strong>ntités :<br />
ce qui achève la démonstration.<br />
∂λgµν − { ρ<br />
λµ }gρν − { ρ<br />
λν }gµρ ≡ 0, (C.11)<br />
Les quantités { ρ µν} sont les symboles <strong>de</strong> Christoffel <strong>de</strong> <strong>de</strong>uxième espèce associés à la métrique<br />
g. C’est cette connexion qui est utilisée dans les théories métriques. Désormais, nous utiliserons<br />
seulement la connexion riemannienne et nous la désignerons indistinctement soit par Γ ρ µν soit<br />
par { ρ µν}.<br />
147
Théorème C.1.2 La dérivée covariante ∇λ associée à la connexion riemannienne sur (V4,g)<br />
est telle que<br />
∇λgµν = 0 (C.12)<br />
et<br />
en tout point x ∈ V4.<br />
∇λg ρσ = 0 (C.13)<br />
Démonstration.— Nous avons déjà montré l’équation (C.12) en établissant le théorème 1.<br />
Cette équation est souvent appelé le théorème <strong>de</strong> Ricci. Pour démontrer l’équation (C.13),<br />
appliquons la dérivation covariante riemannienne au produit contracté gµνg ρµ . En utilisant<br />
l’équation (62) du chapitre I et l’équation (18) du chapitre II, on obtient<br />
∇λ (gµνg ρµ ) = ∇λδ ρ ν = 0.<br />
D’où en utilisant la règle <strong>de</strong> Leibniz qui est satisfaite par toute dérivation covariante :<br />
Or, ∇λgµν = 0. On a donc<br />
∇λgµνg ρµ + gµν∇λg ρµ = 0.<br />
Effectuons le produit contracté <strong>de</strong> (C.14) par g νσ . Il vient :<br />
C.Q.F.D.<br />
gµν∇λg ρµ = 0. (C.14)<br />
g νσ gµν∇λg ρµ = δ σ µ∇λg ρµ = ∇λg ρσ = 0<br />
Enfin, nous citerons <strong>de</strong>ux autres propriétés importantes que possè<strong>de</strong> la connexion riemannienne<br />
:<br />
Propriété 1.— Un vecteur V subissant un transport parallèle défini par la connexion riemannienne<br />
gar<strong>de</strong> une norme constante.<br />
Propriété 2.— Le transport parallèle défini par la connexion riemannienne conserve la<br />
valeur <strong>de</strong> l’angle formé par <strong>de</strong>ux vecteurs. En particulier, <strong>de</strong>ux vecteurs V et W initialement<br />
orthogonaux restent orthogonaux lors d’un transport par parallélisme.<br />
Ces propriétés découlent immédiatement du théorème 1. Elles sont d’un grand intérêt en<br />
physique théorique. Il résulte en effet <strong>de</strong> la propriété 1 qu’une connexion métrique permet<br />
<strong>de</strong> comparer <strong>de</strong>s étalons <strong>de</strong> longueur situés en <strong>de</strong>s points voisins. La propriété 2 permet <strong>de</strong><br />
réaliser en chaque point x d’une courbe C un repère orthonormé simplement en transportant<br />
par parallélisme un repère orthonormé construit en un point fixé <strong>de</strong> C.<br />
148
C.2 Géodésiques d’une variété riemannienne<br />
Définition C.2.1 Soit (V4,g) une variété riemannienne <strong>de</strong> dimension 4. Étant donnés <strong>de</strong>ux<br />
points x1 et x2 <strong>de</strong> V4, on appelle arc géodésique joignant x1 et x2 tout arc <strong>de</strong> courbe différentiable<br />
Γ12 d’équations paramétriques xα = xα (λ) satisfaisant aux conditions :<br />
où ˙x µ est défini par<br />
λ2<br />
δ gµν(x<br />
λ1<br />
α (λ)) ˙x µ ˙x ν dλ = 0, x α (λ1) = x α 1 , x α (λ2) = x α 2 , (C.15)<br />
˙x µ = dxµ<br />
. (C.16)<br />
dλ<br />
D’après cette définition, les géodésiques d’une variété riemannienne (V4,g) sont les courbes<br />
paramétrées xα = xα (λ) solutions <strong>de</strong>s équations d’Euler-Lagrange<br />
<br />
associées au lagrangien<br />
d<br />
dλ<br />
∂L<br />
∂ ˙x µ<br />
− ∂L<br />
= 0 (C.17)<br />
∂x µ<br />
L(x α , ˙x µ ) = 1<br />
2 gµν(x α ) ˙x µ ˙x ν . (C.18)<br />
On en déduit le théorème qui suit.<br />
Théorème C.2.1 Les géodésiques d’une variété riemannienne (V4,g) sont les courbes d’équations<br />
paramétriques x α = x α (λ) solutions du système différentiel<br />
d<br />
dλ (gµν ˙x ν ) = 1<br />
2 ∂µgρσ ˙x ρ ˙x σ . (C.19)<br />
Démonstration.— Pour établir les équations (C.19), calculons d’abord le moment conjugué<br />
∂L/∂ ˙x µ associé à chaque coordonnée x µ :<br />
Compte tenu <strong>de</strong><br />
on peut écrire<br />
∂L 1<br />
=<br />
∂ ˙x µ 2<br />
∂<br />
∂ ˙x µ(gρσ ˙x ρ ˙x σ ). (C.20)<br />
∂ ˙x ρ<br />
∂ ˙x µ = δρ µ , (C.21)<br />
∂<br />
∂ ˙x µ(gρσ ˙x ρ ˙x σ ) = gρσδ ρ µ ˙x σ + gρσ ˙x ρ δ σ µ = 2gµν ˙x ν . (C.22)<br />
Substituons (C.22) dans (C.20). Il vient :<br />
∂L<br />
∂ ˙x µ = gµν ˙x ν . (C.23)<br />
Par ailleurs, on peut évi<strong>de</strong>mment écrire :<br />
∂L 1<br />
=<br />
∂x µ 2 ∂µgρσ ˙x ρ ˙x σ . (C.24)<br />
La substitution <strong>de</strong> (C.23) et <strong>de</strong> (C.24) dans (C.17) donne immédiatement les équations<br />
d’Euler-Lagrange sous la forme (C.19). C.Q.F.D.<br />
149
Théorème C.2.2 Les équations (C.19) déterminent le paramétrage <strong>de</strong>s courbes géodésiques à<br />
une transformation affine arbitraire près.<br />
Démonstration.— Considérons une courbe paramétrée x α = x α (λ) solution <strong>de</strong>s équations<br />
(C.19) et effectuons un changement <strong>de</strong> paramétrage en posant<br />
λ = f(ζ), (C.25)<br />
f étant par hypothèse une fonction <strong>de</strong>ux fois continûment différentiable dont la dérivée première<br />
f ′ (ζ) ne s’annule pas sur l’intervalle <strong>de</strong> variation <strong>de</strong> λ. Les équations (C.19) s’écrivent alors sous<br />
la forme<br />
1<br />
f ′ d<br />
(ζ) dζ<br />
1<br />
f ′ (ζ) gµν<br />
dxν <br />
=<br />
dζ<br />
1<br />
2<br />
soit après multiplication <strong>de</strong>s <strong>de</strong>ux membres par f ′ (ζ)<br />
<br />
d dx<br />
gµν<br />
dζ<br />
ν<br />
<br />
−<br />
dζ<br />
f ′′ (ζ)<br />
f ′ (ζ) gµν<br />
dxν dζ<br />
1<br />
f ′2<br />
dx<br />
∂µgρσ<br />
(ζ) ρ dx<br />
dζ<br />
σ<br />
dζ<br />
1<br />
=<br />
2 ∂µgρσ<br />
dxρ dx<br />
dζ<br />
σ<br />
dζ<br />
(C.26)<br />
Les équations (C.26) ont la même forme que les équations (C.19) si et seulement si f ′′ (ζ) = 0,<br />
i.e. si et seulement si<br />
λ = aζ + b, (C.27)<br />
où a et b sont <strong>de</strong>s constantes arbitraires. C.Q.F.D.<br />
Le théorème 4 explique pourquoi on appelle paramètre affine <strong>de</strong> la géodésique considérée le<br />
paramètre λ impliqué dans le principe variationnel (C.15) ou , ce qui est équivalent, dans les<br />
équations (C.19).<br />
Étant un sytème d’équations <strong>de</strong> Lagrange, le système différentiel (C.19) est en pratique celui<br />
qui est le plus commo<strong>de</strong> pour étudier les géodésiques d’une variété riemannienne. Il existe toutefois<br />
une autre forme <strong>de</strong>s équations différentielles satisfaites par une géodésique qu’il importe<br />
<strong>de</strong> connaître. La dérivée totale par rapport à λ <strong>de</strong>s moments conjugués gµν ˙x ν peut s’écrire<br />
d<br />
dλ (gµν ˙x ν ) = gµν ¨x ν + ˙x ρ ∂ρgµν ˙x ν = gµν ¨x ν + 1<br />
2 (∂ρgσµ + ∂σgµρ) ˙x ρ ˙x σ . (C.28)<br />
Substituons (C.28) dans les équations <strong>de</strong>s géodésiques (C.19). Il vient :<br />
gµν ¨x ν + 1<br />
2 (∂ρgσµ + ∂σgµρ − ∂µgρσ) ˙x ρ ˙x σ = 0. (C.29)<br />
Effectuons la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (C.29) par g µα . Compte tenu<br />
<strong>de</strong> gµνg µα = δ α ν , <strong>de</strong> la définition (C.2) <strong>de</strong>s symboles <strong>de</strong> Christoffel <strong>de</strong> <strong>de</strong>uxième espèce et <strong>de</strong><br />
(C.16), les équations (C.29) s’écrivent sous la forme<br />
d2xα dλ2 + {αρσ} dxρ dx<br />
dλ<br />
σ<br />
= 0.<br />
dλ<br />
Compte tenu <strong>de</strong> la formule (71) du chap. I, le système (C.30) s’écrit encore<br />
(C.30)<br />
<br />
α ∇ dx<br />
= 0.<br />
dλ dλ<br />
(C.31)<br />
Réciproquement, il est aisé <strong>de</strong> vérifier que les équations (C.31) entraînent les équations <strong>de</strong><br />
Lagrange (C.19). On peut donc formuler le théorème qui suit.<br />
150
Théorème C.2.3 Une courbe Γ d’équations paramétriques x α = x α (λ) est une géodésique<br />
<strong>de</strong> paramètre affine λ si et seulement si le vecteur tangent ˙x α = dx α /dλ est transporté par<br />
parallélisme le long <strong>de</strong> Γ.<br />
Le théorème 5 revient à énoncer que les géodésiques sont les courbes auto-parallèles <strong>de</strong> la<br />
connexion riemannienne.<br />
Nous allons maintenant établir un théorème très utile quand on cherche à intégrer les<br />
équations différentielles <strong>de</strong>s géodésiques.<br />
Théorème C.2.4 Toute géodésique paramétrée par un paramètre affine λ arbitraire admet<br />
l’intégrale première<br />
2L(x α , ˙x µ ) = K = const (C.32)<br />
L(x α , ˙x µ ) étant le lagrangien défini par (C.18).<br />
Démonstration.— L’existence d’une intégrale première telle que (C.32) vient <strong>de</strong> la propriété<br />
<strong>de</strong> la fonction <strong>de</strong> Lagrange L <strong>de</strong> ne pas dépendre explicitement du paramètre λ. Pour le voir,<br />
calculons la dérivée totale <strong>de</strong> L(x α , ˙x µ ) par rapport à λ le long d’une courbe différentiable<br />
arbitraire. On obtient l’équation :<br />
dL<br />
dλ<br />
∂L<br />
=<br />
∂x µ ˙xµ + ∂L<br />
∂ ˙x µ ¨xµ = ∂L<br />
∂x µ ˙xµ + d<br />
<br />
∂L<br />
˙xµ −<br />
dλ ∂ ˙x µ d<br />
<br />
∂L<br />
dλ ∂ ˙x µ<br />
<br />
d’où on déduit immédiatement :<br />
<br />
dL d ∂L<br />
− ˙xµ ≡<br />
dλ dλ ∂ ˙x µ d<br />
<br />
L −<br />
dλ<br />
∂L<br />
<br />
˙xµ<br />
∂ ˙x µ<br />
Or, d’après (C.23), on peut écrire<br />
Substituons (C.34) dans (C.33). Il vient<br />
=<br />
<br />
∂L d ∂L<br />
−<br />
∂x µ dλ ∂ ˙x µ<br />
<br />
˙x µ ,<br />
˙x µ . (C.33)<br />
L − ∂L<br />
∂ ˙x µ ˙xµ = L − gµν ˙x ν ˙x µ = L − 2L = −L. (C.34)<br />
dL<br />
dλ =<br />
<br />
d ∂L<br />
dλ ∂ ˙x µ<br />
<br />
− ∂L<br />
∂x µ<br />
<br />
˙x µ . (C.35)<br />
Les termes entre crochets sont nuls quand les équations d’Euler-Lagrange (C.19) sont satisfaites.<br />
On a donc<br />
dL<br />
= 0<br />
dλ<br />
le long <strong>de</strong> toute solution <strong>de</strong>s équations (C.17) ou (C.19). La quantité L(x α , ˙x µ ) est donc<br />
constante le long d’une géodésique. D’où le théorème.<br />
L’intégrale première (C.32) montre qu’on a<br />
ds 2 = Kdλ 2<br />
151<br />
(C.36)
pour <strong>de</strong>ux points infiniment voisins appartenant à la même géodésique. Il en résulte qu’il existe<br />
trois types <strong>de</strong> géodésiques :<br />
a) Si K > 0, ds 2 > 0 ;<br />
b) Si K = 0, ds 2 = 0 ;<br />
c) Si K < 0, ds 2 < 0 .<br />
Nous retrouverons bien sûr cette classification en relativité. Avec notre convention d’écrire<br />
les métriques relativistes avec un signe + <strong>de</strong>vant c 2 dt 2 , une géodésique telle que ds 2 > 0 est dite<br />
du genre temps et une géodésique telle que ds 2 < 0 est dite du genre espace. Une géodésique<br />
telle que ds 2 = 0 est dite isotrope.<br />
Pour finir, nous noterons que l’intégrale première (C.32) s’avèrera précieuse quand on cherchera<br />
à intégrer les équations (C.17) ou (C.19). Voir exemple les chapitres 9 et 10.<br />
Pour clore cette section sur les géodésiques, nous énoncerons le théorème qui suit.<br />
Théorème C.2.5 Les géodésiques <strong>de</strong> genre temps sont les courbes <strong>de</strong> genre temps qui satisfont<br />
la condition d’extremum<br />
<br />
δ<br />
où ℓ est un paramètre arbitraire.<br />
<br />
ds = δ<br />
<br />
gµν(xα (ℓ)) dxµ dx<br />
dℓ<br />
ν<br />
dℓ = 0, (C.37)<br />
dℓ<br />
Démonstration.— Partons <strong>de</strong> la fonction lagrangienne qui figure sous le signe intégral dans<br />
le second membre <strong>de</strong> (C.37) :<br />
où ˙x µ désigne maintenant<br />
L(x α , ˙x µ ) =<br />
<br />
gµν(x α ) ˙x µ ˙x ν , (C.38)<br />
˙x µ = dxµ<br />
, (C.39)<br />
dℓ<br />
ℓ étant, répétons-le, un paramètre arbitraire. Les équations d’Euler-Lagrange associées sont<br />
et<br />
Définissons F en posant<br />
On a L = √ 2F. En conséquence :<br />
<br />
d ∂L dℓ ∂ ˙x µ<br />
<br />
= d<br />
<br />
1<br />
√2F<br />
dℓ<br />
<br />
d ∂L dℓ ∂ ˙x µ<br />
<br />
− ∂ L<br />
= 0. (C.40)<br />
∂x µ<br />
2F(x α , ˙x µ ) = gµν(x α ) ˙x µ ˙x ν . (C.41)<br />
∂ L 1<br />
= √<br />
∂x µ 2F<br />
∂F<br />
∂ ˙x µ<br />
<br />
= 1<br />
√<br />
2F<br />
152<br />
∂F<br />
∂x µ<br />
<br />
d ∂F<br />
dℓ ∂ ˙x µ<br />
<br />
− 1 dF<br />
2F dℓ<br />
(C.42)<br />
∂F<br />
∂ ˙x µ<br />
<br />
. (C.43)
Substituons (C.42) et (C.43) dans (C.40) et multiplions les <strong>de</strong>ux membres par √ 2F. Nous<br />
obtenons les équations : <br />
d ∂F<br />
dℓ ∂ ˙x µ<br />
<br />
− ∂F 1 dF ∂F<br />
− = 0.<br />
∂x µ 2F dℓ ∂ ˙x µ (C.44)<br />
On voit que les équations (C.44) se réduisent aux équations d’Euler-Lagrange pour la fonction<br />
<strong>de</strong> Lagrange L(x α , ˙x µ ) = F(x α , ˙x µ ) à condition <strong>de</strong> choisir le paramètre ℓ <strong>de</strong> telle sorte que<br />
dF/dℓ = 0 le long <strong>de</strong> chaque courbe solution. Mais d’après (C.41), la condition dF/dℓ = 0 n’est<br />
autre que l’intégrale première<br />
2F ≡ gµν(x α ) ˙x µ ˙x ν = K ′ , (C.45)<br />
où K ′ est une constante arbitraire > 0. L’équation (C.45) montre qu’imposer la relation dF/dℓ =<br />
0 équivaut à choisir ℓ <strong>de</strong> telle sorte que dℓ = ±K ′−1/2 ds, ce qui équivaut encore à ds 2 = K ′ dℓ 2 .<br />
La comparaison <strong>de</strong> cette condition avec (C.36) montre que ℓ s’i<strong>de</strong>ntifie avec un paramètre affine<br />
d’une géodésique du genre temps au sens défini au début <strong>de</strong> la section 2. Avec le choix <strong>de</strong> ℓ<br />
correspondant à K ′ = K, F(x α , ˙x µ ) s’i<strong>de</strong>ntifie avec le lagrangien (C.18), ce qui démontre le<br />
théorème.<br />
On notera que les équations d’Euler-Lagrange correspondant à (C.38) sont définies uniquement<br />
pour les arcs <strong>de</strong> géodésiques le long <strong>de</strong>squels F gar<strong>de</strong> un signe constant et ne peut prendre<br />
la valeur 0. Ces équations ne peuvent donc pas décrire les géodésiques isotropes, puisqu’on a<br />
pour ces <strong>de</strong>rnières L = 0.<br />
C.3 Tenseur <strong>de</strong> courbure<br />
En géométrie euclidienne usuelle à <strong>de</strong>ux ou trois dimensions, un vecteur qui est transporté<br />
par parallélisme le long d’un contour fermé (ou lacet) vient coïnci<strong>de</strong>r avec le vecteur initial<br />
lorsqu’il a effectué un tour complet. Il est cependant facile <strong>de</strong> voir que cette propriété n’est<br />
plus vraie sur la sphère S2 munie <strong>de</strong> la métrique gs induite par son plongement dans l’espace<br />
proprement euclidien à trois dimension. On dit que le plan euclidien ordinaire est un espace<br />
plat, tandis que la sphère (S2,gs) est un espace courbe.<br />
La généralisation aux variétés riemanniennes <strong>de</strong> dimension 4 est évi<strong>de</strong>mment possible.<br />
Considérons d’abord le cas simple <strong>de</strong>s espaces plats, dont la définition est la suivante :<br />
Définition C.3.1 On appelle espace plat <strong>de</strong> dimension 4 la variété IR 4 munie d’une métrique<br />
ayant la forme<br />
ds 2 3<br />
= ǫα(dx α ) 2 , (C.46)<br />
α=0<br />
où ǫ = 1 ou −1 selon les valeurs <strong>de</strong> l’indice α.<br />
Les symboles <strong>de</strong> Christoffel exprimés dans les coordonnées locales x α sont partout nuls<br />
puisque les gµν sont <strong>de</strong>s constantes. Un vecteur transporté par parallélisme le long d’un contour<br />
fermé arbitraire viendra donc coïnci<strong>de</strong>r avec sa position initiale lorsqu’il aura effectué un tour<br />
complet.<br />
Plus généralement, introduisons les espaces localement plats, définis comme suit :<br />
153
Définition C.3.2 Une variété riemannienne (V4,g) est un espace localement plat si au voisinage<br />
<strong>de</strong> chacun <strong>de</strong> ses points, il existe un système <strong>de</strong> coordonnées locales xα tel que la métrique<br />
s’écrive sous la forme<br />
ds 2 3<br />
= ǫα(dx α ) 2 . (C.47)<br />
α=0<br />
On peut montrer que là encore, un vecteur quelconque transporté par parallélisme le long<br />
d’un contour fermé arbitraire viendra coïnci<strong>de</strong>r avec sa position initiale lorsqu’il aura effectué<br />
un tour complet.<br />
La propriété que nous venons d’énoncer admet une réciproque. Nous n’allons pas démontrer<br />
ici cette réciproque en toute rigueur, mais nous allons indiquer la démarche qui permet <strong>de</strong><br />
l’établir.<br />
On part du théorème suivant, que nous nous contenterons d’énoncer sans expliciter les<br />
calculs.<br />
Théorème C.3.1 Soit C un lacet d’origine x0 défini par les équations paramétriques<br />
où le paramètre λ est choisi <strong>de</strong> telle sorte que<br />
x α = x α 0 + ǫξ α (λ) 0 ≤ λ ≤ 1, (C.48)<br />
ǫξ α (0) = ǫξ α (1) = 0, (C.49)<br />
et ǫ est un paramètre sans dimension tel que |ǫ|
D’où :<br />
∇µ∇νW ρ − ∇ν∇µW ρ<br />
= ∂µ(∇νW ρ ) − ∂ν(∇µW ρ ) + Γ ρ µσ∇νW σ − Γ ρ νσ∇µW σ . (C.53)<br />
Le calcul se poursuit en explicitant les dérivées covariantes figurant dans le second membre<br />
<strong>de</strong> (C.53). Il vient ainsi<br />
∇µ∇νW ρ − ∇ν∇µW ρ = <br />
∂µΓ ρ νσ − ∂νΓ ρ µσ + Γ ρ µτΓ τ νσ − Γ ρ ντΓ τ <br />
µσ W σ . (C.54)<br />
D’après le critère <strong>de</strong> tensorialité énoncé dans le chapitre I, les quantités entre parenthèses<br />
dans le second membre <strong>de</strong> (C.54) constituent les composantes d’un champ <strong>de</strong> tenseurs <strong>de</strong> type<br />
(3,1). Nous sommes dès lors conduits au théorème suivant.<br />
Théorème C.3.2 Sur une variété riemannienne (V4,g), les dérivées covariantes secon<strong>de</strong>s d’un<br />
champ <strong>de</strong> vecteurs arbitraire W ρ satisfont l’i<strong>de</strong>ntité<br />
∇µ∇νW ρ − ∇ν∇µW ρ = R ρ σµν W σ , (C.55)<br />
où R ρ σµν est un champ <strong>de</strong> tenseurs <strong>de</strong> type (3,1) dont les composantes en coordonnées locales<br />
sont données par<br />
R ρ σµν = ∂µΓ ρ νσ − ∂νΓ ρ µσ + Γ ρ µτΓ τ νσ − Γ ρ ντΓ τ µσ. (C.56)<br />
D’après ce théorème, la formule (C.50) peut s’écrire<br />
(Wσ) x0 ∆V σ = ǫ2<br />
4<br />
<br />
W σ R ρ <br />
σµν<br />
x0<br />
V (in)<br />
<br />
ρ ξ<br />
C<br />
µdξν<br />
dλ<br />
<br />
dξµ<br />
− ξν dλ + O(ǫ<br />
dλ<br />
3 ) (C.57)<br />
En considérant le passage à la limite ǫ → 0, on voit que si l’accroissement ∆V σ d’un vecteur<br />
arbitraire V ρ transporté par parallélisme le long d’un lacet arbitraire est nul en tout point <strong>de</strong><br />
V4, alors<br />
R ρ σµν = 0<br />
partout.<br />
Le champ <strong>de</strong> tenseurs défini par les éqs. (C.56) est appelé le tenseur <strong>de</strong> courbure (ou encore<br />
tenseur <strong>de</strong> Riemann-Christoffel) <strong>de</strong> la variété riemannienne 2 . Cette dénomination est justifiée<br />
par le théorème fondamental que nous allons énoncer maintenant, sans le démontrer.<br />
Théorème C.3.3 Une variété riemannienne dont le tenseur <strong>de</strong> courbure est partout nul est<br />
un espace localement plat.<br />
Ce théorème et l’équation (C.57) entraînent immédiatement la proposition qui suit :<br />
Théorème C.3.4 Une variété riemannienne est localement plate si le transport par parallélisme<br />
d’un vecteur quelconque le long d’un lacet arbitraire fait revenir ce vecteur dans sa position initiale.<br />
2 Dans la plupart <strong>de</strong>s traités <strong>de</strong> géométrie différentielle actuels, on définit le tenseur <strong>de</strong> courbure d’une<br />
connexion à partir <strong>de</strong> la relation (C.55). Pour notre part, nous avons préféré introduire ce tenseur à partir <strong>de</strong><br />
la formule géométrique (C.50), comme on le faisait dans les anciens traités, car cette manière <strong>de</strong> procé<strong>de</strong>r nous<br />
paraît beaucoup plus “parlante”<br />
155
Le théorème C.3.4 est la réciproque dont nous parlions plus haut.<br />
En général, dans une variété (V4,g) donné, le transport par parallélisme le long d’une courbe<br />
fermée défini par la connexion riemannienne ne ramènera pas un vecteur dans sa position<br />
initiale. On dira alors que la variété riemannienne est douée <strong>de</strong> courbure ou plus simplement<br />
est courbe.<br />
C.4 Propriétés du tenseur <strong>de</strong> courbure<br />
Selon un formalisme étudié dans la section 10 du premier chapitre, on définit les composantes<br />
quatre fois covariantes du tenseur <strong>de</strong> courbure en posant<br />
Rρσµν = gλρR λ σµν. (C.58)<br />
Il est bien entendu possible <strong>de</strong> calculer les composantes mixtes R λ σµν à partir <strong>de</strong>s composantes<br />
covariantes. En effectuant la multiplication contractée <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (C.58) par<br />
g ρτ , il vient en effet :<br />
g ρτ Rρσµν = g ρτ gλρR λ σµν = δ τ λR λ σµν = R τ σµν. (C.59)<br />
L’introduction <strong>de</strong>s composantes covariantes du tenseur <strong>de</strong> courbure est commo<strong>de</strong> pour<br />
énoncer les propriétés fondamentales qui suivent.<br />
Propriétés <strong>de</strong> symétrie et d’antisymétrie du tenseur <strong>de</strong> courbure.— On vérifie<br />
aisément à partir <strong>de</strong> (C.56) et <strong>de</strong> (C.58) que les quantités Rρσµν possè<strong>de</strong>nt les propriétés <strong>de</strong><br />
symétrie ou d’antisymétrie suivantes :<br />
et<br />
Rρσµν = Rµνρσ<br />
(C.60)<br />
Rρσµν = −Rσρµν = −Rρσνµ. (C.61)<br />
I<strong>de</strong>ntités satisfaites par le tenseur <strong>de</strong> courbure.— Le tenseur <strong>de</strong> courbure <strong>de</strong> la<br />
connexion riemannienne Γ ρ µν = { ρ µν} satisfait <strong>de</strong>ux i<strong>de</strong>ntités, dites i<strong>de</strong>ntités <strong>de</strong> Bianchi, que<br />
nous énonçons sans démonstration :<br />
R ρ<br />
λµν + Rρµνλ<br />
+ Rρνλµ<br />
= 0, (C.62)<br />
∇λR ρ σµν + ∇µR ρ<br />
σνλ<br />
+ ∇νR ρ<br />
σλµ<br />
= 0. (C.63)<br />
On notera que les indices λ, µ et ν sont permutés circulairement dans les formules (C.62)<br />
et (C.63).<br />
156
C.5 Tenseur <strong>de</strong> Ricci. Scalaire <strong>de</strong> courbure<br />
A partir du tenseur <strong>de</strong> courbure, on peut définir par contraction le tenseur <strong>de</strong> Ricci<br />
Rµν = R β<br />
µβν = gαβ Rαµβν. (C.64)<br />
L’expression du tenseur <strong>de</strong> Ricci se déduit immédiatement <strong>de</strong> (C.56) et <strong>de</strong> (C.64) :<br />
Rµν = ∂λΓ λ µν − ∂νΓ λ µλ + Γ ρ µνΓ λ ρλ − Γ ρ<br />
µλ Γλ ρν. (C.65)<br />
La multiplication contractée <strong>de</strong> g µν et <strong>de</strong> Rµν définit une quantité scalaire :<br />
appelée l’invariant <strong>de</strong> courbure scalaire.<br />
Les i<strong>de</strong>ntités (C.63) entraînent les i<strong>de</strong>ntités suivantes :<br />
∇ν<br />
R = g µν Rµν, (C.66)<br />
<br />
R µν − 1<br />
2 Rgµν<br />
<br />
= 0. (C.67)<br />
Ces quatre i<strong>de</strong>ntités, appelées i<strong>de</strong>ntités <strong>de</strong> conservation, jouent un rôle fondamental en<br />
relativité générale et dans les théories métriques <strong>de</strong> la gravitation. Le tenseur symétrique G µν<br />
défini par<br />
s’appelle le tenseur d’Einstein.<br />
G µν = R µν − 1<br />
R gµν<br />
2<br />
(C.68)<br />
C.6 Opérateurs différentiels sur une variété riemannienne<br />
Gradient d’une fonction.— Nous avons déjà vu que le gradient d’une fonction Φ(x) est<br />
un champ <strong>de</strong> vecteurs covariants. Sur un espace-temps (V4,g), on peut évi<strong>de</strong>mment définir les<br />
composantes contravariantes du vecteur gradΦ par les relations<br />
(gradΦ) α = g αβ ∂βΦ = g αβ ∇βΦ. (C.69)<br />
La (pseudo)-norme riemannienne du gradient est le paramètre différentiel <strong>de</strong> Beltrami du<br />
premier ordre défini par<br />
∆1Φ = g µν ∂µΦ∂νΦ. (C.70)<br />
Rotationnel d’un champ <strong>de</strong> vecteurs.— Étant donné un champ <strong>de</strong> vecteurs A <strong>de</strong><br />
composantes covariantes Aµ, on appelle tenseur rotationnel du vecteur A le tenseur <strong>de</strong>ux fois<br />
covariant défini par<br />
(rot A)µν = ∇νAµ − ∇µAν . (C.71)<br />
On a<br />
∇νAµ = ∂νAµ − { ρ νµ}Aρ , ∇µAν = ∂νAµ − { ρ νµ}Aρ . (C.72)<br />
157
En substituant les relations (C.72) dans (C.71), il vient<br />
(rotA)µν ≡ ∇νAµ − ∇µAν = ∂νAµ − ∂νAµ . (C.73)<br />
Les composantes du tenseur rotationnel d’un vecteur A s’expriment donc uniquement avec<br />
les dérivées partielles usuelles <strong>de</strong>s composantes covariantes <strong>de</strong> ce vecteur, exactement comme<br />
en géométrie vectorielle usuelle. Cette propriété permet <strong>de</strong> simplifier nombre <strong>de</strong> calculs en<br />
électromagnétisme, puisque le tenseur champ électromagnétique Fµν est au signe près le tenseur<br />
rotationnel du potentiel vecteur Aµ.<br />
Divergence d’un champ <strong>de</strong> vecteurs.— Donnons-nous un champ <strong>de</strong> vecteurs V <strong>de</strong><br />
composantes contravariantes V ρ . La divergence du champ V est la fonction divV définie par<br />
On a donc<br />
divV = ∇µV µ . (C.74)<br />
divV = ∂µV µ + { µ µν}V ν . (C.75)<br />
On peut donner une expression bien plus commo<strong>de</strong> du second membre <strong>de</strong> (C.75). On déduit<br />
<strong>de</strong> (C.10) :<br />
{ µ µν} = 1<br />
2 gµσ (∂µgνσ + ∂νgσµ − ∂σgµν). (C.76)<br />
Mais en vertu <strong>de</strong> la symétrie <strong>de</strong>s gµν<br />
En conséquence, (C.76) se réduit à<br />
1<br />
2 gµσ (∂µgνσ − ∂σgµν) = 1<br />
2 gµσ ∂µgνσ − 1<br />
2 gσµ ∂σgνµ = 0.<br />
{ µ µν} = 1<br />
2 gρσ ∂νgρσ . (C.77)<br />
Lorsqu’on tient compte <strong>de</strong> la définition <strong>de</strong>s g µν , le second membre <strong>de</strong> (C.77) est proportionnel<br />
à la dérivée par rapport à x ν du déterminant g <strong>de</strong> la matrice (gµν). On a d’après la théorie <strong>de</strong>s<br />
déterminants :<br />
gδ ρ ν = gµν∆ µρ , g = dét (gµν),<br />
où ∆ µρ est le cofacteur <strong>de</strong> gµρ. Cette relation entraîne<br />
g =<br />
3<br />
gµν∆ µν ∀ν = 0, 1, 2, 3, (C.78)<br />
µ=0<br />
où il n’y a pas sommation sur l’indice répété ν. Puisque ∆ µν ne contient pas le terme gµν, on<br />
déduit <strong>de</strong> (C.78) que<br />
∂g<br />
= ∆ µν . (C.79)<br />
D’où<br />
∂ρg ≡ ∂g<br />
∂gµν<br />
∂gµν<br />
∂ρgµν = ∆ µν ∂ρgµν , (C.80)<br />
158
soit, compte tenu <strong>de</strong> ∆ µν = gg µν :<br />
On a donc<br />
∂ρg = gg µν ∂ρgµν . (C.81)<br />
{ µ µν} = 1 ∂νg<br />
2 g<br />
<br />
∂ν |g|<br />
= . (C.82)<br />
|g|<br />
Substituons (C.82) dans (C.75). Il vient après un changement d’indice muet :<br />
divV = 1<br />
<br />
|g| ∂µ<br />
<br />
|g| V µ<br />
<br />
. (C.83)<br />
Cette formule s’avère très commo<strong>de</strong> dans le calcul <strong>de</strong>s divergences, car elle dispense <strong>de</strong><br />
calculer les symboles <strong>de</strong> Christoffel.<br />
On retiendra que (C.81) peut encore s’écrire sous la forme suivante :<br />
g µν ∂ρgµν = ∂ρg<br />
g<br />
d’où on déduit, en tenant compte <strong>de</strong> g µν gµν = 4 :<br />
gµν∂ρg µν = − ∂ρg<br />
g<br />
Les relations (C.84) et (C.85) sont extrêmement utiles en pratique.<br />
<br />
|g|<br />
= 2∂ρ , (C.84)<br />
|g|<br />
<br />
|g|<br />
= −2∂ρ . (C.85)<br />
|g|<br />
Laplacien d’une fonction.— On appelle laplacien ou encore paramètre différentiel <strong>de</strong><br />
Beltrami du <strong>de</strong>uxième ordre <strong>de</strong> Φ la fonction scalaire<br />
De ce qui précè<strong>de</strong>, on déduit :<br />
D’où, compte tenu <strong>de</strong> (C.82) :<br />
∆2Φ = div ( grad Φ) = g µν ∇µ∇νΦ. (C.86)<br />
∆2Φ = ∇µ (g µν ∂νΦ) = ∂µ (g µν ∂νΦ) + { µ µρ}g ρν ∂νΦ.<br />
∆2Φ = 1<br />
<br />
|g| ∂µ<br />
<br />
|g|g µν <br />
∂νΦ . (C.87)<br />
Cette expression du laplacien est très pratique dans bon nombre <strong>de</strong> calculs, y compris<br />
ceux qui sont effectués sur l’espace euclidien usuel. Il est par exemple à peu près immédiat<br />
<strong>de</strong> déterminer l’opérateur laplacien dans le cas <strong>de</strong>s métriques écrites sous forme diagonale (un<br />
exemple est donné dans la section 3.8).<br />
159
C.7 Quelques relations utiles<br />
Divergence d’un tenseur antisymétrique.— Soit Fµν un tenseur antisymétrique arbitraire.<br />
Montrer qu’on peut écrire<br />
∇µF µν = 1<br />
<br />
|g| ∂µ<br />
<br />
|g| F µν<br />
<br />
. (C.88)<br />
En déduire que tout tenseur Fµν antisymétrique satisfait l’i<strong>de</strong>ntité<br />
∇µ∇νF µν = 0. (C.89)<br />
Solution.— On explicite ∇µF µν grâce à la formule <strong>de</strong> dérivation covariante (B.14), les<br />
coefficients <strong>de</strong> connexion étant donnés par (C.1) et (C.2). La formule (C.88) résulte alors<br />
immédiatement <strong>de</strong> l’antisymétrie <strong>de</strong> Fµν en appliquant (C.82).<br />
La démonstration <strong>de</strong> (C.89) est tout aussi aisée. Les quantités ∇νF µν constituent les composantes<br />
contravariantes d’un vecteur. Il en résulte que ∇µ∇νF µν est la divergence d’un vecteur.<br />
Nous pouvons donc appliquer la relation (C.83). Compte tenu <strong>de</strong> (C.88), il vient :<br />
∇µ∇νF µν = 1<br />
<br />
|g| ∂µ<br />
⎡<br />
<br />
⎣<br />
|g| 1<br />
<br />
|g| ∂µ<br />
Or, le caractère antisymétrique <strong>de</strong> Fµν entraîne l’i<strong>de</strong>ntité<br />
1<br />
<br />
|g| ∂µ∂ν<br />
<br />
|g|F µν<br />
<br />
≡ 0.<br />
<br />
|g| F µν<br />
⎤<br />
⎦.<br />
On a donc la relation (C.89). Cette relation est fondamentale en électromagnétisme, puisqu’elle<br />
assure la conservation <strong>de</strong> la charge électrique totale comme conséquence <strong>de</strong>s équations<br />
<strong>de</strong> Maxwell.<br />
Divergence d’un tenseur symétrique.— Soit T un tenseur d’ordre 2 symétrique : T µν =<br />
T νµ . Montrer que ses composantes mixtes satisfont la relation<br />
<br />
|g|T µ <br />
ν − 1<br />
2 ∂νgρσ T ρσ . (C.90)<br />
∇µT µ ν = 1<br />
<br />
|g| ∂µ<br />
Solution.— Le calcul est immédiat à partir <strong>de</strong> la formule (B.16) dans laquelle les Γ ρ µν sont<br />
remplacés par les expressions (C.2).<br />
L’expression (C.90) est commo<strong>de</strong> lorsqu’on veut expliciter la relation ∇µT µ ν = 0 exprimant<br />
le caractère conservatif du tenseur impulsion-énergie symétrique T décrivant la présence <strong>de</strong><br />
matière ou d’énergie (on dit encore que le tenseur impulsion-énergie est <strong>de</strong> divergence nulle).<br />
Exercice.— Montrer que<br />
g µν { ρ µν} = − 1<br />
<br />
|g| ∂σ<br />
<br />
|g| g ρσ<br />
<br />
. (C.91)<br />
160
Solution.— D’après (C.2), le premier membre <strong>de</strong> (C.91) s’écrit<br />
Compte tenu <strong>de</strong> g µν gνσ = δ µ σ, on a<br />
g µν { ρ µν} = 1<br />
2 gµν g ρσ (∂µgνσ + ∂νgσµ − ∂σgµν). (C.92)<br />
1<br />
2 gµνg ρσ ∂µgνσ = − 1<br />
2 gµνgνσ∂µg ρσ = − 1<br />
2 δµ σ ∂µg ρσ = − 1<br />
2<br />
et en échangeant les rôles joués par les indices µ et ν<br />
En outre, (C.84) donne immédiatement<br />
∂σg ρσ<br />
(C.93)<br />
1<br />
2 gµνg ρσ ∂νgσµ = − 1<br />
2 ∂σg ρσ . (C.94)<br />
1<br />
2 gµνg ρσ ∂σgµν = g ρσ∂σ<br />
<br />
<br />
|g|<br />
Substituons (C.93), (C.94) et (C.95) dans (C.92). Il vient<br />
g µν { ρ µν} = −∂σg ρσ − g ρσ∂σ<br />
<br />
<br />
|g|<br />
|g|<br />
|g|<br />
(C.95)<br />
1<br />
≡ − |g| ∂σ<br />
<br />
|g| g ρσ<br />
<br />
. (C.96)<br />
Le <strong>de</strong>rnier membre est bien l’expression donnée par (C.91). C.Q.F.D.<br />
La relation (C.96) est utile lorsqu’on introduit les coordonnées dites harmoniques (ces coordonnées<br />
permettent d’écrire les équations d’Einstein sous une forme remarquable).<br />
C.8 Applications à l’espace euclidien à 3 dimensions<br />
Les formules obtenues pour les opérateurs différentiels sont très utiles aussi en analyse<br />
vectorielle tridimensionnelle habituelle lorsqu’on veut faire <strong>de</strong>s calculs dans <strong>de</strong>s systèmes <strong>de</strong> coordonnées<br />
non cartésiens. Nous allons donner <strong>de</strong>ux exemples en supposant que l’espace est muni<br />
<strong>de</strong> la métrique euclidienne standard ds 2 = δijdx i dx j et rapporté à <strong>de</strong>s coordonnées sphériques<br />
(r,θ,ϕ) définies par<br />
x 1 = r sin θ cos ϕ, x 1 = r sin θ sin ϕ, x 3 = r cos θ . (C.97)<br />
Divergence d’un champ <strong>de</strong> vecteurs.— On se donne un champ <strong>de</strong> vecteurs V par ses<br />
composantes contravariantes V r ,V θ ,V ϕ dans le repère naturel associé aux coordonnées (r,θ,ϕ).<br />
Former l’expression <strong>de</strong> la divergence du champ V en coordonnées sphériques.<br />
Solution.— On vérifie facilement que la métrique euclidienne s’écrit sous la forme suivante<br />
en coordonnées sphériques :<br />
ds 2 = dr 2 + r 2 dθ 2 + r 2 sin 2 θdϕ 2 . (C.98)<br />
161
Dans le nouveau système <strong>de</strong> coordonnées, la métrique a une forme diagonale et les seules<br />
composantes non nulles du tenseur métrique sont<br />
On a donc<br />
grr = 1, gθθ = r 2 , gϕϕ = r 2 sin 2 θ . (C.99)<br />
et les expressions <strong>de</strong>s g ij non i<strong>de</strong>ntiquement nuls sont :<br />
g rr = 1<br />
grr<br />
D’après (C.83), on peut écrire<br />
divV =<br />
g = dét (1,r 2 ,r 2 sin 2 θ) = r 4 sin 2 θ (C.100)<br />
= 1, g θθ = 1<br />
gθθ<br />
= 1<br />
r 2 , gϕϕ = 1<br />
gϕϕ<br />
=<br />
1<br />
r2 sin2 . (C.101)<br />
θ<br />
1<br />
r2 <br />
∂ <br />
r<br />
sin θ ∂r<br />
2 sin θ V r<br />
+ ∂ <br />
r<br />
∂θ<br />
2 sin θ V θ<br />
+ ∂ <br />
r<br />
∂ϕ<br />
2 sin θ V ϕ<br />
. (C.102)<br />
On déduit immédiatement <strong>de</strong> (C.102) l’expression cherchée pour divV<br />
divV = 1<br />
r 2<br />
∂ <br />
r<br />
∂r<br />
2 V r<br />
+ 1<br />
sin θ<br />
∂ <br />
sin θ V<br />
∂θ<br />
θ<br />
+ ∂V ϕ<br />
. (C.103)<br />
∂ϕ<br />
Laplacien d’une fonction.— Former l’expression du laplacien d’une fonction Φ en coordonnées<br />
(r,θ,ϕ).<br />
Solution.— Les formules montrées dans l’exercice 1 et l’application <strong>de</strong> (C.87) conduisent<br />
immédiatement à l’expression bien connue du laplacien en coordonnées sphériques :<br />
∆2Φ = 1<br />
r 2<br />
<br />
∂<br />
r<br />
∂r<br />
2∂Φ<br />
<br />
+<br />
∂r<br />
1<br />
r2 sin θ<br />
<br />
∂<br />
sin θ<br />
∂θ<br />
∂Φ<br />
<br />
+<br />
∂θ<br />
1<br />
r 2 sin 2 θ<br />
∂2Φ . (C.104)<br />
∂ϕ2 Vérifier qu’on obtient également cette formule à partir <strong>de</strong> (C.103) à condition <strong>de</strong> remplacer<br />
V r ,V θ ,V ϕ par les composantes contravariantes du gradient <strong>de</strong> Φ correspondantes.<br />
L’expression (C.104) est très commo<strong>de</strong> en théorie newtonienne <strong>de</strong> la gravitation ainsi qu’en<br />
électromagnétisme et en théorie <strong>de</strong>s milieux continus.<br />
162
Annexe D<br />
Quantité <strong>de</strong> mouvement et énergie<br />
cinétique d’une particule isolée<br />
Nous allons montrer que les hypothèses “naturelles” faites dans la section 5.2 du chap. 5 sont<br />
suffisantes pour déterminer les fonctions universelles M(m,v 2 /c 2 ) et Ec(m,v 2 /c 2 ) simplement<br />
en considérant <strong>de</strong>s chocs élastiques <strong>de</strong> particules.<br />
Donnons-nous un référentiel galiléen S arbitraire et considérons la collision <strong>de</strong> <strong>de</strong>ux particules<br />
isolées a et b <strong>de</strong> masses ma et mb égales se mouvant sur une même droite ∆e avec <strong>de</strong>s<br />
vitesses va et vb opposées. Nous poserons :<br />
m = ma = mb, v = va = −vb, v = |va| = |vb|. (D.1)<br />
On suppose que ni le nombre ni la nature <strong>de</strong>s particules ne sont modifiés par la collision 1 .<br />
On a donc immédiatement après le choc <strong>de</strong>ux particules sortantes c et d <strong>de</strong> masses respectives<br />
mc et md égales à m, soit :<br />
mc = md = m. (D.2)<br />
Les vitesses <strong>de</strong>s particules c et d seront respectivement notées vc et vd. Pour alléger l’écriture,<br />
on posera<br />
β = |va| |vb| v<br />
= =<br />
c c c , βc = |vc|<br />
c , βd = |vd|<br />
. (D.3)<br />
d<br />
L’hypothèse centrale consiste à poser que la somme vectorielle <strong>de</strong>s quantités <strong>de</strong> mouvement<br />
et la somme <strong>de</strong>s énergies totales sont conservées au cours <strong>de</strong> la collision. Compte tenu <strong>de</strong>s<br />
relations (D.1) et (D.2), ces <strong>de</strong>ux lois <strong>de</strong> conservation s’écrivent dans le référentiel S<br />
et<br />
M(m,β 2 )va − M(m,β 2 )va = 0 = M(m,β 2 c)vc + M(m,β 2 d)vd<br />
(D.4)<br />
Ec(m,β 2 ) + Ec(m,β 2 ) = Ec(m,β 2 c) + Ec(m,β 2 d). (D.5)<br />
Du fait que la fonction M(m,v 2 /c 2 ) est toujours strictement positive d’après nos hypothèses<br />
générales, l’équation (D.4) entraîne que les vecteurs vitesses vc et vd sont colinéaires et <strong>de</strong> sens<br />
1 Le choc est alors dit parfaitement élastique.<br />
163
opposés. Les particules sortantes se déplacent donc sur une droite ∆s passant par le point <strong>de</strong><br />
collision O. Si on oriente cette droite, l’équation vectorielle (D.4) se traduit par l’équation<br />
M(m,β 2 c)¯vc + M(m,β 2 d)¯vd = 0<br />
où ¯vc et ¯vd sont les valeurs algébriques sur ∆s <strong>de</strong>s vitesses <strong>de</strong> c et d respectivement. On a donc<br />
M(m,β 2 c)vc = M(m,β 2 d)vd, (D.6)<br />
à condition <strong>de</strong> poser vc = |vc| et vd = |vd|. Or nous avons suppposé que la fonction M(m,v 2 /c 2 )v<br />
est strictement monotone. L’équation (D.6) entraîne donc<br />
Il en résulte que (D.5) peut s’écrire<br />
βc = βd. (D.7)<br />
2Ec(m,β 2 ) = 2Ec(m,β 2 c). (D.8)<br />
Mais nous avons supposé que la fonction Ec(m,v 2 /c 2 ) est elle aussi strictement monotone par<br />
rapport à v. Les relations (D.6) et (D.8) entraînent donc que<br />
βc = βd = β. (D.9)<br />
Il résulte <strong>de</strong> ce qui précè<strong>de</strong> que les particules sortantes se meuvent sur l’axe ∆s avec <strong>de</strong>s<br />
vecteurs vitesse opposés dont la valeur absolue commune est égale à la valeur absolue v :<br />
vd = −vc, avec vc = vd = va = v. (D.10)<br />
Nous allons supposer pour l’instant que l’angle θ entre ∆e et ∆s est tel que 0 < θ < π. Nous<br />
pouvons dès lors repérer les points <strong>de</strong> S par rapport à un trièdre orthonormé Ox 1 x 2 x 3 tel que<br />
l’axe Ox 1 soit porté par la droite ∆e et l’axe Ox 2 soit dans le plan défini par les droites ∆e et<br />
∆s. Les composantes <strong>de</strong>s vecteurs vitesses va et vb <strong>de</strong>s particules inci<strong>de</strong>ntes sont alors<br />
v 1 a = v, v 2 a = 0, v 3 a = 0, (D.11)<br />
v 1 b = −v, v 2 b = 0, v 3 b = 0, (D.12)<br />
tandis que les composantes <strong>de</strong>s vecteurs vitesse <strong>de</strong>s particules sortantes sont<br />
v 1 c = v cos θ, v 2 c = v sin θ, v 3 c = 0, (D.13)<br />
v 1 d = −v cos θ, v 2 d = −v sin θ, v 3 d = 0. (D.14)<br />
Considérons maintenant le référentiel galiléen S ′ comouvant avec la particule inci<strong>de</strong>nte a.<br />
Ce référentiel se déplace avec la vitesse va = v par rapport à S. Nous pouvons toujours choisir<br />
<strong>de</strong>s axes liés à S ′ <strong>de</strong> telle sorte que les coordonnées galiléennes dans S ′ s’expriment en fonction<br />
<strong>de</strong>s coordonnées galiléennes dans S par les transformations <strong>de</strong> Lorentz (4.22) écrites dans le<br />
chap. 4 dans lesquelles w est remplacée par la vitesse va.<br />
D’après la loi <strong>de</strong> composition <strong>de</strong>s vitesses (4.35), les composantes <strong>de</strong>s différents vecteurs<br />
vitesse par rapport à S ′ sont<br />
v 1′<br />
a = 0, v 2′<br />
a = 0, v 3′<br />
a = 0, (D.15)<br />
v 1′<br />
b = − 2cβ<br />
1 + β 2, v2 b = 0, v 3 b = 0, (D.16)<br />
164
et<br />
v 1′<br />
c = −<br />
v 1′<br />
d = −<br />
cβ(1 − cos θ)<br />
1 − β2 cosθ<br />
cβ(1 + cosθ)<br />
1 + β2 , v2′ d = −<br />
cos θ<br />
<br />
, v2′ c = 1 − β2 cβ sin θ<br />
<br />
1 − β 2 cos θ<br />
1 − β 2 cβ sin θ<br />
1 + β 2 cosθ<br />
, v3′<br />
c = 0, (D.17)<br />
, v3′<br />
d = 0, (D.18)<br />
On détermine immédiatement le carré <strong>de</strong>s vecteurs vitesses v ′ a, v ′ b, v ′ c et v ′ d à partir <strong>de</strong>s<br />
expessions (D.15)-(D.18). Il vient après division par c 2 :<br />
β ′ a<br />
2 v<br />
= ′ 2<br />
a<br />
c<br />
2 = 0,<br />
2<br />
4β 2<br />
(1 + β 2 ) 2,<br />
β ′ 2 v<br />
b = ′ b<br />
=<br />
c2 (D.19)<br />
β ′ 2 v<br />
c = ′ 2<br />
c<br />
c2 = β22(1 − cos θ) − β2 sin2 θ<br />
(1 − β2 cos θ) 2 , (D.20)<br />
β ′ 2 v<br />
d = ′ 2<br />
d<br />
c2 = β22(1 + cosθ) − β2 sin2 θ<br />
(1 + β2 cos θ) 2 . (D.21)<br />
D.1 Détermination <strong>de</strong> la fonction M <br />
m, v2<br />
c2 <br />
Ecrivons la conservation <strong>de</strong> la somme <strong>de</strong>s vecteurs quantités <strong>de</strong> mouvement dans le référentiel<br />
S ′ . Il vient<br />
M <br />
m,β ′ 2<br />
b<br />
2cβ<br />
1 + β2 = M(m,β′ 2 cβ(1 − cos θ)<br />
c )<br />
1 − β2 cos θ + M(m,β′ 2 cβ(1 + cosθ)<br />
d )<br />
1 + β2 , (D.22)<br />
cos θ<br />
en projetant sur l’axe O ′ x 1′<br />
et<br />
M(m,β ′ <br />
2<br />
c ) 1 − β2 cβ sin θ<br />
1 − β2 cos θ − M(m,β′ <br />
2<br />
d ) 1 − β2 cβ sin θ<br />
1 + β2 cos θ<br />
= 0 (D.23)<br />
en projetant sur O ′ x2′ . La projection sur l’axe O ′ x3′ se réduit évi<strong>de</strong>mment à l’égalité 0 = 0.<br />
La division <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> (D.23) par cβ √ 1 − β2 sin θ donne la relation<br />
M(m,β ′ 2<br />
c )<br />
1 − β2 cos θ = M(m,β′ d<br />
2<br />
)<br />
1 + β2 . (D.24)<br />
cos θ<br />
Substituons (D.24) dans (D.22). L’équation obtenue se simplifie et <strong>de</strong>vient après division<br />
<strong>de</strong>s <strong>de</strong>ux membres par 2cβ :<br />
1<br />
M(m,β ′ 2<br />
b )<br />
1 + β2 = M(m,β′ c<br />
2<br />
)<br />
1 − β2 , (D.25)<br />
cos θ<br />
où β ′ b et β ′ c sont respectivement donnés par (D.19) et (D.20). Cette équation montre que la<br />
quantité M(m,β ′ 2 2 ′ 2<br />
c )/(1 − β cos θ) ne dépend pas <strong>de</strong> l’angle θ. Lorsque θ → 0, β c → 0. Du<br />
165
fait que nous avons postulé que M(m,β 2 ) est continue sur l’intervalle 0 ≤ β 2 < 1, on voit que<br />
(D.25) entraîne<br />
M(m,β ′ 2 1 + β<br />
b ) = M(m, 0) 2<br />
1 − β2. Or, la quantité β ′ 2<br />
b donnée par (D.19) peut encore s’écrire<br />
Il en résulte que<br />
β ′ 2 (1 − β<br />
b = 1 − 2 ) 2<br />
(1 + β2 ) 2.<br />
1 + β2 =<br />
1 − β2 1<br />
<br />
1 − β ′ 2<br />
b<br />
Substituons (D.28) dans (D.26). Nous obtenons :<br />
M(m,β ′ b<br />
2 ) = M(m, 0)<br />
(D.26)<br />
(D.27)<br />
. (D.28)<br />
1<br />
<br />
1 − β ′ 2<br />
b<br />
. (D.29)<br />
Cette relation est vali<strong>de</strong> pour tout β ′ b dans l’intervalle [0, 1[. Or, nous avons admis que<br />
M(m, 0) = 0 (voir éq. (5.8)). Il résulte donc <strong>de</strong> (D.29) que la fonction M(m,v 2 /c 2 ) cherchée<br />
s’écrit<br />
M<br />
<br />
m, v2<br />
c 2<br />
<br />
= m<br />
<br />
1 − v2<br />
c2 . (D.30)<br />
Cette relation conduit à l’expression relativiste <strong>de</strong> p donnée par (5.10).<br />
D.2 Détermination <strong>de</strong> la fonction Ec<br />
<br />
m, v2<br />
c 2<br />
La conservation <strong>de</strong> l’énergie totale dans le référentiel S ′ s’exprime par l’équation :<br />
E(m, 0) + E(m,β ′ 2 ′ 2 ′ 2<br />
b ) = E(m,β c ) + E(m,β d ). (D.31)<br />
Cette équation montre que la quantité E(m,β ′ 2 ′ 2<br />
c ) + E(m,β d ) ne dépend pas <strong>de</strong> l’angle θ. Si<br />
on pose<br />
u = cos θ,<br />
β ′ 2 ′ 2 ′ 2 ′ 2<br />
c et β d peuvent être considérés comme <strong>de</strong>s fonctions <strong>de</strong> u. Dès lors, E(m,β c ) + E(m,β d )<br />
doit être indépendant <strong>de</strong> u, ce qui se traduit par la condition<br />
∂ <br />
E(m,β<br />
∂u<br />
′ <br />
2 ′ 2<br />
c ) + E(m,β d ) = 0 (D.32)<br />
Pour abréger, désignons par E ′ (m,β 2 ) la dérivée partielle <strong>de</strong> la fonction E(m,β 2 ) :<br />
E ′ (m,β 2 ) = ∂<br />
∂β 2 E(m,β2 ).<br />
166
Compte tenu <strong>de</strong>s notations que nous venons d’introduire et <strong>de</strong>s relations<br />
∂β ′ 2<br />
c<br />
∂u = −2β2 (1 − β2 )<br />
(1 − β2 ,<br />
u) 3<br />
∂β ′ 2<br />
d<br />
∂u = 2β2 (1 − β2 )<br />
(1 + β2 ,<br />
u) 3<br />
l’équation (D.32) s’écrit après division <strong>de</strong>s <strong>de</strong>ux membres par 2β 2 (1 − β 2 ),<br />
1<br />
E ′ (m,β ′ 2<br />
c )<br />
(1 − β2u) 3 = E ′ (m,β ′ d<br />
2 1<br />
)<br />
(1 + β2u) 3.<br />
(D.33)<br />
Faisons tendre u vers 1, ce qui correspond à θ → 0. Alors β ′ 2 ′ 2 ′ 2<br />
c → 0 et β d → β b . L’équation<br />
(D.33) <strong>de</strong>vient après multiplication <strong>de</strong> ses <strong>de</strong>ux membres par (1 + β2 ) 3 :<br />
Posons<br />
On voit facilement que<br />
E ′<br />
<br />
L’équation (D.34) s’écrit donc<br />
m, 1 − (1 − β2 ) 2<br />
(1 + β 2 ) 2<br />
<br />
ζ = 1 − (1 − β2 ) 2<br />
(1 + β 2 ) 2.<br />
(1 + β2 ) 3<br />
(1 − β2 =<br />
) 3<br />
∂E ′ (m,ζ)<br />
∂ζ<br />
= E ′ (m, 0) (1 + β2 ) 3<br />
(1 − β 2 ) 3.<br />
1<br />
(1 − ζ) 3/2.<br />
= E ′ (m, 0)<br />
(1 − ζ) 3/2.<br />
(D.34)<br />
(D.35)<br />
(D.36)<br />
L’intégration <strong>de</strong> (D.36) est immédiate et donne la relation<br />
E(m,ζ) = 2E ′ <br />
1<br />
(m, 0) √ − 1 + E(m, 0). (D.37)<br />
1 − ζ<br />
Il s’ensuit que l’énergie totale d’une particule isolée <strong>de</strong> vitesse v est donnée par une relation<br />
<strong>de</strong> la forme <br />
E m, v2<br />
c2 <br />
= 2E ′ <br />
1<br />
(m, 0) √ − 1 + E(m, 0). (D.38)<br />
1 − β2 Il est clair que la partie entre crochets s’annule lorsque v = 0. On peut donc poser que la<br />
fonction universelle exprimant l’énergie cinétique d’une particule est donnée par<br />
<br />
Ec m, v2<br />
c2 ⎛<br />
1<br />
= CE<br />
⎝<br />
1 − v2<br />
c2 ⎞<br />
− 1⎠<br />
, (D.39)<br />
où CE est la constante 2E ′ (m, 0), tandis que le terme E(m, 0) peut être considéré comme l’énergie<br />
totale d’une particule <strong>de</strong> masse m au repos. Nous avons admis que l’énergie cinétique relativiste<br />
se comportait comme l’énergie cinétique en théorie newtonienne pour les vitesses très petites<br />
<strong>de</strong>vant c. Or, d’après (D.39), on a<br />
<br />
Ec m, v2<br />
c2 <br />
= 1<br />
2 CE<br />
v2 <br />
4 v<br />
+ O<br />
c2 c4 <br />
.<br />
La comparaison avec l’expression newtonienne 1<br />
2 mv2 <strong>de</strong> l’énergie cinétique montre qu’il faut<br />
poser<br />
CE = mc 2 .<br />
D’où la formule (5.11).<br />
167
Mathématiques<br />
Bibliographie sommaire<br />
Ouvrages correspondant au niveau <strong>de</strong> ce cours :<br />
J. HLADIK, Calcul tensoriel en physique. Masson, 1994.<br />
A. LICHNEROWICZ, Éléments <strong>de</strong> calcul tensoriel. Armand Colin.<br />
Ouvrages <strong>de</strong> niveau plus élevé :<br />
Y. CHOQUET-BRUHAT, Géométrie différentielle et systèmes extérieurs. Dunod, 1968.<br />
L. P. EISENHART, Riemannian Geometry. Princeton Yniversity Press, 1926. Réédité par<br />
Dover.<br />
Physique<br />
Ouvrages correspondant au niveau <strong>de</strong> ce cours :<br />
J. HLADIK, Introduction à la relativité restreinte. Dunod, 2001.<br />
J. HLADIK, Introduction à la relativité générale niveau M 1. Ellipses, 2006.<br />
R. D’INVERNO, Introducing Einstein’s Relativity. Oxford University Press, 1992.<br />
B. SCHUTZ, A First Course in General Relativity. Cambridge University Press, 1985.<br />
I. SIMON, Relativité restreinte : Cours et applications. Vuibert, 2004.<br />
P. TOURRENC, Gravitation et Relativité. Armand Colin, 1997. (Ouvrage épuisé).<br />
Quelques ouvrages fondamentaux :<br />
L. LANDAU & E. LIFCHITZ, Théorie <strong>de</strong>s champs. Ellipses, 1998.<br />
C. W. MISNER, K. S. THORNE & J. A. WHEELER, Gravitation. Freeman, 1973.<br />
R. M. WALD, General Relativity. University of Chicago Press, 1984.<br />
S. WEINBERG, Gravitation and Cosmology : Principles and Applications of the General<br />
Theory of Relativity. Wiley, 1972.<br />
C. WILL, Theory and Experiment in Gravitational Physics. 2nd edit., Cambridge University<br />
Press, 1993.<br />
Recueil <strong>de</strong> problèmes :<br />
A. P. LIGHTMAN, W. H. PRESS, R. H. PRICE & S. A. TEUKOLSKY, Problem Book in<br />
Relativity and Gravitation. Princeton University Press, 1975.<br />
168