En astronomie, l'équation de Kepler est une formule liant, dans une orbite, l'excentricitée et l'anomalie excentriqueE à l'anomalie moyenneM. L'importance de cette équation est qu'elle permet de passer des paramètres dynamiques du mouvement d'un astre (l'anomalie moyenne) aux paramètres géométriques (l'anomalie excentrique). Cette équation a été établie par Kepler dans le cas des orbites elliptiques, en analysant les relevés de position de la planète Mars effectués par Tycho Brahe[1]. Elle fut ensuite généralisée aux autres formes d'orbites (paraboliques, hyperboliques, quasi-paraboliques, rectilinéaires) à l'aide des principes de la mécanique newtonienne.
L'équation de Kepler en tant que telle est celle établie par Kepler pour les orbites elliptiques. Elle peut cependant être déclinée en plusieurs formes pour couvrir tous les cas d'orbites.
Sa démonstration est simple et fait appel au calcul de l'aire d'un secteur d'ellipse, dont le sommet est occupé par un des deux foyers, par deux méthodes différentes, dont l'une faisant appel à la loi des aires et l'autre en calculant l'aire de ce secteur elliptique projeté sur le cercle principal de l'ellipse.
D'après la seconde loi de Kepler, l'aire balayée par le segment SP sur le schéma est proportionnelle au temps. Donc l'aire du secteur elliptique SzP est égale à k(t – t0), où t est le temps et t0 est l'instant du passage de l'astre en z. La constante de proportionnalité k peut être déterminée facilement: au bout d'une période orbitale T, l'aire balayée sera égale à l'aire totale de l'ellipse πab (a et b étant le demi grand axe et demi petit axe de l'ellipse), soit:
Il reste à déterminer l'aire du secteur d'ellipse SzP géométriquement pour faire le lien entre le temps écoulé depuis le passage en z et la position sur l'orbite.
Kepler a utilisé pour cela un cercle auxiliaire circonscrit à l'ellipse (l'aire d'un secteur circulaire étant facile à connaître).
L'aire du secteur Szx est égale à la différence du secteur circulaire czx et du triangle cSx.
où E est exprimé en radians.
Finalement, SzP = Szx×b/a: l'un étant une compression de l'autre du rapport b/a (où plus précisément, une affinité de rapport b/a)
On obtient l'équation de Kepler, après simplification, en explicitant l'égalité SzP = k(t – t0), soit:
Par un changement de variable, les équations de Kepler elliptiques, paraboliques et hyperboliques peuvent être regroupées en une seule équation "universelle"[3],[4]. Une des expressions possible est:
avec le périastre q = a(1-e), et α = 1/a. α est positif pour les orbites elliptiques, nul pour les orbites paraboliques et négatif pour celles hyperboliques. La nouvelle variable x est définie par:
et la fonction c3(t) est une des fonctions de Stumpff, qui s'écrit dans le cas général:
Démonstration
En partant de l'équation elliptique,
avec
et en procédant au changement de variable
on obtient
Avec le développement en série du sinus, on trouve:
L'équation de Kepler se transforme en:
La discontinuité sur a pour les orbites paraboliques a été supprimée, et l'expression de a n'apparait plus sous une racine carré, rendant utilisable cette équation aussi pour les orbites hyperbolique. La formule obtenue en partant de l'équation de Kepler hyperbolique serait en tout point équivalente à celle-ci en posant .
La détermination de x d'après l'équation universelle permet de déterminer la position du corps sur son orbite (X,Y) par:
Les fonctions c1(t) et c2(t) étant définies de la même manière que c3(t) plus haut.
Orbites rectilinéaires
Les orbites rectilinéaires sont des cas limites des autres orbites, en faisant tendre la distance au périastre q vers zéro tout en conservant le demi grand axe a constant: l'orbite tend alors vers un segment ou une demi-droite. Pour le cas des orbites elliptiques et hyperboliques, cela suppose de faire tendre l'excentricité e vers 1, car demi grand axe a, excentricité e et périastre q sont liés par q = a(1–e). Il existe donc trois types d'orbites rectilinéaires: elliptiques, paraboliques et hyperboliques. En pratique, une partie seulement de ces orbites est décrite par l'astre, aboutissant soit à une collision, soit à une évasion. Certaines comètes kamikazes détectées par les observatoires solaires spatiaux (SoHO, SDO…) ou bien des tronçons d'orbites de sondes interplanétaires sont proches des orbites rectilinéaires.
Pour l'orbite rectilinéaire elliptique, l'équation de Kepler devient:
avec l'anomalie moyenne M définie par:
L'anomalie vraie n'ayant plus de signification pour une orbite rectilinéaire, la position de l'astre est définie par sa distance le séparant de l'astre principal r:
Pour l'orbite rectilinéaire hyperbolique, l'équation de Kepler devient:
et la position de l'astre:
a étant négatif pour les orbites hyperboliques
Enfin, pour l'orbite rectilinéaire parabolique:
avec
et
et la position de l'astre:
L'équation de Kepler
permet de calculer de manière directe la date (liée à M) correspondant à une position donnée (liée à E), par exemple déterminer la date des équinoxes. Par contre le problème inverse, déterminer la position d'une planète pour une date donnée, nécessite la détermination de E, connaissant M et e. Ce problème ne peut pas être résolu de manière simple.
Résoudre l'équation de Kepler, c'est trouver E(e,M):
E – M est une fonction continue, impaire et périodique de période 2π; elle est donc développable en série de Fourier, dont les coefficients des cosinus sont tous nuls.
avec
Pour changer la variable d'intégration, on intègre par parties, en posant u = sin(E) et dv = sin(pM) dM, on obtient:
En transformant le produit de cosinus en somme de cosinus, on obtient:
après avoir remplacé dM par (1–e cos E )dE (égalité obtenue en dérivant l'équation de Kepler).
Or, les fonctions de Bessel de première espèce s'expriment par:
d'où:
Par ailleurs, les fonctions de Bessel vérifient la relation de récurrence:
d'où finalement:
Série entière de l'excentricité
C'est encore Lagrange qui trouve la solution, que Laplace complétera en donnant le rayon de convergence. Ces travaux inspireront Cauchy[7], qui fondera la théorie des séries analytiques pour résoudre ce problème épineux; celui-ci verra son aboutissement avec les travaux de Puiseux[8].
Le rayon de convergence minimum de la série, qui dépend de M, est atteint pour M = π/2, et vaut e0 = 0,6627434193
tel qu'indiqué par Laplace (1823) et démontré par Cauchy et Puiseux:
et x tel que .
Ceci rend cette formule inapplicable pour déterminer la position des comètes, dont l'excentricité est souvent voisine de 1.
Les premiers termes sont:
Note: il est possible d'obtenir ce développement en série en remplaçant dans la série de Fourier précédente les fonctions de Bessel par leur développement limité:
On obtient alors le développement limité beaucoup plus simplement que par la méthode de l'inversion de série:
Il est à noter que bien que la série de Fourier converge pour 0 < e < 1, et que les développements des fonctions de Bessel aient un rayon de convergence infini, le résultat après réorganisation des termes ne converge que pour e < 0,662...
Cas des comètes: e > e0
Le premier à se confronter au problème est Horrocks, puis surtout Halley[9], pour les calculs sur sa comète d'excentricité e = 0,9673.
Plusieurs solutions ont été proposées en modifiant légèrement l'équation de Barker (e = 1). La solution proposée par Bessel (1805) couvre le domaine e > 0,997. Gauss[10] s'illustra en donnant une belle solution pour 0,2 < e < 0,95.
Une généralisation de l'équation de Barker est un développement en série convergeant d'autant plus rapidement que l'excentricité e est proche de 1, ce qui s'avère bien adapté aux cas des comètes (cette série s'applique aussi aux orbites légèrement hyperboliques):
Lorsque e = 1, la série se réduit à l'équation de Barker.
Démonstration
La première loi de Kepler stipule que les orbites sont des sections coniques (ellipses, paraboles ou hyperbole) ayant le soleil pour foyer. Donc la distance comète - soleil r et l'anomalie vraiev sont liées par l'équation d'une conique en coordonnées polaires:
où p et e sont respectivement le paramètre de l'excentricité de la conique.
La deuxième loi de Kepler (le segment soleil-comète balaye des aires égales en des temps égaux) peut être exprimée, en considérant un intervalle de temps dt infiniment petit:
En combinant ces deux équations, on peut faire disparaître r, pour obtenir le lien entre le temps et l'anomalie vraie, c'est-à-dire une forme de l'équation de Kepler s'appliquant à tout type d'orbite.
La fonction rationnelle peut être intégrée directement pour obtenir toutes les formes des équations de Kepler vues plus haut, dépendant du signe de γ. Mais en développant la fraction rationnelle en série entière de s, puis en intégrant terme à terme cette série, on obtient:
permet de retrouver la formule cherchée (en négligeant la masse m2 de la comète vis-à-vis de celle du soleil).
Calcul numérique
L'équation de Kepler peut être résolue à l'aide d'un algorithme de recherche d'un zéro d'une fonction. Les méthodes du type encadrement, méthode de dichotomie, méthode de la fausse position nécessitent un encadrement de départ dans lequel la racine est présente. Du fait de la périodicité et la parité de l'équation de Kepler, il est toujours possible de ramener l'intervalle de départ à [0 , π]. Ceci fournit un encadrement de départ pour ces méthodes, mais il est aisé d'en trouver de plus fins.
Les méthodes du type point fixe nécessitent une estimation de départ de la racine, le germe de la méthode E0, pour lancer les calculs: il en existe de multiples dans la littérature, dont la plus simple est E0 = M.
La méthode de type point fixe la plus simple, celle utilisée par Kepler, est:
converge lentement lorsque e est proche de 1. Il est alors avantageux de lui adjoindre un algorithme d'accélération de la convergence: le Delta-2 de Aitken, par exemple, ou la variante de Steffensen.
L'équation de Kepler se prête particulièrement bien aux algorithmes nécessitant le calcul des dérivées successives élevées, du fait du faible coût en calcul machine nécessaire. En effet:
Les dérivées suivantes se déduisant cycliquement des précédentes. Les variantes de la méthode de Newton et de Halley d'ordres plus élevés sont donc très performantes dans ce cas. Il est à noter que ces méthodes peuvent dans certains cas avoir des difficultés à converger (e proche de 1 et M proche de 0). Il est préférable dans ces zones soit de proposer une valeur de départ moins grossière (germe de Mikkola (Seppo Mikkola) ou de Markley), soit de brider les méthodes itératives pour les forcer à converger (modification de Hamming de la méthode de Newton), ou d'utiliser des méthodes itératives à convergence moins locale (méthode de Laguerre).
Exemple
Lors de son dernier passage en 1986, la comète de Halley a eu la visite de la sonde Giotto. Les données nécessaires pour déterminer la position de la comète lors de cette rencontre sont[11]:
date de la rencontre t: à 00:03:00 UTC, soit t – t0 = 32,54328 jours
excentricité de l'orbite e: 0,96727426
distance au périhélie q: 0,58710224, soit le demi grand axe a = q/(1–e) = 17,940753 et le moyen mouvement n = k/a1,5 = 0,0002263836 rad/jour.
L'anomalie moyenne vaut M =n (t – t0) = 0,0073673887 rad
L'équation de Kepler à résoudre est:
En partant de E0 = M et en utilisant la méthode de Newton,
on trouve successivement:
0,0073673887
0,2249486948
0,1929911041
0,1909186907
0,1909107985
0,1909107984
… (les valeurs suivantes étant identiques)
On en déduit l'angle de position de la comète sur son orbite (l'anomalie vraie) v = 1,2771772327 rad = 73,176865125°
La distance de la comète au soleil se calcule par r = a(1 – e cos(E)) = 0,902374257 UA (légèrement inférieure à la distance terre-soleil)
La vitesse de la comète vaut soit 43,780 8km/s
Les itérations ne se passent pas toujours aussi bien pour les comètes, comme l'expose le graphique ci contre.
Pour des excentricités au-delà de 0.97, la convergence est incertaine avec comme point de départ des itérations E0 = M. D'autres points de départ plus précis permettent d'éviter cet écueil.
Dans le cas des comètes, la résolution de la généralisation quasi-parabolique de l'équation de Barker pose deux problèmes:
le calcul approché de la série qui peut nécessiter un grand nombre de termes, voire être impossible si elle diverge. Il se trouve que cette série se prête particulièrement bien à l'utilisation d'algorithmes d'accélération de la convergence, notamment le Δ² de Aitken ou l'ε-algorithme de Peter Wynn, qui non seulement accélèrent la convergence, mais étendent son domaine de convergence. En pratique, les difficultés interviennent lorsque la comète est très loin de son périastre (elle est alors depuis longtemps invisible), ou son excentricité diffère notablement de 1 (dans ce cas, il est plus judicieux de résoudre l'équation de Kepler elliptique ou hyperbolique).
La résolution de l'équation proprement dite. Celle-ci peut être effectuée par les méthodes de type Newton avec:
en remarquant que la dérivée s'exprime simplement:
les dérivées suivantes s'en déduisent facilement.
On pourra choisir comme valeur initiale de l'itération S0, la solution de l'équation cubique obtenue en retenant les premiers termes (différant légèrement de l'équation de Barker), à l'aide de la méthode de Cardan
Les calculs via les intégrateurs symplectiques exigent de rester toujours en butée du nombre de décimales, dans le moindre coût de calcul. Elle dépend beaucoup du doublet (M,e), M compris entre 0 et π et de e, surtout quand ce dernier paramètre est voisin de 1.
Nijenhuis (1991) adopte la méthode de Mikkola (1987) qui est la méthode de Newton d'ordre 4, en choisissant «adéquatement» le germe E0 en fonction du doublet (M,e).
Il est clair que dans les calculs numériques, le volume de calculs est essentiel, autant que le nombre de décimales, vu l'instabilité du système solaire évaluée à un coefficient de Liapunov de 10(t/5 Myr). On se heurte à une muraille exponentielle: difficile d'aller plus loin que 25 Myr, même avec un traitement 128 bits.
Ce sont ces calculs (astronomiques... mais informatisés) qui tournent sur les machines de l'IMCCE-Paris. Le calcul de l'ensoleillement terrestre à la latitude 65° Nord, I(65,t) est calculé et on essaie d'en déduire la corrélation avec le climat passé: l'échelle géologique jusqu'au néogène (25 M ans) en est déduite (échelle géologique Gradstein 2004). Prochaine étape prévue: les 65 M ans.
Histoire des sciences
Avant Kepler, l'équation était déjà étudiée pour d'autres motifs:
c'est le problème de la réduction des coordonnées locales aux coordonnées géocentriques: il faut réduire la correction de parallaxe. Habash al Hasib s'y est déjà attaqué.
Avant 1700, il y a déjà beaucoup de tentatives: Kepler naturellement, Curtz (1626), Niele, Boulliau (1645, 1657), Seth Ward (1653), Paganus (1657), Horrebow (1717), Cassini (1669), Newton (1665?), Wren (1658), Wallis (1659), Jeremiah Horrocks (1638)...
(la) J. Kepler, Astronomia nova aitiologetos, seu physica coelestis, tradita commentariis de motibus stellae Martis, ex observationibus G. V. Tychonis Brahe, The Warnock Library, 1609
(en) T. Barker(en), An account of dicoveries concerning comets, with the way to find their orbits, and some improvements in constructing and calculating their places, Londres, 1757
V. Puiseux, «Sur la convergence des séries qui se présentent dans la théorie du mouvement elliptique des planètes», dans Journal de mathématiques pures et appliquées, vol. 14, 1849, p.33-39
(en) Albert Nijenhuis(de), «Solving Kepler's Equation with high efficiency and accuracy», Celest. Mech. Dyn. Astron., vol.51, , p.319-330 (lire en ligne)
(en) Seppo Mikkola, «A cubic approximation for Kepler's equation», Celest. Mech. Dyn. Astron., vol.40, , p.303–312 (lire en ligne)
[OI] (en) «Kepler's equation» [«équation de Kepler»], notice d'autorité no20110803100034177 de l'Oxford Index (OI), dans la base de données Oxford Reference de l'Oxford University Press (OUP).