Groupe de Travail de l'équipe “Probabilités & Statistiques de l'Institut Élie Cartan (Nancy)
5 & 12 juin 2014 : Rémi Peyre
Quelques mots sur le transport optimal des mesures

Le cout de transport optimal entre deux mesures μ et ν sur deux espaces polonais X respectifs et Y représente le cout requis pour transformer μ en ν lorsque le transport d'une masse dp du point x au point y coute c(x,y)dp ; autrement dit, c'est l'infimum, pour les mesures π sur X×Y ayant pour marginales respectives μ et ν, de ∫c(x,y)dπ(x,y).

La notion de transport optimal, qui s'avère fort précieuse en analyse, permet de mieux comprendre les mesures en général et les mesures de probabilité en particulier ; c'est pourquoi cet exposé se propose de présenter quelques aperçus de ce vaste domaine potentiellement utiles pour les probabilistes. Notre plan sera le suivant :

  1. Après avoir défini le principe du transport optimal en général, nous considèrerons le cout de transport optimal entre deux mesures d'un même espace métrique lorsque la fonction de cout c(x,y) est de la forme dist(x,y)p, ce qui nous amènera au concept de distance de Wasserstein entre les mesures. Nous verrons en particulier que la distance de Wasserstein métrise la topologie de la convergence faible sur les espaces bornés.
  2. Nous verrons comment les propriétés de la distance de Wasserstein « quadratique » permettent d'établir une preuve du théorème-limite central de nature très différente de la méthode habituelle, dans la mesure où aucune notion de transformée de Fourier n'interviendra. Nous mentionnerons aussi comment le même genre de méthode s'applique à la relaxation vers l'équilibre de certains systèmes de particules.
  3. Nous évoquerons ensuite l'inégalité de Talagrand, qui s'exprime en termes de transport optimal, et qui permet de démontrer des résultats de vitesse de relaxation de certains semigroupes de diffusion ainsi que de concentration de la mesure, en particulier en grande dimension.
  4. Nous examinerons la géométrie induite par le transport optimal quadratique sur l'espace des mesures sur Rd, auquel la distance de Wasserstein confère une structure de “variété riemannienne de dimension infinie”. Sur cette variété, certaines équations aux dérivées partielles peuvent se réinterpréter comme la descente de gradient d'une fonctionnelle d'« énergie libre » ; dans certains cas, on peut montrer que cette fonctionnelle est “convexe” et en déduire l'unicité de l'équilibre.
  5. Comme le temps ne nous le permettra pas, nous ne parlerons pas pour finir de la dualité de Kantorovitch, qui montre que le cout de transport optimal, à priori défini comme un infimum sur un espace de mesures, correspond aussi à un supremum sur un espace de fonctions. Cette dualité rend le calcul des distances de transport optimal beaucoup plus concret, puisqu'il devient alors “facile” de prouver des bornes inférieures sur le cout de transport optimal ; elle s'avère aussi très utile dans de nombreuses autres applications.