Loading AI tools
application formalisant l'idée de plus petit chemin reliant deux points dans un espace mesurable ou dans un espace physique observable De Wikipédia, l'encyclopédie libre
En mathématiques, une distance est une application qui formalise l'idée intuitive de distance, c'est-à-dire la longueur qui sépare deux points. C'est par l'analyse des principales propriétés de la distance usuelle que Fréchet introduit la notion d'espace métrique, développée ensuite par Hausdorff. Elle introduit un langage géométrique dans de nombreuses questions d'analyse et de théorie des nombres[1].
À partir de la définition d'une distance, vue comme une application satisfaisant à certains axiomes, d'autres notions de distance peuvent être définies, comme la distance entre deux parties, ou la distance d'un point à une partie, sans que ces dernières répondent à la définition première d'une distance.
On appelle distance sur un ensemble E toute application d définie sur le produit E2 = E×E et à valeurs dans l'ensemble ℝ+ des réels positifs ou nuls,
vérifiant les propriétés suivantes[2] :
Nom | Propriété |
---|---|
symétrie | |
séparation | |
inégalité triangulaire |
Un ensemble muni d'une distance s'appelle un espace métrique.
La distance est dite ultramétrique si de plus :
Nom | Propriété |
---|---|
Ultramétrie |
Un exemple de telle distance intervient de façon cruciale dans la théorie des valuations p-adiques. L'interprétation géométrique de l'inégalité triangulaire dans un espace ultramétrique amène à dire que tous les triangles sont isocèles ; de plus, toutes les boules de rayon donné définies sur cet ensemble constituent une partition de cet ensemble ; en faisant croître ce rayon depuis 0, l'espace se trouve doté d'une structure hiérarchique de proximité, utilisable en classification automatique, en particulier pour le clustering hiérarchique.
Sur un espace vectoriel normé , la distance d « induite par » la norme[5] est définie par :
En particulier, dans ℝn (donc aussi dans ses sous-ensembles[6]), on peut définir de plusieurs manières la distance entre deux points, bien qu'elle soit généralement donnée par la distance euclidienne (ou 2-distance). Soit deux points de E, (x1, x2, …,xn) et (y1, y2, …,yn), on exprime les différentes distances ainsi :
Nom | Paramètre | Fonction |
---|---|---|
distance de Manhattan | 1-distance | |
distance euclidienne | 2-distance | |
distance de Minkowski | p-distance | |
distance de Tchebychev | ∞-distance |
La 2-distance permet de généraliser l'application du théorème de Pythagore à un espace de dimension n. C'est la distance la plus « intuitive ».
La p-distance est rarement utilisée en dehors des cas p = 1, 2 ou ∞. L'∞-distance présente la particularité amusante de permettre la définition en toute rigueur de sphères cubiques (voir oxymore). La 1-distance permet de définir des sphères octaédriques.
Sur n'importe quel ensemble, la distance discrète d est définie par : si x = y alors d(x, y) = 0 et sinon, d(x, y) = 1.
Il est également possible de définir des distances entre des permutations. L'exemple suivant est très utilisé dans le réarrangement de génomes. Soit S un ensemble de permutations modélisant diverses opérations ; alors la distance entre deux permutations π et σ est la longueur d'une séquence minimale formée du produit d'éléments de S telle que cette séquence transforme π en σ.
On peut utiliser la distance de Kendall qui mesure le nombre de transpositions permettant de passer d'une permutation à une autre, ce qui revient à calculer l'indice tau = (somme des couples concordants) - (somme des couples discordants) / n(n-1)/2. L'indice varie de -1 à +1 selon la ressemblance entre les permutations.
Ces distances peuvent également servir à mesurer, de diverses manières, le désordre présent dans une séquence. On utilise alors ces mesures pour analyser les performances de divers algorithmes de tri, ou pour construire de nouveaux algorithmes de tri qui effectuent un nombre de comparaisons optimal par rapport à la mesure de désordre choisie.
La distance de Levenshtein est un exemple de distance définie sur l'ensemble des chaînes de caractères. Elle est définie pour deux chaînes A et B comme le nombre minimal d'opération d'ajout/suppression/remplacement de caractères pour transformer la chaîne A en la chaîne B.
Exemples:
Ce type de distance est couramment utilisé pour des applications de filtrage/correction d'erreurs, par exemple la correction automatique pour des programmes de traitement de texte (le programme va rechercher dans un dictionnaire les mots présentant les distances les plus faibles avec le mot mal orthographié), l'appareillement de lectures optiques de plaques minéralogiques...
Il existe des variantes de cette distance, telles que la distance de Damerau-Levenshtein.
Le même principe général peut être utilisé pour les applications de reconnaissance de formes.
Le terme distance est parfois utilisé pour désigner des applications ne répondant pas à la définition classique pour les espaces métriques, présentée en début d'article.
Soient E1 et E2 deux parties non vides d'un espace métrique E muni d'une distance d, on définit la distance entre ces deux ensembles comme :
C'est un réel positif, comme borne inférieure d'un ensemble non vide de réels positifs.
Néanmoins, il est possible de définir une vraie distance entre les parties compactes d'un espace métrique, la distance de Hausdorff.
Avec les notations ci-dessus, , où désigne l'adhérence d'une partie de [8].
On peut particulariser la définition précédente en prenant l'un des deux ensembles réduit à un point.
Si A est une partie non vide d'un espace métrique E, et si x est élément de E, on définit la distance de x à A comme une borne inférieure :
C'est[9] le rayon de la plus grande boule ouverte de centre x qui ne rencontre pas A.
On prendra garde au fait que d(x, A) = 0 n'implique pas en général que x soit élément de A. Par exemple, dans ℝ muni de la valeur absolue, la distance de 0 à l'intervalle ouvert ]0, 1[ est nulle, ou la distance de tout réel à l'ensemble des rationnels est nulle également.
Plus précisément, la distance de x à A est nulle si et seulement si[10],[11] x est un point adhérent à A (autrement dit : l'implication précédente est vraie si et seulement si A est fermé). Plus généralement, la distance de x à A est égale à la distance de x à l'adhérence de A.
L'application de E dans ℝ qui à tout élément x de E associe d(x, A) est continue, et même 1-lipschitzienne[12],[13] : .
Soit deux points A et B d'un espace affine par lesquels passe une droite orientée (une droite munie d'un sens, c'est-à-dire engendrée par un vecteur non nul). On appelle distance algébrique[réf. nécessaire] de A vers B le réel tel que :
On peut démontrer que la distance algébrique de A vers B (notée ) vaut :
Attention, la distance algébrique n'est pas une distance, puisqu'elle est non symétrique :
En théorie de l'information on peut définir une distance entre deux textes comme la taille du plus petit programme permettant de passer de l'un à l'autre ; c'est la distance algorithmique.
En allégeant les axiomes de la définition d'une distance, on arrive à diverses généralisations de celle-ci :
Nom | valeurs finies | symétrie | inégalité du | ||
---|---|---|---|---|---|
distance | ✔ | ✔ | ✔ | ✔ | ✔ |
quasi-distance | ✔ | ✘ | ✔ | ✔ | ✔ |
métamétrique | ✔ | ✔ | ✘ | ✔ | ✔ |
pseudo-distance | ✔ | ✔ | ✔ | ✘ | ✔ |
semi-distance | ✔ | ✔ | ✔ | ✔ | ✘ |
distance faible | ✔ | ✘ | ✔ | ✘ | ✔ |
pramétrique | ✔ | ✘ | ✔ | ✘ | ✘ |
écart | ✘ | ✔ | ✔ | ✘ | ✔ |
La condition que la distance prenne ses valeurs dans [0, +∞[ peut être aussi assouplie en considérant des « distances à valeurs dans un ensemble ordonné filtrant ». La reformulation des axiomes dans ce cas conduit à la construction des espaces uniformes : des espaces topologiques avec une structure abstraite permettant de comparer les topologies locales de points différents.
Parmi les catégories correspondant aux diverses variantes de distance, celle des espaces pseudo-métriques « étendus » (c.-à-d. autorisant la valeur +∞), avec comme morphismes les applications 1-lipschitziennes, est celle qui se comporte le mieux : on peut y construire des produits et des coproduits arbitraires et former des objets quotients. Si on enlève étendu, on peut seulement prendre des produits et des coproduits finis. Si on enlève pseudo, on ne peut plus prendre des quotients.[réf. nécessaire] Les espaces d'approche sont une généralisation des espaces métriques qui maintiennent ces bonnes propriétés de catégorie.[réf. nécessaire]
Il existe aussi, en géométrie différentielle, les notions de métriques riemanniennes et pseudo-riemanniennes sur une variété différentielle (et non plus simplement sur un ensemble).
Les quasi-distances sont plutôt appelées distances asymétriques. Le terme quasi étant souvent utilisé en géométrie pour désigner une propriété à constante près.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.