Loading AI tools
De Wikipédia, l'encyclopédie libre
En probabilités et en statistique, une distribution multimodale est une distribution statistique présentant plusieurs modes.
Les distributions multimodales peuvent être rencontrées dans divers domaines, dont :
La distribution peut être utilisée pour sa capacité prédictive comme n’importe quelle densité de probabilité ou fonction de répartition : l’observateur cherche à établir la loi de probabilité du phénomène étudié sur la base d’observations expérimentales dans le but d'évaluer la probabilité d'évènement n'étant pas dans la base d'observations initiales.
De manière plus analytique, elle est souvent étudiée après modélisation pour comprendre la raison de la multimodalité. La loi de probabilité observée peut, par exemple, être décomposée en deux, ou plusieurs, lois élémentaires unimodales, chacune s’appliquant avec une occurrence qui lui est propre. Ce processus d’identification est complexe, difficile à maitriser comme peut l'être par exemple l'identification de superposition de fréquence (analyse spectrale) ou de mélanges de lois.
Le cadre étudié est celui des variables aléatoires continues (ou variables aléatoires à densité).
La multimodalité d’une distribution indique deux possibilités :
À l'inverse, l'unimodalité d'une distribution ne constitue pas en soi une preuve d’homogénéité de l’échantillon : un échantillon peut être hétérogène vis-à-vis d’une caractéristique donnée, sans que cela ne fasse émerger plusieurs modes sur la variable aléatoire étudiée.
À titre de contre-exemple, soit un échantillon composé de :
Bien que cet échantillon soit hétérogène par construction, la distribution résultante ne présente qu’un mode, certes plus étendu que ceux des deux distributions normales à l’origine de la réponse d’ensemble, mais l'effet de l’hétérogénéité reste noyé dans le bruit naturel apporté par les variances des deux lois normales de base.
Partant du contre-exemple précédent, la bimodalité de la distribution résultante apparaît si l'on « écarte » davantage les deux lois normales :
Le paramètre clé qui fait apparaître (ou non) la bimodalité de la loi résultante est le biais réduit, c'est-à-dire le paramètre . Aucun lien immédiat n'existe entre le nombre de composants présents dans un mélange et le nombre de modes de la densité de probabilité résultante.
Le mélange de lois unimodales permet, sous certaines conditions, de créer un grand nombre de distributions multimodales (sens direct).
En revanche, retrouver à partir de la donnée de la distribution multimodale les lois unimodales qui la composent et leurs occurrences associées est une entreprise plus ardue (sens inverse) : la décomposition, toujours possible, n'est pas unique.
Pour illustrer la non-unicité d'une telle décomposition, on considère la distribution bimodale donnée par les deux figures ci-contre (courbe en violet). Cette distribution bimodale peut être vue comme le mélange de :
Un ensemble d'échantillons est dit homoscédastique si leur variance est uniforme.
Lorsque deux modes sont inégaux (c'est-à-dire que la densité de probabilité ne présente pas la même valeur pour ces deux modes) :
Le mélange de deux distributions unimodales constitue un moyen de générer des distributions bimodales, à condition que l'écartement des modes de ces lois de base soit grand devant les variances de ces dernières.
Les propriétés du mélange peuvent être déterminées à partir de celles des lois unimodales de base employées et de leurs occurrences.
X désigne la variable aléatoire continue étudiée.
Dans ce sens direct, les 2 distributions de base sont connues, ainsi que leurs occurrences associées :
Caractéristiques | Distribution no 1 | Distribution no 2 |
---|---|---|
Densité de probabilité | ||
Fonction de répartition | ||
Espérance (ou moyenne) | ||
Variance | ||
Occurrence |
Les distributions impliquées peuvent être quelconques : aucune hypothèse n’est faite sur la normalité ou non de ces lois.
Soient g(x) la densité de probabilité recherchée, et G(x) la fonction de répartition associée.
L’application des probabilités conditionnelles permet d’écrire :
D'où l'expression de la densité de probabilité du mélange :
Cette densité de probabilité est convenablement normalisée, puisque son intégrale sur le domaine de définition de X capture l'ensemble des effectifs :
Le même raisonnement s'applique sur la fonction de répartition du mélange :
Connaissant désormais l'expression de la densité de probabilité du mélange, le calcul de l'espérance s'effectue comme suit :
Le résultat trouvé correspond à l'intuition : l'espérance du mélange est le barycentre des espérances de chaque loi pondéré par leur occurrence.
Par indépendance, la moyenne des carrés est une forme linéaire des occurrences et : .
Le carré de l'espérance vaut : .
D'où l'expression de la variance du mélange - toujours sous la condition :
Cette expression montre que tout écart sur les moyennes, quel que soit son signe, contribue à augmenter la variance du mélange.
L'écart type du mélange s'obtient par sa définition habituelle : .
Ce cas de figure est fréquent, et présente une propriété permettant de retrouver les occurrences (p1 et p2=1-p1) par la lecture de la densité de probabilité du mélange.
Ce cas particulier est caractérisé par :
Si le biais est suffisant, le mélange de ces deux distributions est bimodal. Soient :
Une propriété de ce cas de figure est que le rapport des deux maxima de la fonction donne le rapport des deux occurrences :
Il s'agit d'un autre cas de figure suffisamment fréquent pour que ce mélange ait été étudié en détail[6].
La loi régissant la distribution du mélange de deux lois normales possède 5 paramètres :
Les conditions nécessaires et suffisantes pour que le mélange de distributions normales soit bimodal ont été identifiées par Ray et Lindsay[7].
Une condition nécessaire pour qu'un mélange homoscédastique de deux distributions normales - i.e. dont les écarts-types sont égaux - soit bimodal est que leurs moyennes diffèrent d'au moins 2 fois l'écart-type commun[8].
Une condition suffisante pour l'unimodalité du mélange est que[9]: .
Une condition suffisante pour l'unimodalité du mélange dans le cas où les deux variances sont identiques est que[9]: .
Une condition nécessaire et suffisante pour l'unimodalité du mélange est que[10]:
Soit : ou bien .
Une condition nécessaire et suffisante pour l'unimodalité du mélange est que[8]:
Soient et le facteur de séparation
La densité du mélange est unimodale si et seulement si .
Le raisonnement peut être étendu au cas du mélange de lois quelconques.
Les expressions de la densité de probabilité , de la fonction de répartition , de l'espérance et de la variance du mélange sont les suivantes :
Toujours sous la condition liant les occurrences : .
Les conditions d'émergence de modes multiples sont plus complexes à formuler que dans le cas du mélange de 2 lois.
Les distributions bimodales constituent des exemples typiques où les paramètres classiques des statistiques descriptives (moyenne, médiane, écart-type) peuvent se révéler insuffisants, voire trompeurs :
Bien que plusieurs soient suggérées, il n'existe actuellement aucune statistique descriptive universellement acceptée pour quantifier les paramètres d'une distribution multimodale dans le cas général.
En cas de distribution bimodale avérée, deux métriques peuvent être définies[11] pour caractériser les différences d'amplitude entre les deux pics sur la densité de probabilité, obtenue en pratique par l'histogramme des effectifs observés par intervalles de valeurs sur la grandeur d'intérêt.
Le rapport bimodal [11] est défini comme le rapport des pics droit (indice comme right) et gauche (indice comme left) :
où désigne la densité de probabilité de la distribution bimodale étudiée, l'abscisse du pic droit, l'abscisse du pic gauche.
Cette quantité indique lequel des deux pics domine donc une indication sur les proportions du mélange .
L'amplitude de la bimodalité [11] est définie par le rapport suivant :
est toujours compris entre 0 et 1. Plus grande est sa valeur, plus les pics sont émergents[11].
Cet indice suppose que la distribution observée est un mélange de deux distributions normales et .
Les articles[11],[12] introduisent la métrique de séparation bimodale définie comme suit :
D'autres auteurs lui préfèrent :Ces métriques reviennent à la définition du « biais de moyenne réduit » - cf. section Explications informelles. Elles quantifient l'écartement des deux pics par rapport aux variances « naturelles » des 2 distributions normales constituant le mélange, l'idée étant que les deux pics doivent être suffisamment écartés pour qu'émerge le caractère bimodal du mélange.
Outre la restriction au mélange de distributions normales, on peut objecter à ces deux métriques que :
Cet indice de bimodalité proposé par l'article[13] suppose que la distribution observée résulte du mélange de deux distributions normales d'égales variances (cas homoscédastique), de moyennes différentes, dans des proportions différentes. Cet indice est défini comme suit :Cet indice a du sens dans la mesure où :
Bien que la définition de cet indice incorpore la proportion de mélange , elle n'est pas suffisante pour capter tous les effets de cette proportion sur le comportement du mélange (cf. figure 11) et réduire ainsi l'analyse d'une dimension.
Cet indice est sujet aux mêmes objections que celles formulées à l'encontre des critères de séparation bimodale.
Les travaux de Cees van der Eijk portent sur les comportements politiques comparés et leur méthode de mesure. Les distributions multimodales sont fréquentes dans ce domaine : elles révèlent différents groupes d’opinion.
Dans son article référencé[14], l’auteur :
La variable aléatoire examinée consiste en une échelle de notation à niveaux (ou rating scale). Si la variable aléatoire originelle est continue (variable à densité), il faut diviser son domaine en classes d’égale étendue.
En matière de sondages d’opinion, le nombre de niveaux est nécessairement limité pour des raisons pratiques liées au questionnaire, mais doit suffisamment rester élevé pour permettre une bonne résolution sur les écarts entre individus. Les échelles de 7, 9, 10 ou 11 points sont couramment pratiqués, cadre dans lequel s’inscrit la mesure de l’Accord.
L’échelle de l’Accord est adimensionnelle. L’auteur l’a construite de façon à respecter 3 niveaux caractéristiques :
La méthode de Van der Eijk s’appuie sur une distribution élémentaire : la distribution semi-uniforme, dans laquelle les différentes classes offertes par l’échelle de notation sont soit vides, soit équi-peuplées.
Une telle distribution est complètement caractérisée par :
Le motif est représenté par un -uplet de valeurs binaires : 0 représente une classe vide, 1 représente une classe non-vide.
Une distribution semi-uniforme est unimodale si et seulement si toutes les classes non-vides (i.e. les séquences de 1) sont contiguës.
Dans le cas contraire, où des 0 s’intercalent entre deux classes non-vides, la distribution semi-uniforme est multimodale.
La distribution étant unimodale, sa mesure d’unimodalité vaut 1 par construction de l'ensemble de la méthode.
Il reste alors à quantifier l’étendue des classes non-vides dans la plage permise par l’échelle de notation (à valeurs) pour obtenir la mesure de l’accord .
Soit le nombre de classes non-vides. L’auteur propose la forme linéaire suivante :
Cette expression réalise les conditions limites souhaitées :
Toute étendue intermédiaire des classes non-vides aboutit à un accord compris entre 0 et 1, l’accord étant d’autant plus faible que l’on tend vers la distribution uniforme.
Remarquons que l’accord ne dépend que de l’étendue des classes non-vides contiguës, et non des valeurs de l’échelle de notation associées à cette localisation : sur une échelle de notation à 7 niveaux, les motifs et présentent la même valeur .
L’auteur propose de pondérer l’expression précédente de l’accord par une mesure d’unimodalité inférieure à 1, soit :
La mesure d’unimodalité est construite suivant le principe directeur selon lequel l’inclusion de nombreuses classes vides (0) entre deux séquences de classes non-vides (1), tendant à rejeter ces dernières sur les extrêmes de l’échelle de notation (à niveaux), traduit :
La mesure d’unimodalité est évaluée par la méthode suivante :
L’évaluation de l’unimodalité demande de recenser tous les triplets constitués de deux « 1 » et d’un « 0 » parmi le K-uplet représentant le motif de la distribution semi-uniforme.
désignant toujours le nombre de classes non-vides, il représente le nombre de « 1 » contenus dans le motif. Le nombre de triplets recherchés vaut :
L’auteur propose d’évaluer la mesure de l’unimodalité par la formule suivante :
Remarques :
Cette mesure d’unimodalité tend vers 1 (distribution unimodale) lorsque tend vers 0 : pas de triplets de type déviant de l’unimodalité.
Le cas de bimodalité extrême est atteint lorsque les deux classes non-vides sont rejetés sur les bords du motif , auquel cas :
L’histogramme réel contenant les observations n’a pas de raison de se conformer au modèle théorique de la distribution semi-uniforme défini précédemment.
En revanche, toute distribution (portant sur une échelle de notation à K niveaux) peut être décomposée sous la forme d’au plus couches de distributions semi-uniformes[14].
Le principe de cette décomposition consiste :
La valeur finale de l’accord est obtenue par la somme pondérée des accords de chaque couche par son poids dans la distribution totale. Le poids est défini comme le rapport des effectifs de la ième couche sur les effectifs totaux.
Ce mécanisme de décomposition est illustré par la figure ci-dessous :
Sur la base de l'exemple donné en Figure 13 :
La décomposition des effectifs de l'histogramme en 7 couches de distributions semi-uniformes est effectuée comme suit :
Ceci permet d'accéder à la représentation en motifs et poids pour chaque couche, et d'effectuer les calculs des mesures d'unimodalité et de l'Accord :
Un autre exemple montre deux distributions portant sur la même variable (échelle de notation à 8 niveaux) :
Avantages | Limites |
---|---|
La méthode est autoporteuse :
|
Nécessité de former des classes d'égale étendue, ce qui peut limiter la portée de la méthode, ou causer une perte d'information. |
La méthode distingue les 2 cas :
|
Aucune règle ne permet de définir un intervalle de confiance autour de l'Accord , puisque l'auteur ne définit pas la statistique qui régit cet Accord. |
Point d'attention :
La comparaison de deux distributions (sur la base de l'accord ) n'a de sens que si l'échelle comporte le même nombre de points . |
La méthode d'Otsu propose de déterminer un seuil de séparation entre deux modes à partir d'un histogramme des effectifs d'une distribution d'origine donnée. Le seuil de séparation jugé pertinent suivant cette méthode est celui qui minimise les variances intra-classes, donc celui qui maximise la variance inter-classes[15].
Cette méthode, utilisée en traitement d'image, aboutit à un résumé binaire de la distribution d'origine, avec perte d'information. Cette méthode est d'autant plus pertinente que la distribution d'origine présente un caractère bimodal affirmé.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.