Indice de Dunn
De Wikipédia, l'encyclopédie libre
Remove ads
De Wikipédia, l'encyclopédie libre
L'indice de Dunn est une mesure de qualité d'une partition d'un ensemble de données en classification automatique[1].
C'est le rapport entre la distance minimum qui sépare deux éléments classés séparément et la distance maximum qui sépare deux éléments classés ensemble.
C'est un indice qui ne repose pas sur une distance particulière et qui peut donc être utilisée dans une grande variété de situations.
Une alternative à l'indice de Dunn est l'indice de Davies-Bouldin.
Si l'on note la matrice des données, dont chaque ligne correspond à un individu (ou observation) et chaque colonne correspond à un prédicteur (ou variable). On note le nombre d'individus et le nombre de prédicteurs :
Notons la dissimilarité entre les individus et (respectivement, ligne et de ). Notons le nombre de groupes que l'on souhaite former.
Un algorithme de partitionnement donnera une fonction d'attribution dont on cherche à évaluer la pertinence par un score. L'ensemble des points appartenant à un groupe est alors donné par .
L'indice (ou score) de Dunn, , se base sur les points moyens de chaque groupe et le diamètre du groupe .
Il aura pour expression[2] :
Elle peut varier un peu selon les implémentations (définition du diamètre d'un groupe, distance entre centres remplacée par une autre distance entre groupe).
L'indice de Dunn varie entre 0 (pire classification) et (meilleure classification).
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.