Conjunto de datos flor iris

De Wikipedia, la enciclopedia libre

Conjunto de datos flor iris

El conjunto de datos flor Iris o conjunto de datos iris de Fisher es un conjunto de datos multivariante introducido por Ronald Fisher en su artículo de 1936, The use of multiple measurements in taxonomic problems (El uso de medidas múltiples en problemas taxonómicos) como un ejemplo de análisis discriminante lineal.[1] A veces, se llama Iris conjunto de datos de Anderson porque Edgar Anderson coleccionó los datos para cuantificar la variación morfológica de la flor Iris de tres especies relacionadas.[2] Dos de las tres especies se coleccionaron en la Península de la Gaspesia «todos son de la misma pastura, y recolectado el mismo día y medidos al mismo tiempo por la misma persona con el mismo aparato».[3]

Thumb
Diagrama de dispersión del conjunto de datos

El conjunto de datos contiene 50 muestras de cada una de tres especies de Iris (Iris setosa, Iris virginica e Iris versicolor). Se midió cuatro rasgos de cada muestra: el largo y ancho del sépalo y pétalo, en centímetros. Basado en la combinación de estos cuatro rasgos, Fisher desarrolló un modelo discriminante lineal para distinguir entre una especie y otra.

Uso del conjunto de datos

Resumir
Contexto
Thumb
Resultados insatisfactorios k-means (el conjunto de datos no hace racimos hasta las clases conocidas) y especies de verdad visualizados usando ELKI
Thumb
Un ejemplo del supuesto "mapa del metro" por el conjunto de datos de los Iris.[4] Sola una fracción pequeña de Iris-virginica se mezcla con Iris-versicolor. Todas las otras muestras de las especies diferentes de Iris son de los nódulos diferentes.

Basado en el modelo análisis discriminante de Fisher, este conjunto de datos se convirtió en un caso de prueba típico por muchas técnicas clasificaciones estadísticas en aprendizaje automático como en máquinas de vectores de soporte.

Sin embargo, el uso de este conjunto de datos en algoritmos de agrupamiento no es común porque el conjunto de datos solo contiene dos racimos, con una separación obvia y clara. Uno de los racimos contiene Iris setosa, mientras el otro contiene ambos Iris virginica y Iris versicolor y no es separable sino que uno tiene la información de especies usadas por Fisher. Esto hace el conjunto de datos un ejemplo bueno para explicar la diferencia entre técnicas que se supervisan o no en la minería de datos: El modelo análisis discriminante solo se puede obtener cuando la especie objeta se conoce: etiquetas de clase y racimos no son siempre lo mismo.[5]

Sin embargo, estas tres especies se pueden separar en la proyección en el componente principal del ramaje no lineal.[6] El conjunto de datos se aproxima por el árbol más cerca con alguna sanción por el número excesivo de nódulos, doblándose y estirándose. Luego el mapa metro se construye.[4] Se proyectan los puntos de datos para el nódulo más cerca. Por cada nódulo se prepara el gráfico circular de los puntos proyectados. La zona del gráfico es proporcional al número de los puntos proyectados. Se ve claro del gráfico que la mayoría absoluta de las muestras de las especies distintas de Iris son de los nódulos diferentes. Sola una fracción pequeña de Iris-virginica se mezcla con Iris-versicolor (la mezcla de nódulos azules con verdes en el diagrama). Así las tres especies de Iris (Iris setosa, Iris virginica y Iris versicolor) se separan por los procedimientos no supervisados del análisis del componente principal no alineado. Para discriminarlos es suficiente seleccionar el nódulo correspondiente en el árbol principal.

Conjunto de datos

Resumir
Contexto
Thumb
Iris setosa
Thumb
Iris versicolor
Thumb
Iris virginica
Thumb
Mapa espectra biplot de los conjunto de datos de Iris
Más información Largo de sépalo, Ancho de sépalo ...
Fisher's Iris Data
Largo de sépaloAncho de sépaloLargo de pétaloAncho de pétaloEspecies
5.13.51.40.2I. setosa
4.93.01.40.2I. setosa
4.73.21.30.2I. setosa
4.63.11.50.2I. setosa
5.03.61.40.2I. setosa
5.43.91.70.4I. setosa
4.63.41.40.3I. setosa
5.03.41.50.2I. setosa
4.42.91.40.2I. setosa
4.93.11.50.1I. setosa
5.43.71.50.2I. setosa
4.83.41.60.2I. setosa
4.83.01.40.1I. setosa
4.33.01.10.1I. setosa
5.84.01.20.2I. setosa
5.74.41.50.4I. setosa
5.43.91.30.4I. setosa
5.13.51.40.3I. setosa
5.73.81.70.3I. setosa
5.13.81.50.3I. setosa
5.43.41.70.2I. setosa
5.13.71.50.4I. setosa
4.63.61.00.2I. setosa
5.13.31.70.5I. setosa
4.83.41.90.2I. setosa
5.03.01.60.2I. setosa
5.03.41.60.4I. setosa
5.23.51.50.2I. setosa
5.23.41.40.2I. setosa
4.73.21.60.2I. setosa
4.83.11.60.2I. setosa
5.43.41.50.4I. setosa
5.24.11.50.1I. setosa
5.54.21.40.2I. setosa
4.93.11.50.2I. setosa
5.03.21.20.2I. setosa
5.53.51.30.2I. setosa
4.93.61.40.1I. setosa
4.43.01.30.2I. setosa
5.13.41.50.2I. setosa
5.03.51.30.3I. setosa
4.52.31.30.3I. setosa
4.43.21.30.2I. setosa
5.03.51.60.6I. setosa
5.13.81.90.4I. setosa
4.83.01.40.3I. setosa
5.13.81.60.2I. setosa
4.63.21.40.2I. setosa
5.33.71.50.2I. setosa
5.03.31.40.2I. setosa
7.03.24.71.4I. versicolor
6.43.24.51.5I. versicolor
6.93.14.91.5I. versicolor
5.52.34.01.3I. versicolor
6.52.84.61.5I. versicolor
5.72.84.51.3I. versicolor
6.33.34.71.6I. versicolor
4.92.43.31.0I. versicolor
6.62.94.61.3I. versicolor
5.22.73.91.4I. versicolor
5.02.03.51.0I. versicolor
5.93.04.21.5I. versicolor
6.02.24.01.0I. versicolor
6.12.94.71.4I. versicolor
5.62.93.61.3I. versicolor
6.73.14.41.4I. versicolor
5.63.04.51.5I. versicolor
5.82.74.11.0I. versicolor
6.22.24.51.5I. versicolor
5.62.53.91.1I. versicolor
5.93.24.81.8I. versicolor
6.12.84.01.3I. versicolor
6.32.54.91.5I. versicolor
6.12.84.71.2I. versicolor
6.42.94.31.3I. versicolor
6.63.04.41.4I. versicolor
6.82.84.81.4I. versicolor
6.73.05.01.7I. versicolor
6.02.94.51.5I. versicolor
5.72.63.51.0I. versicolor
5.52.43.81.1I. versicolor
5.52.43.71.0I. versicolor
5.82.73.91.2I. versicolor
6.02.75.11.6I. versicolor
5.43.04.51.5I. versicolor
6.03.44.51.6I. versicolor
6.73.14.71.5I. versicolor
6.32.34.41.3I. versicolor
5.63.04.11.3I. versicolor
5.52.54.01.3I. versicolor
5.52.64.41.2I. versicolor
6.13.04.61.4I. versicolor
5.82.64.01.2I. versicolor
5.02.33.31.0I. versicolor
5.62.74.21.3I. versicolor
5.73.04.21.2I. versicolor
5.72.94.21.3I. versicolor
6.22.94.31.3I. versicolor
5.12.53.01.1I. versicolor
5.72.84.11.3I. versicolor
6.33.36.02.5I. virginica
5.82.75.11.9I. virginica
7.13.05.92.1I. virginica
6.32.95.61.8I. virginica
6.53.05.82.2I. virginica
7.63.06.62.1I. virginica
4.92.54.51.7I. virginica
7.32.96.31.8I. virginica
6.72.55.81.8I. virginica
7.23.66.12.5I. virginica
6.53.25.12.0I. virginica
6.42.75.31.9I. virginica
6.83.05.52.1I. virginica
5.72.55.02.0I. virginica
5.82.85.12.4I. virginica
6.43.25.32.3I. virginica
6.53.05.51.8I. virginica
7.73.86.72.2I. virginica
7.72.66.92.3I. virginica
6.02.25.01.5I. virginica
6.93.25.72.3I. virginica
5.62.84.92.0I. virginica
7.72.86.72.0I. virginica
6.32.74.91.8I. virginica
6.73.35.72.1I. virginica
7.23.26.01.8I. virginica
6.22.84.81.8I. virginica
6.13.04.91.8I. virginica
6.42.85.62.1I. virginica
7.23.05.81.6I. virginica
7.42.86.11.9I. virginica
7.93.86.42.0I. virginica
6.42.85.62.2I. virginica
6.32.85.11.5I. virginica
6.12.65.61.4I. virginica
7.73.06.12.3I. virginica
6.33.45.62.4I. virginica
6.43.15.51.8I. virginica
6.03.04.81.8I. virginica
6.93.15.42.1I. virginica
6.73.15.62.4I. virginica
6.93.15.12.3I. virginica
5.82.75.11.9I. virginica
6.83.25.92.3I. virginica
6.73.35.72.5I. virginica
6.73.05.22.3I. virginica
6.32.55.01.9I. virginica
6.53.05.22.0I. virginica
6.23.45.42.3I. virginica
5.93.05.11.8I. virginica
Cerrar

Se han publicado varias versiones del conjunto de datos.[7]

Referencias

Enlaces externos

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.