![cover image](https://wikiwandv2-19431.kxcdn.com/_next/image?url=https://upload.wikimedia.org/wikipedia/commons/thumb/5/56/Iris_dataset_scatterplot.svg/langzh-sg-640px-Iris_dataset_scatterplot.svg.png&w=640&q=50)
安德森鸢尾花卉数据集
维基百科,自由的 encyclopedia
安德森鸢尾花卉数据集(英文:Anderson's Iris data set),也称鸢尾花卉数据集(英文:Iris flower data set)或费雪鸢尾花卉数据集(英文:Fisher's Iris data set),是一种多重变量分析的数据集。它最初是埃德加·安德森从加拿大加斯帕半岛的鸢尾属花朵中提取的形态学变异数据[1],后由罗纳德·费雪作为判别分析的一个例子[2],运用到统计学中。
![Thumb image](http://upload.wikimedia.org/wikipedia/commons/thumb/5/56/Iris_dataset_scatterplot.svg/640px-Iris_dataset_scatterplot.svg.png)
其数据集包含了150个样本,都属于鸢尾属下的3个亚属,分别是山鸢尾、变色鸢尾和维吉尼亚鸢尾(英语:Virginia Iris)。每个样本都包含4项特征,即花萼和花瓣的长度和宽度,它们可用于样本的定量分析。基于这些特征,费雪发展了能够确定其属种的线性判别分析。