数据集是指数据的集合,[1]而且数据集应该能被电脑处理[2]。数据集中的值可以是数字,例如实数整数,比如用厘米表示人的身高,但也可以是标称数据(即并非数值的数据),例如人的种族资讯。数据集中的数据也可能存在缺失值,此时必须以某种方式指出数据存在缺失。

参考文献

Wikiwand - on

Seamless Wikipedia browsing. On steroids.