数据集是指数据的集合,[1]而且数据集应该能被计算机处理[2]。数据集中的值可以是数字,例如实数或整数,比如用厘米表示人的身高,但也可以是标称数据(即并非数值的数据),例如人的种族信息。数据集中的数据也可能存在缺失值,此时必须以某种方式指出数据存在缺失。
参考文献
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.