Loading AI tools
来自维基百科,自由的百科全书
数据科学中,数据确认(英語:data validation)是一个流程,确保数据清洗后的数据是健壮的(fitness)、一致的(consistency) 。这种流程称为“确认规则”、“确认约束”、“检查流程”[1] 。这不同于证实或证否算法正确实现了规格或属性的正确性。[2]
如Excel数据表中的某列是由24个数字组成的序列号(serial number),不应该被Excel软件自动识别为数值,这会导致表示精度问题。
如检查输入值在最小/最大的阈值之间;或与正则表达式定义的规格一致(consistency)。
代码与交叉引用确认是检查搜否与可能的外部规则、需求、或特定组织、上下文环境、基本假设相一致。这些确认提供的数据是否与已知的查询表或目录信息服务相一致。
例如,用户提供的国家代码应该与当前所在国家/地区相一致。
是指把其他种类的确认与复杂的流程组合起来。
确保数据是符合逻辑的。例如,订单交付日期不应该早于运输日期。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.