Loading AI tools
来自维基百科,自由的百科全书
在统计学、工程学、经济学和医学研究领域中,删失是指值的测量或观测只有部分数据的一种情況。
例如,假设一项研究进行了测量影响的一种药物的死亡率。研究中,可知一个人的死亡年龄为至少75年。如果测试对象在75岁退出研究,或如果该人在75岁的时候仍然在世,删失的情况就发生了。
删失还发在测量仪器的可测量范围之外发生。 例如,一个浴室秤可能只达到140公斤。如果一个160公斤的人使用这个秤,观察员只会知道这个人的重量至少为140公斤。
删失数据问题,和缺失数据问题有关,前者是其中观察值的一些可变部分地已知,后者是在那里观察值的一些变量是未知的。
不应将删失与截断的相关概念概念混淆。通过删失,观察结果要么知道适用的确切值,要么知道值在一个区间内。通过截断,观察结果永远不会导致超出给定范围的值:如果看到范围之外的人口中的值,则永远不会看到或永远不会记录。请注意,在统计学中,截断与舍入不同。
当观察值需要后续或检查时,可能会发生间隔删失。左右删失是区间删失的特殊情况,区间的开始分别为零或结束于无穷大。
使用左删失数据的估计方法各不相同,并且并非所有估计方法都适用于所有数据集,或者最可靠。 [1]
对时间间隔数据的常见误解是将其作为左删失间隔,其中开始时间未知。 在这些情况下,我们在时间间隔上有一个下限,因此数据被正确删除 (尽管在被视为时间轴时,缺失的起点位于已知区间的左侧!)。
可以使用特殊技术来处理删失数据。具有特定故障时间的测试被编码为实际故障;对于删失类型和已知的间隔或限制,对删失数据进行编码。特殊软件程序(通常是面向可靠性的)可以对摘要统计,置信区间等进行最大似然估计。
分析涉及删失数据的统计问题的最早尝试之一是丹尼尔伯努利 1766年对天花发病率和死亡率数据的分析,以证明疫苗接种的效果。 [2] 使用Kaplan-Meier估计器估算删失成本的早期论文是Quesenberry等人。 (1989), [3]然而这种方法后来于1997年由Lin等人发现。 [4]除非所有患者随着时间的推移累积具有共同确定性率函数的成本,否则它们无效,他们提出了一种称为Lin估计量的替代估计技术。 [5]
可靠性测试通常包括对项目(在特定条件下)进行测试,以确定发生故障所需的时间。
对复制测试数据的分析包括失败项目的失败时间和未失败的测试终止时间。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.