疾病筛检又称筛查(英语:screening),是用于寻找尚未发现的疾病或危险标志物的策略[1][2][3],这些检测可以应用于个人或整个族群,被测人员可能没有任何疾病迹象或症状,或者可能只出现一种或两种症状,而这些症状本身并不能确定诊断。
此条目翻译品质不佳。 (2021年5月31日) |
筛查干预措施的目的,是确定可能在将来某个时候转变为疾病的状况,从而能够及早进行干预和管理,以期降低死亡率和患病痛苦。尽管筛查可能会导致早期诊断,但并非所有筛查试验都显示出对受筛查者有益。过度诊断,误诊和产生错误的安全感是筛查的一些潜在不利影响。此外,某些筛查测试可能会被不当使用。 [4] [5]由于这些原因,除了可接受的特异性外,筛查程序中使用的测试(尤其是针对低发病率的疾病)还必须具有良好的敏感性。 [6]
存在几种类型的筛查:通用筛查包括对特定类别中的所有个人(例如,特定年龄的所有儿童)进行筛查。病例发现涉及根据危险因素的存在筛查一小群人(例如,因为家庭成员已被诊断出患有遗传性疾病)。筛查干预措施并非旨在进行诊断,通常具有很高的假阳性和假阴性结果率。
独立的专家小组,美国预防服务工作队,提供了经常更新的筛查建议。 [7]
原则
1968年,世界卫生组织发布了关于疾病筛查的原则和实践的指南,通常被称为 Wilson 和 Jungner 标准。 [8]这些原则今天仍然广泛适用:
- 该病应该是一个重要的健康问题。
- 应该对这种情况进行治疗。
- 应该有诊断和治疗的设施。
- 该病应处于潜伏期。
- 应该对该状况进行测试或检查。
- 该测试应为人群所接受。
- 应该充分了解该疾病的自然病史。
- 应该对谁治疗有一个商定的政策。
- 查找案件的总费用应在整体医疗费用方面在经济上保持平衡。
- 寻找案例应该是一个连续的过程,而不仅仅是一个“一劳永逸”的项目。
在2008年,随着新的基因组技术的出现,WHO对这些技术进行了合成和修改,并具有以下新的理解:
过去40年提出的新兴筛查标准的综合
- 筛查程序应响应公认的需求。
- 筛查的目的应在开始时就确定。
- 应该有一个确定的目标人群。
- 应当有科学的证据证明筛查计划的有效性。
- 该计划应整合教育,测试,临床服务和计划管理。
- 应该有质量保证,并且具有使筛查的潜在风险最小化的机制。
- 该计划应确保知情选择,保密和尊重自主权。
- 该计划应促进公平和为整个目标人群提供筛查的机会。
- 计划评估应该从一开始就计划好。
- 筛查的总体收益应大于危害。 [9]
种类
例子
在许多国家,有基于人口的筛查方案。在某些国家(例如英国),政策是在全国范围内制定的,并且计划在全国范围内实施以统一的质量标准。常见的筛查程序包括:
美国的大多数公立学校系统都会定期对学生进行筛查,以了解他们的听力和视力缺陷以及牙齿问题。有时会进行脊柱侧弯等脊柱和姿势问题的筛查,但由于脊柱侧弯(与视力或牙齿问题不同),脊柱侧弯是有争议的,因为只有一小部分人发现脊柱侧弯(因为视力不佳),因为学生必须脱下衬衫进行筛查。许多州不再强制要求进行脊柱侧弯检查,也不允许在父母通知下放弃脊柱侧弯检查。目前,美国各州正在引入法案,要求对进入公立学校的学生进行心理健康检查,以防止自残以及对同伴的伤害。提出这些法案的人希望能够诊断和治疗精神疾病,例如抑郁症和焦虑症。
健康的社会决定因素是影响个人和群体健康状况差异的经济和社会条件。 [11]这些状况可能对其健康和福祉产生不利影响。为了减轻这些不利影响,某些卫生政策,例如《美国平价医疗法案》(2010年),增加了对预防性计划的吸引力,例如那些定期筛查健康的社会决定因素的预防性计划。 [12]在健康框架的社会决定因素中,筛查被认为是确定患者基本需求的一种有价值的工具,以便可以更好地为他们提供服务。 [13] [14]
《可负担医疗法案》在美国建立后,就能够弥合社区医疗与医疗作为医疗之间的鸿沟,从而产生了对健康的社会决定因素进行筛查的计划。 [12] 《平价医疗法案》建立了一些服务,着眼于社会决定因素或对更多样化的客户开放,例如社区转型补助金,这些补助金被下放给社区,以建立“预防性社区卫生活动”和“解决卫生差距”。 [15]
健康的社会决定因素包括社会地位,性别,种族,经济状况,教育水平,获得服务,教育,移民状况,教养等等。 [16] [17]美国各地的多家诊所都采用了一种系统,可以对患者进行与健康社会决定因素有关的某些风险因素筛查。 [18]在这种情况下,可以将其作为一种预防措施,以减轻长时间暴露于某些风险因素的任何不利影响,或者只是开始补救某些人已经面临的不利影响。 [14] [19]可以以不同的方式(例如,在线或亲自)来构造它们,并根据患者的反应产生不同的结果。 某些计划,例如加州大学旧金山分校贝尼奥夫儿童医院的FIND Desk,采用筛查健康的社会决定因素,以使患者与社会服务和社区资源联系起来,从而为患者提供更大的自主权和机动性。 [20]
二手医疗设备
筛查测试中使用的医疗装置通常与诊断测试中使用的装置不同,因为筛查测试用于表明没有症状的人中可能存在或不存在某种疾病或状况。同时使用诊断医疗装置进行定量的生理测量,以确认和确定可疑疾病或状况的进展。医疗检查装置必须能够快速处理许多病例,但可能不需要像诊断装置那样精确。
局限性
筛查可以在症状出现之前及早发现疾病,而治疗比随后发现更有效。 [21]在最好的情况下,可以挽救生命。像任何医学检验一样,筛查所用的检验也不是完美的。对于没有疾病的人,测试结果可能错误地显示为阳性(假阳性),对于有疾病的人,测试结果可能为阴性(假阴性)。筛查程序的局限性包括:
- 筛查可能涉及大多数不需要治疗的人的医疗费用和医疗资源的使用。
- 筛查程序的不良影响(例如压力和焦虑,不适,辐射暴露,化学暴露)。
- 延长对疾病的了解而导致的压力和焦虑,而结果却没有任何改善。此问题称为过度诊断(另请参见下文)。
- 错误的阳性筛查结果会导致压力和焦虑。
- 不必要的调查和处理假阳性结果(即,误诊为I型错误)。
- 错误误报引起的错误安全感可能会延迟最终诊断(即II型错误)。
国民保健署 (英格兰)筛查痴呆症是有争议的,因为它可能引起患者过度焦虑,并且支持服务将得到扩展。一位全科医生报告说:“主要问题实际上似乎集中在这种诊断的后果是什么,以及实际上可以为患者提供帮助的方面。” [22]
分析
对于许多人来说,本能地进行筛选似乎是一件适当的事情,因为尽早发现某些东西似乎更好。但是,没有任何筛选测试是完美的。总是存在结果不正确的问题以及上面列出的其他问题。从道德上讲,在提供检查时,应向参与者提供平衡且准确的资讯,以便他们可以就是否接受做出充分知情的选择。
在实施筛查程序之前,应先进行检查,以确保实施该程序有益于弊。评估筛查测试是否会改善人群健康的最佳研究是严格的随机对照试验。
当使用病例对照研究(或更通常是伫列研究)研究筛查程式时,各种因素可能导致筛查测试看起来比实际情况更成功。研究方法固有的许多不同偏见将使结果产生偏差。
筛查可以识别出永远不会在一个人的一生中引起问题的异常情况。例如前列腺癌筛查;据说“死于前列腺癌的男性多于死于前列腺癌的男性”。 尸检研究表明,死于其他原因的老年男性中有14%至77%被发现患有前列腺癌。 [23]
除了不必要的治疗问题(前列腺癌治疗绝对没有风险)之外,过度诊断使研究看起来更擅长于发现异常,尽管有时它们是无害的。
当所有这些无害异常的人都被筛查算作“挽救生命”,而不是“因过度诊断而不必要地伤害了健康的人”时,就会发生过度诊断。因此,这可能会导致一个无休止的循环:过度诊断越多,就会有更多的人认为筛查比它更有效,这可以使人们进行更多的筛查测试,从而导致更多的过度诊断。 [24]莱佛士·麦基(Raffle Mackie)和格雷(Gray)将此称为筛查的普遍悖论:“筛查对过度诊断和过度治疗的危害越大,相信该计划的人就越多,他们相信自己的健康,甚至生命,”(p56专栏3.4) [25]
在日本,对神经母细胞瘤(儿童中最常见的恶性实体瘤)进行筛查是一个很好的例子,说明了在实施筛查程式之前必须对其进行严格评估的原因。 1981年,日本开始了一项筛查神经母细胞瘤的计划,该计划通过测量6个月大婴儿尿液中的高香草酸和香草扁桃酸来进行。 2003年,组织了一个特别委员会来评估神经母细胞瘤筛查计划的动机。在同一年,委员会得出结论认为,有足够的证据表明当时使用的筛查方法会导致过度诊断,但没有足够的证据表明该程式可以减少神经母细胞瘤的死亡。因此,委员会建议不要进行筛查,厚生劳动省决定停止筛查计划。 [26]
甲状腺癌过度诊断的另一个例子是:在1975年至2009年间,其发病率在美国增加了两倍,而死亡率却保持不变。 [27]在韩国,情况甚至更糟,1993年至2011年的发病率增加了15倍(世界上最大的甲状腺癌发病率增加),而死亡率却保持稳定。 [28]发病率的增加与超声检查的引入有关。 [29]
癌症筛查中过度诊断的问题在于,在诊断时无法区分无害病变和致死病变,除非患者不进行治疗且死于其他原因。 [30]因此,几乎所有患者都倾向于接受治疗,从而导致所谓的过度治疗。正如研究人员 Welch 和 Black 所说的那样,“过度诊断以及随之而来的不必要治疗及其伴随的风险,无疑是与早期癌症检测相关的最重要的危害。”
如果筛查有效,则必须比不进行筛查(出现症状时)更早地诊断目标疾病。
即使在两种情况下,一个人都会同时死亡,因为我们通过筛查可以更早地诊断出该疾病的生存时间,因为通过筛查可以更长的诊断时间。即使患者的寿命没有延长,由于患者必须对这种疾病的了解时间更长,因此还会增加焦虑感。
如果筛选有效,则必须引入提前期。因此,由于引入了前置时间,因此自诊断以来的生存时间统计趋向于随着筛查而增加,即使筛查没有益处。如果我们不考虑生存时间在这种情况下实际上意味着什么,我们可能会将成功归因于一项筛选测试,该筛选测试仅能进行提前诊断;比较筛查人群和非筛查人群中疾病所致死亡率的统计资料,可以得出更有意义的资讯。
许多筛查测试都涉及癌症的检测。筛查更有可能检测出较慢的,不太可能造成伤害的肿瘤(由于更长的临床前停留时间)。而且,那些侵略性癌症倾向于在预定的筛查之间的间隙中产生症状,因此不太可能通过筛查被发现。 [31]因此,筛查经常自动发现的病例比有症状的病例预后更好。结果是那些进展缓慢的病例现在被归类为癌症,这增加了发病率,并且由于其更好的预后,即使筛查没有差异,筛查者的生存率也将高于非筛查者。
并非所有人都会参加筛查计划。愿意接受测试的人与没有接受测试的人之间存在一些差异。
如果更容易筛查罹患疾病的风险较高的人群,例如具有乳腺癌家族史的女性比其他女性更有可能参加乳房X线照相术,那么筛查测试的效果将比实际情况差很多:筛查人群中的阴性结果将高于随机样本。
选择偏见也可能使测试看起来比实际更好。如果年轻人和健康的人更容易进行检测(例如,如果人们必须长途跋涉才能接受检查),则筛查人群中阴性结果的人数将少于随机样本,并且该检查似乎可以积极的区别。
研究表明,参加筛查的人比不参加筛查的人更健康。这被称为健康的筛选者效应[32],是选择偏见的一种形式。原因似乎是,健康,富裕,身体健康,不吸烟且父母长寿的人比那些有健康和社会问题的低收入人群更容易受到筛查[33]。选择偏倚的一个例子发生在爱丁堡乳腺X线摄影筛查试验中,该试验采用聚类随机分配。该试验发现筛查乳腺癌的人的心血管死亡率降低。发生这种情况是因为各组的社会经济状况存在基线差异:对照组中26%的妇女和研究组中53%的妇女属于最高的社会经济水平。[34]
最小化选择偏见的最佳方法是使用随机对照试验,尽管观察性,自然主义或回顾性研究可能具有一定价值,并且通常更易于进行。任何研究都必须足够大(包括许多患者)并且要足够长(跟随患者很多年),才能具有评估筛查程式真实价值的统计能力。对于稀有疾病,可能需要成千上万的患者来实现筛查的价值(找到足够的可治疗疾病),并评估筛查计划对死亡率的影响,一项研究可能要跟随该伫列研究数十年。这样的研究花费时间长且昂贵,但是可以提供最有用的资料来评估筛查程式和实践循证医学。
癌症筛查研究的主要结果通常是由所筛查疾病导致的死亡人数-这称为特定疾病死亡率。举一个例子:在乳腺钼靶X线摄影筛查试验中,报告的主要结果通常是乳腺癌死亡率。但是,特定疾病的死亡率可能偏向于筛查。在乳腺癌筛查的例子中,被过度诊断为乳腺癌的妇女可能会接受放疗,这会增加由于肺癌和心脏病导致的死亡率。 [35]问题是这些死亡通常被归类为其他原因,甚至可能大于通过筛查避免的乳腺癌死亡人数。因此,无偏见的结果是全因死亡率。问题是需要进行更大的试验才能发现全因死亡率的显着降低。 2016年,研究人员Vinay Prasad及其同事在BMJ上发表了一篇题为“为什么从未证明过进行癌症筛查可以挽救生命”,因为癌症筛查试验并未显示出全因死亡率降低。 [36]
参考文献
延伸阅读
外部链接
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.