元分析

汇总多个来源数据进行整合分析的统计方法 来自维基百科,自由的百科全书

元分析

元分析(英语:meta-analysis)、后设分析荟萃分析整合分析统合分析综合分析,在统计学中,是指将多个研究结果整合在一起的统计方法。

文献回顾的传统方法是叙事式的,由作者自行挑选觉得重要的前人研究,当各研究结论冲突时,由作者自行判断哪一种结论较具价值。反之,元分析采用系统化的资料收集和数值分析,让结果更具客观性与证据力。[1]这些组合后的结果会有助于以更加全面性的证据观察来支持或拒绝某一主题研究的假设,发现该主题迄今研究的不足处,发现各种可能影响效应量中介因素

世上首个元分析是由皮尔生在1904年进行,其目的是解决样本数细小的研究统计考验力减低的问题,而整合多个研究结果可更准确分析数据。[2] 以荟萃分析方法(医学上某些领域称之为系统综述 (systematic review))研究医学治疗研究的论文要到1955年才首次发表。牛津英文字典指出meta-analysis这个英文字首次使用为1976年,是来自心理学界的研究。1970年代末到1980年代末,心理学界、教育研究界的学者发展出更加复杂的统计方法。到了1990年代,元分析已成为许多人文科学、社会科学、自然科学领域先进的量化统计方法之一。 而元分析的统计理论,Nambury S. Raju, Larry V. Hedges, Ingram Olkin, John E. Hunter, Harris Cooper 和 Frank L. Schmidt 等人的贡献很大。

现代医学的应用

Thumb
这张图片运用元分析技术,分析超过一千个弥漫型内因性桥脑神经胶细胞瘤英语Diffuse intrinsic pontine glioma与其他儿科肿瘤的案例,从一次文献中淬炼出哪些基因变异与疾病有所相关。

收集主题相同的研究,再将每个研究的结果运算为统一的效果量,再将不同研究的效果量以统计方法结合。由于每个研究的本质都有所不同,可引致结果出现异质性。具有异质性荟萃分析,可用随机效果模型英语Random effects model分析数据。 荟萃分析的结果,除了整合的效果量数值,也常用森林图英语forest plot表现。

个别研究品质的影响

元分析的统计方法并不在乎收集到研究的品质;若以品质差的研究进行元分析,只会合计出差劲的结果,即所谓“垃圾进,垃圾出(garbage in garbage out)”。所以在进行统计分析之前会先评价收集研究的品质,排除不良的研究后再就剩下可用的研究进行结合。

元分析的另一个缺点,是收集的研究多数以搜查文献数据库(如PubMedWeb of Knowledge英语Web of Knowledge)获得,但这些数据库只会收录已经发表的研究,因此,元分析很少整合未发表的研究。有证据证明未发表的研究不能被期刊接受的原因,是该研究发现研究结果无显著性差异[3];而发现研究结果不显著的研究却能发表及收录在元分析,这会令元分析结果出现统计上的偏误(bias)。然而这个缺点也正是元分析的优点:在元分析的标准步骤中,包含了已发表研究之偏误的分析(publication bias analysis)。相反地,在传统叙事式的文献回顾中,缺乏系统化的方法以检视已发表研究之偏误。

挑战

多项小型研究的元分析并不总是能准确预测单一大型研究的结果。[4]有观点指出此方法的缺陷在于无法控制偏差来源:完善的元分析无法修正原始研究中的设计缺陷或偏差。[5] 这意味着只有方法学品质高的研究才应纳入元分析,这种做法被称为"最佳证据综合"。[5]另一些元分析者则会纳入品质较低的研究,并透过加入反映研究方法品质的协变量来检视研究品质对效应值的影响。[6]然而,也有学者主张更佳的做法是保留研究样本的变异度信息,尽可能广泛纳入研究,认为方法学选择标准会引入主观性,违背该方法的初衷。[7]近年来在科学开放实践运动影响下,出现了开发"众包"持续更新的元分析工具,由科研群体持续更新,[8][9]旨在使所有主观选择更加透明。

现代科学中的应用

现代统计荟萃分析不仅透过加权平均整合一组研究的效应值,还能检验研究结果间的变异性是否超出了样本量差异所引起的预期变异性。此外,研究特征(如采用的测量工具、抽样群体以及实验设计要素)可被编码用于降低估计值的变异数(参见前文统计模型)。因此某些研究方法学的限制可透过统计学方法校正。荟萃分析方法也应用于临床预测模型的开发与验证,[10][11]透过整合不同研究中心的个别受试者资料来评估模型的外部效度(external validity),甚至聚合现有预测模型。[12]

荟萃分析既适用于单一受试者设计,也适用于团体研究设计。[13]这一点尤其重要,因为大量研究采用单一受试者设计。[14]关于单一受试者研究最适合的元分析技术,目前仍存在广泛争议。[15]

元分析促使研究重点从单一研究转向多重研究,强调效应值的实际意义而非个别研究的统计显著性。这种思维转变称为"荟萃分析思维"。荟萃分析结果通常透过森林图(forest plot)呈现。

研究结果使用不同的方法进行组合。在医疗研究中的元分析中,经常使用的一种方法称为“逆方差法”。所有研究的平均效应大小计算为加权平均数,权重等于每个研究的效应估计的逆变异数。样本量较大且随机变异较小的研究比样本量较小的研究给予较大的权重。其他常用的方法包括Mantel-Haenszel方法和Peto方法。

Seed-based d mapping(以前称为有符号差异映射,SDM)是一种用于分析大脑活动或结构差异的研究元分析的统计技术,使用神经影像技术,如fMRI、VBM或PET。

不同的大规模高通量技术,如微IconModulerios,已经被用来了解基因表现。 MicroRNA表达谱已经被用来识别在特定细胞类型或组织类型或疾病情况下表达差异的microRNAs或检查治疗的效果。对这些表达谱进行元分析,以得出新结论并验证已知发现。

全基因组测序研究的元分析为收集大量样本以发现与复杂表型相关的罕见变异提供了一个吸引人的解决方案。已经开发出一些方法,利用高效率的摘要统计储存方法,在生物库规模的队列中进行功能性的罕见变异关联元分析。

扫描式元分析也可用于估计效应网络。这可让研究人员在更精确的估计结果的更完整全景中检视模式,并得出考虑更广泛背景的结论(例如,人格-智力关系如何因特征家族而异)。

参见

参考文献

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.