对撞因子

来自维基百科,自由的百科全书

對撞因子

对撞因子(英语:Collider),有时又称为反向分叉(英语:inverted forks),[1]统计学图模式中,是指同时被两个以上的变数影响的变数,而这些影响对撞因子的变数之间不见得有因果关系。因为在环路图上会显示为有两个以上箭头指入的节点,所以称为对撞因子。[2]

Thumb
干扰因子、中介因子、对撞因子示意图

对撞因子不会直接造成影响它的变数之间出现相关,以路径分析英语path analysis环路图的术语来说,对撞因子会“阻断”两个变数间的路径。然而,想要了解变数间的因果关系时,对撞因子非常重要,因为在设计实验、挑选样本或统计分析时,如果有意或无意间控制了对撞因子,会造成自变数(X)和应变数(Y)之间出现没有实际因果关系的伪关系,称为选择偏误英语selection bias伯克森悖论,如果控制对撞因子后造成相反的相关性,称为辛普森悖论。用环路图的术语来说,控制对撞因子会“开启” X 和 Y 之间的路径,而造成偏误。[3][4][5]

和其他因子的分别

对撞因子有时会和其他因子混淆。

干扰因子同时影响自变数和应变数,在环路图上显示为分叉向外的箭头。干扰因子应该要控制。[6]

中介变项受自变数影响,并影响应变数,在环路图上箭头一进一出。如果要研究的问题是“X是否会影响Y”,则不应控制。如果研究的问题是“X是否能够直接影响Y”,则需要控制。[6]

例子

Thumb
这是安全返回的飞机受损的部分示意图;而其他地方受到攻击的飞机却无法安全返回。(图片为假定的数据)

在二次世界大战期间,沃德·亚伯拉罕发现盟军飞回来的飞机中,机翼上有最多弹痕,机尾和引擎最少。他提议补强最少弹痕的地方,而不是中弹最多的地方。因为这些飞机可以飞回来,表示中弹的位置不重要,其他位置中弹的飞机都没能飞回来,所以才没有观察到那些位置中弹。“有弹痕的位置”和“重要的位置”是两个变因,“是否被击落”是对撞因子,因为“没被击落”的条件已经自动被控制了,所以变因之间出现负相关。这种现象称作幸存者偏差,在临床医学研究中是重要的偏误:如果只看在医院里的病人、或是没死的病人,容易得出错误的结论。[7]

再以篮球为例,如果只看 NBA 球员,会发现身高比较高的人得分率没有比较高。这是因为身高矮还能进 NBA 的人必然是用其他优势补足了身高的弱势。“身高”为自变数,“篮球得分率”为应变数,“是 NBA 球员”是对撞因子。

其他可能的例子:

  • 在网络上传播的文章,“标题吸引人”和“内容严谨”常常是负相关。
  • 维基百科条目中,若是有小众关注者的主题,品质较差,可能是因为“条目品质佳”和“有人想要写”都造成“条目存在”。
  • 如果在控制教育程度后,智商尽责性呈负相关,可能是因为两者都有助于提升学历。[8]
  • 如果在控制职业后,两性的收入相等,这不见得能够证明女性未受歧视,也可能是因为只有竞争力较佳的少数女性才有办法在歧视较严重的行业中存活,更高的竞争力补足了歧视的影响。[9]

参阅

参考资料

Wikiwand - on

Seamless Wikipedia browsing. On steroids.