虚拟变量
维基百科,自由的 encyclopedia
虚拟变量(英语:dummy variable),又称哑变量,指在统计学和计量经济学,尤其是回归分析中仅取0或1的值,以此表示某些可能改变结果的定性效应之有无的变量。[1][2]可以认为,虚拟变量是回归模型中用数字来替代并表示定性事实,从而将数据分为互斥的类别(如吸烟者及非吸烟者)。[3]
虚拟自变量(又称虚拟解释变量)取值为0时,该变量的系数对因变量没有影响,而当虚拟变量取值为1时,其系数会改变截距。例如,假定某人是否为某组的成员是与回归相关的定性变量之一,如果属于该组成员以1代表,则其他所有人获得0值,此时截距对非成员是常数项,对成员则是常数项加上“成员”虚拟变量的系数。[4]
虚拟变量常用于时间序列分析,包括状态转换、季节性分析和定性数据应用。