偏度
形狀量數 来自维基百科,自由的百科全书
偏度(英语:skewness),亦称歪度,在概率论和统计学中衡量实数随机变量概率分布的不对称性。偏度的值可以为正,可以为负或者甚至是无法定义。在数量上,偏度为负(负偏态;左偏)就意味着在概率密度函数左侧的尾部比右侧的长,绝大多数的值(不一定包括中位数在内[1])位于平均值的右侧。偏度为正(正偏态;右偏)就意味着在概率密度函数右侧的尾部比左侧的长,绝大多数的值(不一定包括中位数[1])位于平均值的左侧。偏度为零就表示数值相对均匀地分布在平均值的两侧,但不一定意味着其为对称分布。


介绍
偏度分为两种:
如果分布对称,那么平均值=中位数,偏度为零(此外,如果分布为单峰分布,那么平均值=中位数=众数)。
定义
随机变量的偏度为三阶标准矩,可被定义为:
其中是三阶中心矩,是标准差。是期望算子。等式的最后以三阶累积量与二阶累积量的1.5次方的比率来表示偏度。这和用四阶累积量除去二阶累积量的平方来表示峰度的方法向类似。
偏度有时用来表示。老教科书过去常常用来表示偏度,可是由于偏度可为负,这样的表示法较为不便。
对上面的等式进行扩展可导出用非中心矩E[X3]来表示偏度的公式:
样本偏度
具有个值的样本的样本偏度为:
其中是样本平均值,是三阶样本中心矩,是二阶样本中心距,即样本方差。
当: 时,偏度可以是无穷大的。
或者当: (为负)及
(为正)时,偏度无法定义。
在后面的这个例子中,三阶累积量是无法定义的。 其他分布形式比如:
二阶和三阶累积量是无穷大的,所以偏度也是无法定义的。
如果假定为个独立变量之和并且这些变量和具有相同的分布,那么的三阶累积量是的倍,的二阶累积量也是的倍,所以: 。根据中心极限定理,当其接近高斯分布时变量之和的偏度减小。
参见
注释
参考资料
Wikiwand - on
Seamless Wikipedia browsing. On steroids.