四分位数(英语:Quartile)是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
概念
- 第一四分位数(
),又称较小四分位数,等于该样本中所有数值由小到大排列后第25%的数字。
- 第二四分位数(
),又称中位数,等于该样本中所有数值由小到大排列后第50%的数字。
- 第三四分位数(
),又称较大四分位数,等于该样本中所有数值由小到大排列后第75%的数字。
第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range, IQR)。
运算过程
关于四分位数值的选择尚存争议[1]。
主要选择四分位的百分比值
,及样本总量
有以下数学公式可以表示:[2]
![{\displaystyle L_{p}=n\cdot {\frac {p}{100}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/59bf5c0a7c24863f3b5dd6331aa4f7ab348630eb)
- 情况1:如果
是一个整数,则取第
和第
的平均值
- 情况2:如果
不是一个整数,则取下一个最近的整数。(比如
, 则取
)
举例
图示中箱形图(有四分位数及四分位距)和概率密度函数 为描述一个常规总量
的分布情况
一个算法如下(可以兼用TI-83计算器):
- 利用中位数使数据分成两列(不要把中位数放入已分好的数列)。
- 第一四分位数为第一组数列的中位数;第三四分位数为第二组数列的中位数。
以下例子可以用来参考。
- 例1
数据总量:
由小到大排列的结果:
![{\displaystyle {\begin{cases}Q_{1}=15\\Q_{2}=40\\Q_{3}=43\end{cases}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/ba44470ef2c0548c1eec75a6871735d807afac33)
- 例2
数据总量:
![{\displaystyle {\begin{cases}Q_{1}=15\\Q_{2}=37.5\\Q_{3}=40\end{cases}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/0029685edb95523fce05c63758866ac438a4cc2f)
- 例3
数据总量:
![{\displaystyle {\begin{cases}Q_{1}=1.5\\Q_{2}=2.5\\Q_{3}=3.5\end{cases}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/7b3077766bf1e72ee669c77e4484a695570683b4)
应用
不论
的变异量数数值为何,均视为一个分界点,以此将总数分成四个相等部份,可以通过比较
,分析其数据变量的趋势。
参考文献