置信区间

在统计学中，一个概率样本的置信区间（英语：confidence interval，CI），是对产生这个样本的总体的参数分布（parametric distribution）中的某一个未知参数值，以区间形式给出的估计。相对于点估计（point estimation）用一个样本统计量来估计参数值，置信区间还蕴含了估计的精确度的信息。在现代机器学习中越来越常用的置信集合（confidence set）概念是置信区间在多维分析的推广^[1]。

置信区间在频率学派中间使用，其在贝叶斯统计中的对应概念是可信区间（英语：credible interval）（credible interval）。两者建立在不同的概念基础上的，贝叶斯统计将分布的位置参数视为随机变量，并对给定观测到的数据之后未知参数的后验分布进行描述，故无论对随机样本还是已观测数据，构造出来的可信区间，其可信水平都是一个合法的概率^[2]；而置信区间的置信水平，只在考虑随机样本时可以被理解为一个概率。

[1]

[2]

置信区间

定义

对随机样本的定义

对观测到的数据的定义

例子

例1：正态分布，已知总体方差 $\sigma ^{2}$

例2：正态分布，未知总体方差 $\sigma ^{2}$

例3：两个独立正态样本

常见误解

构造法

与参数检验的联系

参考文献

参考书目

Wikiwand - on

定义