Loading AI tools
統計學名詞 来自维基百科,自由的百科全书
在統計學中,一個概率樣本的置信區間(英語:confidence interval,CI),是對產生這個樣本的總體的參數分布(parametric distribution)中的某一個未知母數值,以區間形式給出的估計。相對於點估計(point estimation)用一個樣本統計量來估計參數值,置信區間還蘊含了估計的精確度的信息。在現代機器學習中越來越常用的置信集合(confidence set)概念是置信區間在多維分析的推廣[1]。
此條目可參照英語維基百科相應條目來擴充。 (2016年9月13日) |
置信區間在頻率學派中間使用,其在貝葉斯統計中的對應概念是可信區間(credible interval)。兩者建立在不同的概念基礎上的,貝葉斯統計將分布的位置參數視為隨機變量,並對給定觀測到的數據之後未知參數的後驗分布進行描述,故無論對隨機樣本還是已觀測數據,構造出來的可信區間,其可信水平都是一個合法的概率[2];而置信區間的置信水平,只在考慮隨機樣本時可以被理解為一個概率。
定義置信區間最清晰的方式是從一個隨機樣本出發。考慮一個一維隨機變量服從分布,又假設是的參數之一。假設我們的數據採集計劃將要獨立地抽樣次,得到一個隨機樣本,注意這裡所有的都是隨機的,我們是在討論一個尚未被觀測的數據集。如果存在統計量(統計量定義為樣本的一個函數,且不得依賴於任何未知參數)滿足使得:
則稱為一個用於估計參數的置信區間,其中的,稱為置信水平,在假設檢驗中也稱為顯著性水平。
接續隨機樣本版本的定義,現在,對於隨機變量的一個已經觀測到的樣本,注意這裡用小寫x表記的都是已經觀測到的數字,沒有隨機性了,定義基於數據的置信區間為:
注意,置信區間可以是單尾或者雙尾的,單尾的置信區間中設定或者,具體前者還是後者取決於所構造的置信區間的方向。
初學者常犯一個概念性錯誤,是將基於觀測到的數據所同樣構造的置信區間的置信水平,誤認為是它包含真實未知參數的真實值的概率。正確的理解是:置信水平只有在描述這個同樣構造置信區間的過程(或稱方法)的意義下才能被視為一個概率。一個基於已經觀測到的數據所構造出來的置信區間,其兩個端點已經不再具有隨機性,因此,類似的構造的間隔將會包含真正的值的比例在所有值中,其包含未知參數的真實值的概率是0或者1,但我們不能知道是前者還是後者[3]。
水平的正態置信區間為:
以下為方便起見,只列出雙尾置信區間的例子,且區間中用""進行簡記:
水平的雙尾正態置信區間為:
設有兩個獨立正態樣本和,樣本大小為和,估計總體均值之差,假設總體方差未知但相等:(如果未知且不等就要應用Welch公式來確定t分布的自由度) 水平的雙尾正態置信區間為:
信賴區間及信心水準常被誤解,出版的研究也顯示出既使是專業的科學家也常做出錯誤的詮釋。[4][5][6][7][8][9]
「在上面的敘述中可以注意到,機率是指統計學家在未來關心的估計問題。事實上,我已多次說明,正確結果的頻率會趨向於α。考慮到一個樣本已被抽取,[特定端點]也已被計算完成。我們能說在這個特定的例子裡真值[落到端點中]的機率等於α嗎?答案明顯是否定的。參數是未知的常數,無法做出對其值的機率敘述……」
「無論如何必須強調,在看到[資料的]數值後,Neyman–Pearson理論從不允許做出以下結論,特定產生的信賴區間涵蓋了真值的機率或信心為(1 − α)100%。Seidenfeld的評論似乎源於一種(並非不尋常的)期望,Neyman–Pearson信賴區間能提供他們無法合理提供的,也就是未知參數落入特定區間的機率大小、信心高低或支持程度的測度。隨著Savage (1962)之後,參數落入特定區間的機率可能是指最終精密度的測度。最終精密度的測度令人嚮往而且信賴區間又常被(錯誤地)解釋成可提供此測度,然而此解釋是不被保證的。無可否認的,『信賴』二字助長了此誤解。」
一般來說,置信區間的構造需要先找到一個樞軸變量(pivotal quantity,或稱pivot),其表達式依賴於樣本以及待估計的未知參數(但不能依賴於總體的其它未知參數),其分布不依賴於任何未知參數。
下面以上述例2為例,說明如何利用樞軸變量構造置信區間。對於一個正態分布的隨機樣本,可以證明(此證明對初學者並不容易)如下統計量互相獨立:
它們的分布是:
所以根據t分布的定義,有
於是反解如下等式左邊括號中的不等式
就得到了例2中雙尾置信區間的表達式。
有時,置信區間可以用來進行母數檢驗。例如在上面的例1中構造的雙尾水平置信區間,可以用來檢驗具有相應的顯著水平為的雙尾對立假說,具體地說是如下檢驗: 正態分布總體,知道總體方差,在顯著水平下檢驗:
檢驗方法是:當(且僅當)相應的水平置信區間不包含時拒絕零假設
例1中構造的雙尾水平置信區間也可以用來檢驗如下兩個顯著水平為的單尾對立假設:
和
檢驗方法是完全類似的,比如對於上述第一個單尾檢驗,當且僅當雙尾置信區間的左端點大於時拒絕零假設。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.