統計學定理 来自维基百科,自由的百科全书
中央極限定理(英語:central limit theorem,簡作 CLT)是機率論中的一組定理。在機率論中,中央極限定理 (CLT) 確認,在許多情況下,對於獨立並同樣分布的隨機變數,即使原始變量本身不是常態分布,標準化樣本均值的抽樣分布也趨向於標準常態分布. 這組定理是數理統計學和誤差分析的理論基礎,指出了大量隨機變數之和近似服從常態分布的條件。
Tijms (2004, p.169) 寫到:
“ | 中央極限定理有著有趣的歷史。這個定理的第一版被法國數學家棣美弗發現,他在1733年發表的卓越論文中使用常態分布去估計大量拋擲硬幣出現正面次數的分布。這個超越時代的成果險些被歷史遺忘,所幸著名法國數學家拉普拉斯在1812年發表的巨著 Théorie Analytique des Probabilités中拯救了這個默默無名的理論。
|
” |
棣莫佛-拉普拉斯定理(De Moivre–Laplace theorem)是中央極限定理的最初版本,討論了服從二項分布的隨機變數序列。它指出,參數為n, p的二項分布以np為均值、np(1-p) 為變異數的常態分布為極限。
若 是 次伯努利實驗中事件 A 出現的次數,每次試驗成功的機率為 ,且 ,則對任意有限區間 :
令,當時
(i)
(ii) ,其中
棣美弗-拉普拉斯定理指出二項分布的極限為常態分布。高爾頓板可以看作是伯努利試驗的實驗模型。如果我們把小球碰到釘子看作一次實驗,而把從右邊落下算是成功,從左邊落下看作失敗,就有了一次的伯努利試驗。小球從頂端到底層共需要經過n排釘子,這就相當於一個n次伯努利試驗。小球的高度曲線也就可以看作二項分布隨機變數的機率密度函數。因此,中央極限定理解釋了高爾頓板小球累積高度曲線為什麼是常態分布獨有的鐘形曲線。
林德伯格-萊維(Lindeberg-Levy)定理,是棣莫佛-拉普拉斯定理的擴展,討論獨立同分布隨機變數序列的中央極限定理。它表明,獨立同分布(i.i.d., 即 independent and identically distributed)、且數學期望值和變異數有限的隨機變數序列的標準化和以標準常態分布為極限:
設隨機變數獨立同分布, 且具有有限的數學期望值和變異數,。記
,,則
其中是標準常態分布的分布函數。
記的特徵函數為,根據傅立葉轉換,樣本空間中的摺積在特徵函數空間變為乘積,因此的特徵函數為.由於故因此
所以
由於是連續函數,它對應的分布函數為,因此由逆極限定理知
定理證畢。
林德伯格-費勒(Lindeberg-Feller)定理,是中央極限定理的高級形式,是對林德伯格-萊維定理的擴展,討論獨立的,但不同分布的情況下的隨機變數和。它表明,滿足一定條件時,獨立的,但不同分布的隨機變數序列的標準化和依然以標準常態分布為極限:
記隨機變數序列(獨立但不一定同分布,且有有限變異數)部分和為
記
.
如果對每個,序列滿足
則稱它滿足林德伯格(Lindeberg)條件。
滿足此條件的序列趨向於常態分布,即
同時,該條件也是期望值為零、變異數有限的獨立變量之和趨於常態分布的必要條件。
與之相關的是李亞普諾夫(Lyapunov)條件:
滿足李亞普諾夫條件的序列,必滿足林德伯格條件。
在此只對較強的李亞普諾夫條件給出證明。
以下證明對每一實數,特徵函數滿足。
泰勒展開,上式可近似為
由李亞普諾夫條件,當時,第一項收斂於零。
令,則由李亞普諾夫不等式,
因此第二項也收斂於零。
證畢。
中央極限定理指出,隨著隨機變數數量的增加,許多具有有限變異數的獨立的且相同分布的隨機變數的總和將趨於常態分布。
Seamless Wikipedia browsing. On steroids.