關於概率嘅數學分支 From Wikipedia, the free encyclopedia
概率論(粵拼:koi3 leot2 leon6;英文:probability theory)係研究概率嘅一個數學理論。概率係指一件事件有幾可能係真,1 代表件事實會發生,0 代表件事實唔會發生,而 0.5 就代表件事「有 50% 機會發生」;例如家陣掟一個銀仔,假設個銀仔冇出千嘅話,應該會有 50% 機會出公、50% 機會出字,而呢件事嘅結果(公定字)原則上係冇可能預測嘅[1],反映咗不確定[2]。
喺概率論史上,「概率呢個數值要點樣理解」係一個有相當爭議性嘅問題:喺最基本上,古典嘅決定論[英 1]主張,如果一個觀察者喺而家呢一刻完美知道嗮宇宙嘅狀態(例:知道每粒原子喺乜位置同以乜嘢速度郁緊等等),佢將會有能力靠物理定律-假設佢識嗮所需嘅物理知識-完美預測宇宙下一刻嘅狀態[3],所以概率淨係反映人類知識唔夠,而主張呢個觀點嘅人會話「人之所以預測唔到掟銀仔嘅結果,係因為人知唔嗮風向等嘅資訊」[4][5]。不過廿世紀量子力學研究指出,宇宙裏面有部份嘅事件似乎係本質上就冇可能完全準確噉預測嘅,人頂嗮櫳都淨係有得估呢啲事件發生嘅概率[6]。
喺廿一世紀初,概率論經已成為咗一個重要嘅數學理論。例如統計學就係建基於概率論嘅[1],而概率同相關概念喺機械學習-教人工智能學習同處理不確定嘅技術[7]-同埋遊戲設計-可能會涉及設計帶有隨機嘅遊戲[8]-上都有用。
概率論嘅基礎係不確定[英 2]:响最基本上,不確定係指「一個個體資訊唔夠、唔能夠預測跟住會發生乜事」嘅情況。想像
舉個例說明,想像依家擲一粒六面嘅骰仔(),樣本空間 ;跟住有個人搵個唔透明嘅骰盅𢫏住咗三粒六面骰(),然後係噉勁搖個骰盅,假設佢完全冇方法睇到粒骰仔(資訊唔夠),佢响攞開個骰盅之前就會經歷不確定,唔知嗰三粒骰仔擲到啲咩數字-嗰三粒骰可能係擲到 (其中一件事件)又得,擲到 (另一件事件)... 又得[9][10]。
概率[英 4],又叫機會率或者或然率,可以噉樣想像:家陣有若干件可能嘅事件,而分析者同每一個可能嘅事件都俾一個數值佢;每件事件掕住嗰個數值就係嗰件事件嘅概率 ,用日常用語講表示「件事件有幾大機會發生」-0 表示實唔會發生,1 表示實會發生[註 2]。响廿一世紀嘅概率論當中,啲人一般會用以下噉嘅數學符號嚟表示所講嘅嘢[11]:
用圖像嘅方式嚟諗嘅話,概率可以用好似上圖噉嘅方式嚟表達;想像 X 軸係 ,表示「擲一粒六面骰仔得到嘅數」,而 Y 軸表示各件呢啲事件嘅相應 值。假如粒骰仔冇出千,應該每個數出現嘅概率都係一樣嘅。
根據廿一世紀概率論當中嘅概率公理[英 5],以下呢三條原則係概率論嘅公理,即係話概率論當咗呢幾句嘢係不證自明嘅[13]:
响概率論當中,兩件事件之間嘅關係最基本上有兩種-交集[英 7]同併集[英 8][1]:
上述嘅概念可以用溫氏圖[英 9]嚟表達:一幅溫氏圖會有若干個波,每個波代表一件事件;兩個波之間嘅相交空間代表嗰兩個波所代表嗰兩件事件嘅交集[14]。例如係以下呢幅溫氏圖噉,幅圖表示咗三件事件-、 同 ,每件事件各有一個波代表(睇每個波掕住嗰個羅馬字母),而三個波相交嘅空間()就係表示「三件事都發生」嘅概率嘅空間。
條件概率[英 13]係指「如果一件事件發生咗,另外一件事件發生嘅概率」,例:「已知 發生咗, 嘅條件概率」嘅數學符號係
呢個數值可以用以下呢條式計[17]:
舉個例說明,想像以下呢幅溫氏圖,每個空間掕住嗰個數表示嗰件事件發生嘅概率,例如「、、 同 都冇發生」嘅概率係 0.34... 等等,「已知 發生咗, 嘅條件概率」()係
如果 同 係互斥事件嘅話,噉 。
統計獨立[英 14]係指幾件事件之間唔會影響對方發生嘅概率。如果話「 同 呢兩件事件之間獨立」,噉以下呢條式成立[18][19]:
就算將 同 喺以上呢啲式當中嘅位置互換,上述講嘅嘢不變。條件獨立[英 15]就係指一件事件唔會影響另外兩件事件之間嘅條件概率,即係話如果
概率分佈[英 17]係統計學上成日用到嘅一樣嘢。一個概率分佈係一個表明某個隨機變數嘅每個可能數值出現嘅概率嘅函數,
當中 就係個概率分佈;個函數可以畫做一個表,X 軸代表個目標變數嘅數值,Y 軸代表嗰個目標變數嘅每個數值出現嘅概率[21]。
伯努利分佈[英 18]就係一個可以用嚟模擬掟銀仔嘅結果嘅概率分佈,一個伯努利分佈描述嘅變數 得兩個可能數值,數值係 1 嘅機會率係 ,數值係 0 嘅機會率係 ,即係 係[22]:
當中 可以等如 (兩個都係 0.5)。假想而家用一個伯努利分佈嚟模擬一次掟銀仔實驗嘅結果,個銀仔俾人做咗手腳,所以出公嘅概率()同出字嘅概率()唔相同,畫做圖(X 軸表示掟銀仔結果嘅數值、Y 軸表示每個數值出現嘅概率)嘅話就會好似以下呢幅圖噉樣:
响現實世界嘅科研入面,啲變數好少可會「一係公一係字」咁二元,但個原理一樣:常態分佈[英 19]就係科學入面最常用嘅概率分佈之一;常態分佈模擬嘅係一個連續變數(即係個目標變數嘅數值喺小數點裏面有幾多個位都得),而喺一個常態分佈當中,個變數嘅平均值會係出現得最密嘅數值,低過平均嘅數值同高過平均嘅數值出現嘅機會率一樣,而離平均值愈遠嘅數值,抽到出嚟嘅機會率就愈低,如果按住個樣本畫一個概率分佈圖,一個常態分佈會俾出一條好似鐘噉嘅形狀嘅線。常態分佈嘅概率密度函數係( 係個分佈嘅標準差)[23]:
譬如話以下呢個情況噉:想像有生物學家想研究成年中華白海豚嘅身長,但佢冇可能捉嗮世界上咁多隻白海豚遂隻遂隻嚟度佢哋幾長,於是乎佢就抽個樣本出嚟,用個樣本嚟估計全世界嘅白海豚嘅身長;呢個樣本入面有 20 隻白海豚,佢哋嘅平均身長係 2.2 米,唔係隻隻都啱啱好 2.2 米長-有隻係 1.8 米長,有隻係 2.6 米長呀噉-但一隻白海豚身長高過平均身長嘅機會率大致上等如佢身長低過平均嘅機會率,而且離 2.2 米愈遠嘅數值出現嘅機會率愈低。如果畫幅概率分佈圖,「隻白海豚嘅身長」做 X 軸,而「每個身長數值出現嘅機會率」做 Y 軸,幅圖會出一條近似鐘形嘅線。實證嘅科學研究經已表明咗,智商(IQ)等好多重要嘅變數嘅分佈都可以用常態分佈嚟模擬[23]。
隨機變數匯合[英 20]係指隨機變數有嘅極限[英 21]。簡單講,如果話某一個隨機變數 有一個極限,即係指(例如)隨住某個數值 變得愈嚟愈大, 嘅數值會慢慢愈嚟愈近(匯合)某個數值(設呢個數值做 , 係個函數嘅極限)[24]-
喺概率論上,隨機變數匯合相關嘅現象有以下呢啲:
大數定律[英 22]係概率論上一條俾人覺得好合乎直覺嘅定律[25]:想像家陣掟一個冇做手腳(出公出字概率一樣)嘅銀仔,掟嘅次數係 ;一般直覺認為,如果 嘅數值極大(),噉嗰 次掟銀仔嘅結果應該會有一半係公一半係字;而且 嘅數值愈大,出公嘅次數同出字嘅次數之間嘅比例應該會愈嚟愈接近 1。又想像家陣擲一粒(冇做手腳嘅)六面骰仔擲 咁多次,噉嗰 次擲骰仔嘅結果嘅平均值(樣本平均值[英 23])正路會隨住 變得愈嚟愈大,而接近 3.5(理論上嘅平均值)-
喺比較嚴格嘅定義上,大數定律講嘅嘢如下:依家有一連串獨立同分佈(iid)嘅隨機變數 (意思即係指呢啲變數之間獨立,而且概率分佈一樣);只要 ( 嘅期望值)唔係無限大,噉 實際觀察到嘅樣本平均值()
會隨住 變大而接近 。大數定律嘅諗頭源於直覺,但喺實際嘅觀察上經已受到證實,進階嘅分析仲會分弱大數定律-「趨近樣本平均值有咁上下概率會發生」同強大數定律-「趨近樣本平均值係一定會發生咁滯」[26]。
中央極限定理[英 24]廣泛噉俾人認為係現代數學上嘅一個重要結果,可以解釋常態分佈(睇返上面)點解喺大自然入面周圍都有(智商同身高等好多表示個體差異嘅變數都呈常態分佈)。根據中央極限定理,假想有若干()個獨立同分佈、變異數有限嘅隨機變數,如果 嘅數值極大(),噉呢啲隨機變數嘅平均值形成嘅分佈會接近一個常態分佈,無論啲隨機變數本身嘅分佈係點嘅樣都一樣。用例子說明嘅話,即係話想像
用圖嚟表達嘅話:
簡單噉講,設 做 個獨立同分佈嘅隨機變數,平均值係 而變異數係 ,設 做呢柞隨機變數嘅平均值,噉
會係一個常態分佈。中央極限定理講嘅嘢表示,大自然會充滿咗常態分佈-每一件數據(例:訊號當中嘅雜訊)產生嘅過程可以想像成一個隨機過程,個結果(件雜訊搞到個訊號高咗定低咗,同埋搞到個訊號變咗幾多)會係一個隨機變數,而無論件數據嘅產生過程係乜嘢分佈都好,產生大量嘅數據(睇咗大量嘅訊號)之後,件數據(啲雜訊)嘅數值嘅平均值都會呈現常態分佈[27][28]。
廿一世紀初嘅概率論係一個廣受人認同嘅數學理論:數學上對概率嘅分析始於 8 至 13 世紀(伊斯蘭黃金時代)期間,當時嘅阿拉伯數學家喺度研究密碼學,有諗到例如「點樣令到啲密文望落似完全隨機(難以確定噉知道)」等嘅問題[29];打後嘅 17 世紀數學家郁手分析擲骰仔等嘅機率遊戲,令到概率論嘅諗法萌芽;到咗廿世紀上半橛,蘇聯數學家安德雷·柯爾莫哥洛夫[英 25]將概率同相關概念整合做一套形式化嘅理論,令到概率論正式成為一個嚴謹嘅數學領域,並且俾人廣泛噉應用喺統計同資訊科技等嘅領域上[30]。
雖然概率論咁成功,但哲學同物理學等領域嘅研究者一路都有喺度諗「概率到底代表緊啲乜」嘅問題。18 世紀法國數學家拉普拉斯[英 26]係噉樣定義概率嘅[31][註 5]:如果
噉 嘅概率()就可以定義做
呢個定義俾好多學者覺得有缺憾:首先,個定義淨係可以用喺可能結果嘅數量有限嘅情況,但某啲重要嘅隨機實驗(例如係「一路掟銀仔,掟到出公為止」)理論上有無限咁多個可能結果;除此之外又有人指,古典定義有循環邏輯[英 27]嘅問題-「一個冇出千嘅銀仔出公出字嘅概率係咁多咁多」,但同時一個冇出千嘅銀仔定義上就係「出公出字機會一樣」嘅[32]。因為噉,打後嘅數學界又出咗
等嘅諗法[33]。
有關概率嘅本質嘅問題仲涉及物理學同宇宙學上嘅思考。喺廿世紀打前嘅科學家好多時都抱持決定論[英 1]嘅觀念:喺最基本上,決定論係一種世界觀,認為宇宙裏面嘅每一件事件都係由打前嘅事件(原因)決定嘅;根據呢種睇法,概率呢個概念之所以存在,純粹係反映咗觀察者資訊上嘅不足-「如果一個觀察者完美噉知嗮嗰一刻『每粒原子喺邊』同『每粒原子以乜嘢速度移動』等嘅資訊,佢將會有能力按物理定律完美噉預測個銀仔會係公定字,但喺實際情況當中,人唔能夠攞到嗮呢啲資訊,所以淨係有得估呢啲事件發生嘅概率」。詳情可以睇吓拉普拉斯魔[英 30]相關嘅概念[3]。
不過,古典嘅決定論喺廿世紀受到挑戰:廿世紀上半橛係量子力學崛起嘅時期,呢啲研究掂到波粒二象性[英 31]同哥本哈根詮釋等嘅議題;簡單講,量子力學發現微觀粒子同時會有波動(能量嘅擾動)同粒子(一種物質)嘅特性。例如係光喺古典物理學當中俾人當係波動一種,而唔係物質,但量子力學就話光有某啲粒子先至有嘅特性;根據哥本哈根詮釋,一粒粒子嘅「波動」係表示緊嗰粒粒子喺唔同位置嘅概率-喺做量度之前,粒粒子會喺空間入面有個波動,每個位置嘅波動大細表示「嗰粒粒子喺嗰個位嘅概率」,而當有觀察者郁手做量度嗰陣,粒粒子會即刻出現喺其中一個位置。呢個諗法引致咗一個問題:如果呢個詮釋係啱嘅,噉即係話宇宙入面至少有一啲現象喺本質上係隨機嘅;呢個諗法令到古典嘅決定論大受打擊,亦都表示概率唔淨只係反映人嘅知識不足,而係宇宙本質上有嘅一種特性[34][35]。
機會率係統計學[英 32]同相關領域上實要諗嘅課題:統計學嘅重要一環係分析科學方法[英 33]上得到嘅數據。
科學方法本質上就涉及研究者由一個總體[英 34]入面攞一個樣本[英 35]出嚟,並且嘗試靠分析手上嘅樣本嚟增進自己對個總體嘅認識;呢種做法本質上就有不確定-理論上,研究者永遠都唔能夠肯定,個樣本實係代表得到個總體,例如研究者想研究狼嘅體重,因為人力物力嘅限制,佢冇可能研究嗮古往今來所有嘅狼,於是佢就去搵 100 隻狼嚟做樣本研究,佢量度到呢個樣本嘅狼平均體重係 40 kg,不過就最嚴格嘅邏輯基準嚟講,呢個數可能真係代表到全世界嘅狼,但又有可能全世界嘅狼嘅平均體重查實係 60 公斤,個研究者之所以搵到 40 公斤呢個數只係佢咁啱得咁橋唔好彩,抽到個代表唔到個總體嘅樣本-隨機係統計分析上無可避免嘅一部份[1][36]。
例:信心區間
好多統計學上會用嘅分析概念都係以概率做基礎嘅。例如係信心區間[英 36]噉:研究人員可以睇到嘅就淨係得個樣本啲數值,而個總體嗰柞真實數值原則上係不可知嘅;信心區間就係指「有信心總體個真實數值係喺入面嘅區間」,喺做統計嗰時會俾人攞嚟表述個樣本嘅數值同個總體嘅真實數值之間估計差幾遠,
舉個例說明,最常用嘅係「95% 信心區間」(),啲科研人員會用個樣本入面嘅海豚嘅身長平均值嚟估計嗰個不可知嘅(例如)「世上所有狼嘅身長嘅平均值」(),而佢哋可以用一啲統計方法計個「狼身長平均值嘅 95% 信心區間」出嚟-呢個值係指「有信心 95% 機會世上所有狼嘅身長嘅平均值嘅真實數值係喺 同 之間」-信心區間正正就係以概率嘅形式嚟表達嘅[37]。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.