隨機數列(英文:random sequence)的概念在概率論和統計學中都十分重要。整個概念主要構建在由隨機變量組成的數列的基礎之上,因此每每提及到隨機數列,人們常常會這樣開場:「設為隨機變量……」[1]但是也如同美國數學家得瑞克·亨利·雷莫在1951年時說的那樣:「隨機數列是一個很模糊的概念……它每一項都是無法預測中的無法預測,但是這些數字卻能夠通過傳統的統計學上的考驗。」[2]
概率公理有意繞過了對隨機數列的定義。[3]傳統的統計學理論並沒有直接闡明某個數列是否隨機,而是直接跳過這部分,在假設某種隨機性存在的前提之下討論隨機變量的性質。比如布爾巴基學派就認為,「『假設一個隨機數列』這句話是對術語的濫用。」[4]
早期歷史
法國數學家埃米爾·博雷爾是1909年第一批給出隨機性的正式定義的數學家之一。[5]在1919年,受大數定理的啟發,奧地利數學家理查德·馮·米澤斯給出了第一個算法隨機性的定義。但是,他使用了「集合」這個詞,而不是「隨機數列」。利用賭博系統的不可能性,馮·米澤斯定義道:若由0和1構成的無窮數列具有「頻率穩定性的特點」,也就是說,0的頻率趨進於1/2,且該數列的每個「以適當方式選取的」子數列也都沒有偏差,那麼我們說,這個數列是「隨機的」。[6]
馮·米澤斯的這個方法中,「適當選取子數列」的標準非常重要,因為雖然說「01010101……」本身沒有偏差(0出現的概率為1/2),但是若我們只選奇數位置上的數字,得到的子數列便成了完全不隨機的「000000……」。馮·米澤斯未曾就這個問題正式給出一個選取規則上的解釋。1940年,美國數學家阿隆佐·邱奇將這個規則定義為「任何已經讀取該無窮數列的前N項,並決定是否讀取其第N+1項的遞歸函數。」邱其是可計算函數方面的先驅,他給出的這個定義的可計算性基於邱奇-圖靈猜想。[7]這個定義經常被稱作「米澤斯-邱其隨機性」(英文:Mises-Church randomness)。
現代方法
在20世紀,人們發展出了一些技術手段來定義隨機數列。在1960年代中期,蘇聯數學家安德雷·柯爾莫哥洛夫和美國數學家唐納德·W·羅弗蘭德各自獨立提交了一份更寬容的子數列選取規則。[8][9]在他們看來,邱其的遞歸函數過於嚴苛,因為它只能按順序讀取數列的前N項。與邱其相反,他們的規則是允許從數列中選取「任意」N項,並決定是否需要再選一個項。這個定義經常被稱作「柯爾莫哥洛夫-羅弗蘭德隨機性」(英文:Kolmogorov-Loveland stochasticity)。但是Alexander Shen則認為這個方法過弱,並給出了一個不符合大眾眼中的隨機性的柯爾莫哥洛夫-羅弗蘭德隨機數列。
1966年,瑞典數理統計學家佩爾·馬丁-洛夫引入了一個被後世稱為最令人滿意的算法平均性的概念。 他的這一概念中起初涉及到了了測量理論,但後來證明也可以用柯氏複雜性來表示。(柯爾莫哥洛夫對於隨機字符串的定義,即柯氏複雜性,是說,「若一個字符串在通用圖靈機中沒有一個比自身要更短的描述,那麼這個字符串是隨機的」。)[10]
現如今,有三個處理隨機數列的方式:[11]
- 頻率/測量理論法。這個方法建立在前文的米澤斯和邱其的方法的基礎之上。 在1960年代,佩爾·馬丁-洛夫注意到,人們能夠寫下基於頻率生成隨機數列的代碼,而這些代碼的集合是一種特殊的零測度集。在此基礎之上,通過利用所有的零測度集,人們能夠得到一個更加放之四海而皆準的隨機數列定義。
- 複雜度/可壓縮度法。柯爾莫哥洛夫本人對這個方法貢獻巨大,其次還有列文和阿根廷裔美國數學家格里高列·蔡廷等也作出了一定的貢獻。對於有限項的隨機數列,柯爾莫哥洛夫將它的隨機性定義為「熵」,也就是後來的柯氏複雜性。這個定義下,一個包含了0與1組成的、長度為的字符串(或者數列,二者並無本質上的區別),其「熵」的大小為這個數列的最短描述的長度和的接近程度。字符串的複雜度越接近於,它也會越隨機;而字符串的複雜性越低於,它也就越不隨機。
這三個方式在大多數情況下被證實是等價的。[15]
需要注意的是,按照以上任意一個關於無限數列的隨機性定義,由於都是着眼於隨機性趨勢,因此對數據開頭部分的隨機性不敏感。如果在隨機數列的第一項前插入哪怕一百萬個0,得出的仍然會是隨機數列。因此,應用這幾個定義時應該小心謹慎。[16]
參見
參考資料
外部連結
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.