信息論(英語:information theory)是應用數學、電子學和計算機科學的一個分支,涉及信息的量化、存儲和通信等。信息論是由克勞德·香農發展,用來找出信號處理與通信操作的基本限制,如數據壓縮、可靠的存儲和數據傳輸等。自創立以來,它已拓展應用到許多其他領域,包括統計推斷、自然語言處理、密碼學、神經生物學[1]、進化論[2]和分子編碼的功能[3]、生態學的模式選擇[4]、熱物理[5]、量子計算、語言學、剽竊檢測[6]、模式識別、異常檢測和其他形式的數據分析。[7]
提示:此條目的主題不是
信息學。
熵是信息的一個關鍵度量,通常用一條消息中需要存儲或傳輸一個符號的平均比特數來表示。熵衡量了預測隨機變量的值時涉及到的不確定度的量。例如,指定擲硬幣的結果(兩個等可能的結果)比指定擲骰子的結果(六個等可能的結果)所提供的信息量更少(熵更少)。
信息論將信息的傳遞作為一種統計現象來考慮,給出了估算通信信道容量的方法。信息傳輸和信息壓縮是信息論研究中的兩大領域。這兩個方面又由信道編碼定理、信源-信道隔離定理相互聯繫。
信息論的基本內容的應用包括無損數據壓縮(如ZIP文件)、有損數據壓縮(如MP3和JPEG)、信道編碼(如數字用戶線路(DSL))。這個領域處在數學、統計學、計算機科學、物理學、神經科學和電機工程學的交叉點上。信息論對航海家深空探測任務的成敗、光盤的發明、手機的可行性、互聯網的發展、語言學和人類感知的研究、對黑洞的了解,以及許多其他領域都影響深遠。信息論的重要子領域有信源編碼、信道編碼、算法複雜性理論、算法信息論、資訊理論安全性和信息度量等。
信息論的主要內容可以類比人類最廣泛的交流手段——語言來闡述。
一種簡潔的語言(以英語為例)通常有兩個重要特點:
首先,最常用的詞(比如"a"、"the"、"I")應該比不太常用的詞(比如"benefit"、"generation"、"mediocre")要短一些;其次,如果句子的某一部分被漏聽或者由於噪聲干擾(比如一輛車輛疾馳而過)而被誤聽,聽者應該仍然可以抓住句子的大概意思。而如果把電子通信系統比作一種語言的話,這種健壯性(robustness)是不可或缺的。將健壯性引入通信是通過信道編碼完成的。信源編碼和信道編碼是信息論的基本研究課題。
注意這些內容同消息的重要性之間是毫不相干的。例如,像「多謝;常來」這樣的客套話與像「救命」這樣的緊急請求在說起來、或者寫起來所花的時間是差不多的,然而明顯後者更重要,也更有實在意義。信息論卻不考慮一段消息的重要性或內在意義,因為這些是數據的質量的問題而不是數據量(數據的長度)和可讀性方面上的問題,後者只是由概率這一因素單獨決定的。
設有一個三個面的骰子,三面分別寫有,為擲得的數,擲得各面的概率為
則
聯合熵(Joint Entropy)由熵的定義出發,計算聯合分布的熵:
條件熵(Conditional Entropy),顧名思義,是以條件機率計算:
由貝氏定理,有,代入聯合熵的定義,可以分離出條件熵,於是得到聯合熵與條件熵的關係式:
可以再對聯合熵與條件熵的關係做推廣,假設現在有個隨機變量,重複分離出條件熵,有:
其直觀意義如下:假如接收一段數列,且先收到,再來是,依此類推。那麼收到後總訊息量為,收到後總訊息量為,直到收到後,總訊息量應為,於是這個接收過程給出了鏈式法則。
互信息(Mutual Information)是另一有用的信息度量,它是指兩個事件集合之間的相關性。兩個事件和的互信息定義為:
其意義為,包含的多少資訊。在尚未得到之前,對的不確定性是,得到後,不確定性是。所以一旦得到,就消除了的不確定量,這就是對的資訊量。
如果互為獨立,則,於是。
又因為,所以
其中等號成立條件為,是一個對射函數。
互信息與G檢驗以及皮爾森卡方檢定有着密切的聯繫。
F. Rieke, D. Warland, R Ruyter van Steveninck, W Bialek. Spikes: Exploring the Neural Code. The MIT press. 1997. ISBN 978-0262681087.
cf. Huelsenbeck, J. P., F. Ronquist, R. Nielsen and J. P. Bollback (2001) Bayesian inference of phylogeny and its impact on evolutionary biology, Science 294:2310-2314
Rando Allikmets, Wyeth W. Wasserman, Amy Hutchinson, Philip Smallwood, Jeremy Nathans, Peter K. Rogan, Thomas D. Schneider (頁面存檔備份,存於網際網路檔案館), Michael Dean (1998) Organization of the ABCR gene: analysis of promoter and splice junction sequences, Gene 215:1, 111-122
Burnham, K. P. and Anderson D. R. (2002) Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, Second Edition (Springer Science, New York) ISBN 978-0-387-95364-9.