齊夫定律(英語:Zipf's law,IPA)是由哈佛大學的語言學家喬治·金斯利·齊夫於1949年發表的實驗定律。它可以表述為:在自然語言的語料庫裡,一個單詞出現的頻率與它在頻率表里的排名成反比。所以,頻率最高的單詞出現的頻率大約是出現頻率第二位的單詞的2倍,而出現頻率第二位的單詞則是出現頻率第四位的單詞的2倍。這個定律被作為任何與冪定律機率分布有關的事物的參考。
Quick Facts 母數, 值域 ...
齊夫定律
機率質量函數 橫縱坐標均為對數比例下,齊夫定律的機率質量函數的圖像,其中N = 10。橫坐標是指數k 。(注意,函數僅在k為整數時有定義,圖上的連線不代表函數連續。) |
累積分布函數 橫縱坐標均為對數比例下,齊夫定律的累計分布函數的圖像,其中N = 10。橫坐標是指數k 。(注意,函數僅在k為整數時有定義,圖上的連線不代表函數連續。) |
母數 |
(實數)
(正整數) |
---|
值域 |
![{\displaystyle k\in \{1,2,\ldots ,N\}}](//wikimedia.org/api/rest_v1/media/math/render/svg/2901de737533733105354dba92ef12fa5dfd444d) |
---|
機率質量函數 |
![{\displaystyle {\frac {1/k^{s}}{H_{N,s}}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/0beacf1c1fdd669bae512343234fc9c26951db92) |
---|
累積分布函數 |
![{\displaystyle {\frac {H_{k,s}}{H_{N,s}}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/cd2e24a4ad0920ceeda7e797e05e33f6034dd75a) |
---|
期望值 |
![{\displaystyle {\frac {H_{N,s-1}}{H_{N,s}}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/de75685e9d5b89b2fddf89a37a83ae40511e795e) |
---|
眾數 |
![{\displaystyle 1\,}](//wikimedia.org/api/rest_v1/media/math/render/svg/bfd1e7984fe6e1b79a26404a8138a6c6ee41a476) |
---|
熵 |
![{\displaystyle {\frac {s}{H_{N,s}}}\sum _{k=1}^{N}{\frac {\ln(k)}{k^{s}}}+\ln(H_{N,s})}](//wikimedia.org/api/rest_v1/media/math/render/svg/d9774cda6e99042043775851bbf8fa280c8b2895) |
---|
動差母函數 |
![{\displaystyle {\frac {1}{H_{N,s}}}\sum _{n=1}^{N}{\frac {e^{nt}}{n^{s}}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/0209e020cd5698264dcefd7107b89fe2c9e9bd41) |
---|
特徵函數 |
![{\displaystyle {\frac {1}{H_{N,s}}}\sum _{n=1}^{N}{\frac {e^{int}}{n^{s}}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/ae58e0662bcfb1061d21261d91c6dbe0e1a5c18c) |
---|
Close