![cover image](https://wikiwandv2-19431.kxcdn.com/_next/image?url=https://upload.wikimedia.org/wikipedia/commons/thumb/4/46/Rozklad_benforda.svg/langcs-640px-Rozklad_benforda.svg.png&w=640&q=50)
Benfordův zákon
četnost 1. číslice v sadách číselných dat / From Wikipedia, the free encyclopedia
Benfordův zákon, někdy též Newcombův-Benfordův zákon, je matematický zákon, který říká, že v mnoha souborech přirozených dat (ale ne ve všech) začínají čísla mnohem častěji číslicí 1 než jinou číslicí. Alternativní formulace: první číslice čísla pravděpodobně bude malá.[1] Zhruba 30 % čísel začíná jedničkou. Čím vyšší počáteční číslice je, tím méně pravděpodobně se vyskytuje na začátku čísel (viz obrázek s histogramem relativní četnosti výskytu jednotlivých číslice).
![Thumb image](http://upload.wikimedia.org/wikipedia/commons/thumb/4/46/Rozklad_benforda.svg/320px-Rozklad_benforda.svg.png)
Ve skupině čísel reprezentujících reálné hodnoty čehokoli je asi 30% pravděpodobnost, že první číslovkou bude jednička. Dále pak 17,6 % čísel bude začínat dvojkou, 12,5 % trojkou a jen 4,57 % devítkou. Nejde o žádný matematický trik, ale o skutečný přírodní zákon, jímž se řídí soubory jakýchkoli přirozených dat bez ohledu na jejich podstatu nebo fyzikální jednotky. Jedinou podmínkou je, že data musí být v minimálním rozsahu tří logaritmických intervalů (tj. v minimálním rozsahu tří desítkových řádů).[2]
Tuto skutečnost poprvé objevil a zveřejnil kanadsko-americký matematik a astronom Simon Newcombe v článku „Note on the Frequency of Use of the Different Digits in Natural Numbers“ publikovaném v American Journal of Mathematics (1881, č. 4, s. 39–40).[3] Upozornil na skutečnost, že logaritmické tabulky v technické knihovně mají mnohem více ohmatané první stránky, tzn. stránky s čísly počínajícími jedničkou, než stránky na konci, tzn. stránky s čísly začínajícími číslicí 9. Usoudil, že uživatelé logaritmických tabulek (vědci a studenti přírodovědných a společenských oborů) se při své práci častěji setkávají s čísly začínajícími číslicí 1 nebo 2 než s čísly začínajícími číslicí 8 nebo 9. Na první pohled se zdá přirozené předpokládat, že první platná číslice čísel, s nimiž se lidé setkávají, bude se stejnou pravděpodobností jednička, dvojka i devítka. S touto intuitivní představou je však Newcombovo tvrzení v rozporu.[4]
Newcombe neuvedl žádnou analýzu konkrétních souborů dat, pokusil se však o určité matematické zdůvodnění výsledku. Článek upadl v zapomnění – autorovu tvrzení nebyla věnována pozornost několik desetiletí.[5]
Tento z určitého hlediska přírodní jev znovu objevil v roce 1938 fyzik Frank Benford.[5] Svá zjištění publikoval v článku „The Law of Anomalous Numbers“ v Proceedings Of The American Philosophical Society (1938, vol. 78, no. 4, s. 551–572).[6] Na rozdíl od Newcomba založil svá tvrzení na empirických pozorováních. Několik let shromažďoval číselné údaje z různých zdrojů a oborů (např. plochy povodí 335 řek, měrné skupenské teplo 1389 chemických sloučenin, čísla vyskytující se na titulní stránce novin a další). Dohromady zpracoval více než 20 000 číselných údajů ve 20 různých souborech dat a ukázal, že první číslice se opravdu nevyskytují všechny stejně často. I proto se pro zmíněnou zákonitost užívá pojmenování Benfordův zákon.[7][5]
Simon Newcomb i Frank Benford dospěli každý jinou cestou k vyjádření téhož.[7]