Wikipedie:Velikost Wikipedie
From Wikipedia, the free encyclopedia
Související informace naleznete také na stránce Česká Wikipedie#Rozsah projektu.
Česká Wikipedie měla k 17. prosinci 2016 celkem 369 252 článků o celkové velikosti 1 899 179 085 bajtů,[1] což dělá 1 055 099 normostran textu (ovšem i s formátovacími značkami).
Když budeme počítat všechny jmenné prostory, dělá to 978 400 stránek o celkové velikosti 2 611 176 309 bajtů.[2]
Pokud by nás zajímalo, jak velká by byla česká Wikipedie vydaná tiskem, dá se to hrubě odhadnout například takto:
- K únoru 2014 měly články v české Wikipedie při velikosti databáze 1,3 GB celkem 142 milionů slov[3] (novější data bohužel nejsou k dispozici).
- K 17. prosinci 2016 byla velikost databáze cca 1,9 GB.[1]
- Z toho se dá přímou úměrou odvodit, že k 17. prosinci 2016 měly články v české Wikipedii celkem cca 208 milionů slov.
- To znamená 9,15 bajtů na slovo; jenže takto tam jsou započítány i formátovací značky, čeština takto dlouhá slova v průměru nemá.
- Pokud chceme formátovací značky vynechat (v tištěné Wikipedii by nebyly), musíme počítat se standardní průměrnou délkou slova. V anglické verzi počítají s délkou pět bajtů (s mezerou tedy celkem šest), v českém jazyce se uvádí, že jedna normostrana (1800 znaků) má cca 250 slov, tedy cca 7,2 bajtů na slovo.
- Z toho nám vychází, že v tištěné verzi by bylo 208 milionů × 7,2 bajtů, tedy cca 1,5 miliardy znaků (bajtů).
- Jeden tištěný svazek encyklopedie Britannica má 1000 stran, každá strana o dvou sloupcích s 80 řádky, každý řádek o 50 znacích. Tedy 8 milionů znaků na výtisk.
- To znamená, že česká Wikipedie by se vešla do 187 tisícistránkových, drobně popsaných knih (pokud by v nich nebyly žádné obrázky).