Entropia (teoria informacji)

Entropia – średnia ilość informacji, przypadająca na pojedynczą wiadomość ze źródła informacji. Innymi słowy jest to średnia ważona ilości informacji niesionej przez pojedynczą wiadomość, gdzie wagami są prawdopodobieństwa nadania poszczególnych wiadomości.

Wzór na entropię zmiennej losowej $X$ o zbiorze wartości $\{x_{1},x_{2},\dots ,x_{n}\}$ ^[1]:

H(X)=\sum _{i=1}^{n}p(x_{i})\log _{r}{\frac {1}{p(x_{i})}}=-\sum _{i=1}^{n}p(x_{i})\log _{r}{p(x_{i})},

gdzie $p(x_{i})$ to prawdopodobieństwo zajścia zdarzenia $x_{i},$ a $r$ to podstawa logarytmu. W teorii informacji najczęściej stosuje się logarytm o podstawie 2, wówczas jednostką entropii jest bit. Dla $r=e$ jednostka ta nazywa się nat (nit), natomiast dla $r=10$ – dit lub hartley. W przypadku gdy $p(x_{i})=0$ dla pewnego $i,$ wartość składnika $0\log _{r}{0}$ jest przyjmowana jako 0, co jest zgodne z granicą:

\lim _{p\to 0+}p\log(p)=0.

W latach 60. XX wieku węgierski matematyk Alfred Rényi uogólnił pojęcie entropii do zbioru funkcji za pomocą których można opisać ilościowo różnorodność, niepewność czy losowość systemu. Miara ta od jego nazwiska nazywana jest entropią Rényi.

Entropię można interpretować jako niepewność wystąpienia danego zdarzenia elementarnego w następnej chwili. Jeżeli jakieś zdarzenie w zbiorze zdarzeń występuje z prawdopodobieństwem równym 1, to entropia układu wynosi wówczas 0, gdyż z góry wiadomo, co się stanie – nie ma niepewności.

Własności entropii:

jest nieujemna;
jest maksymalna, gdy prawdopodobieństwa zajść zdarzeń są takie same (maksymalna niepewność)^[1];
jest równa 0, gdy prawdopodobieństwa stanów systemu poza jednym wynoszą 0, a jednego stanu – 1 (maksymalna pewność)^[1];
własność superpozycji – gdy dwa systemy są niezależne, to entropia sumy systemów równa się sumie entropii^[2];
jeśli ze źródła danych pobierane są k-literowe ciągi, wówczas entropia wynosi $H(X^{(k)})=kH(X).$

Definicja informacyjna była pierwotnie próbą ujęcia tradycyjnego pojęcia entropii znanego z termodynamiki w kategoriach teorii informacji. Okazało się jednak, że definicja ta jest przydatna w ramach samej teorii informacji.

Pojęcie entropii jest bardzo przydatne np. w dziedzinie kompresji danych. Entropię zerowego rzędu można obliczyć znając histogram ciągu symboli. Jest to iloczyn entropii i liczby znaków w ciągu. Osiągi kodowania Huffmana są często zbliżone do tej granicy, jednak lepszą efektywnością charakteryzuje się kodowanie arytmetyczne.

Przyjęcie modelu, w którym uwzględnia się kontekst znaku, pozwala zwykle na bardzo duże obniżenie entropii.

[1]

[2]

Entropia (teoria informacji)

Przykład

Zobacz też

Przypisy

Linki zewnętrzne

Wikiwand - on