相对熵

KL散度（Kullback-Leibler divergence，简称KLD）^[1]，在消息系统中称为相对熵（relative entropy），在连续时间序列中称为随机性（randomness），在统计模型推断中称为消息增益（information gain）。也称消息散度（information divergence）。

KL散度是两个概率分布P和Q差别的非对称性的度量。 KL散度是用来度量使用基于Q的分布来编码服从P的分布的样本所需的额外的平均位元数。典型情况下，P表示数据的真实分布，Q表示数据的理论分布、估计的模型分布、或P的近似分布。^[1]

[1]

相对熵

定义

特性

KL散度和其它量的关系

参见

参考文献

Wikiwand - on

相对熵