相對熵定義是不是不合理？

1樓：南陽布衣

不請自來，我在宗成慶老師的《統計自然語言處理》中看到了這個，也覺得有些奇怪，為什麼要以p的概率，而不是q的概率（或者說二者都用上）

後來我搜了wikipedia，上面是這個說的

in mathematic statistics, the Kullback-Leibler divergence(also called relative entropy) is a measure of how one probability distribution is different from a second, reference probability distribution

這裡應該就比較易懂，相對熵是q相對於p的差異，p是第2個作為參考的；log(p/q)是差異，p是參考所以應該乘以p，先計算差異，後根據概率加和平均

另外附上宗老師給的定義：

相對熵(relative entropy)又稱Kullback-Leibler差異（Kullback-Leibler divergence）,或簡稱KL距離，是衡量相同事件空間裡兩個概率分布相對差距的測度

我覺得題主給的，只能說明資訊熵差別大不大（先根據概率計算平均，再算差異），不能說明二者是不是接近（先計算差異，後根據概率加和平均），而相對熵，偏向於後者

（剛發現是18年的，就當拋磚引玉吧）

2樓：

相對熵本來是乙個在p，真實分布下，對兩個分布對數比值的乙個期望，這麼一改就不是期望了~

不是期望的話，很多地方的計算會不太方便，比如對期望的微分可以用蒙特卡羅方法無偏估計成對微分的期望~

順便，也不要求以2為底~

而且你改完之後，變成兩個熵的差，那擲兩個不均勻的色子，色面點數分布不同，這兩個分布就沒有差別了吧~但實質上顯然差別挺大的，尤其是極端情況，乙個總出正面的硬幣和乙個總出反面的硬幣~總不能認為分布一樣吧~

相對熵定義是不是不合理？

守望先鋒匹配機制是不是很不合理？

請問ATP網球的積分制度是不是不合理？

天天象棋沒有讀秒是不是有點不合理？

其他用戶還看了：