為什麼夏農要將資訊熵公式要定義成 p log p 或 p log p dp？

1樓：邵經天

看到很多回答從數學角度加以限制推出資訊熵的表示式，在我看來太過抽象並不容易理解。這裡介紹一下王立威老師《資訊理論》是怎樣描述資訊熵的。

考察乙個離散型隨機變數的信源編碼問題，這裡的取值範圍為，對應的概率分布為。那麼問題來了，如果要傳遞該隨機變數的值，那麼應當採用怎樣的0-1編碼方式呢？

證明略證明：字首編碼可以看作是乙個二叉樹（0向左子節點，1向右子節點），那麼最優的字首編碼一定對應乙個完全二叉樹（所有非葉節點都有兩個子節點），否則可以通過刪去該非葉節點縮短二叉樹的長度（編碼長度）。而完全二叉樹滿足，因此引理二得證。

證明略。

由引理一，二可以得到，任意離散隨機變數的編碼都可以轉化為滿足的字首編碼。那麼離散型隨機變數的平均編碼長度可以表示為，記 ,原式等價於。由引理三可知，。

由此可知資訊熵是平均編碼長度的乙個下界。我們還可以證明不僅僅是下界，而且是下確界。因此用平均信源編碼長度的下確界當作資訊量的大小，我認為是十分合理的。

2樓：董瑞

今年Witten寫了個資訊理論的介紹，開頭對於夏農資訊熵的介紹還是蠻直觀的。

假設有一列資訊由字母組成，其中出現的概率是 , 出現的概率是 ,假設字母列足夠長，長度是，那麼字母列中就有個，個，那麼字母列就有種排列，應用Stirling公式,即，得到

,這裡就是概率分布的熵。

所以，資訊熵的意義就是，一列長度為的，由組成的字母列，如果出現的概率是，出現的概率是，其資訊量就是位元.

3樓：

大膽猜測，小心求證，勿噴；

這裡想用乙個小遊戲，在娛樂之中愉悅身心，順便學有所獲，這絕對是一箭雙鵰的沒事：

假設這裡有32張紙片，紙片大小相同，色澤無異，厚薄唯一，簡單的說：就物理上都一樣，紙片上分別標記著1，2，3.....32 連續的數字編碼。

在打亂次序的32張紙片中，隨機抽取了一張紙片：A

問題來了，你怎麼以最快的速度猜出紙片：A 的標記值是幾呢？

需要多少次試錯，在反饋猜測值與A標記值的大小中，最快猜出正確的 A的標記值。

這裡思考3秒，你會怎麼猜，你會猜的第乙個數值是多少呢？

這裡我們同樣通過遊戲的方式來揭秘最快的猜數演算法。

小紅目不轉睛的望著小明手裡藏掖的紙片A，腦海在翻滾，陷入的萬千思緒，強者之間的較量開始了

小紅：我猜紙片A 的值是 16 （32/2）

小明：紙片A的值比 16 要小

小紅：那是 8 對不對？

小明：還比8小

小紅：4呢

小明；也比4小

小紅：那我很有把握是2

小明：不對，比2 大

小紅：哈哈，這裡傻瓜都知道是3了。

開始數學推理了：

其實我們很清楚，小紅在32個紙片中猜對A值的概率是：

小紅採取的策略是二分法猜測，用了5次：

為什麼化學中有些公式非要將 ln 強行成 lg 與 2 303？

依古比古我的理解是這樣的，這個應該是始於用電動勢法測定pH的方法，因為pH的定義裡面是lg a H 而能斯特方程裡面是lnJ，取指示電極和參比電極構成電池後，用能斯特方程計算其電動勢，lnJ的部分裡面會包含氫離子的活度，而這裡把ln轉成lg，就可以把lnJ換成pH，同時帶了乙個2.303的係數。 ...

ECMAScript規範為什麼要定義Undefined基本資料型別為什麼不用null來取代undefined作為宣告了但未初始化值的變數的值

沈嶸如果你本來就宣告了乙個變數，那麼給這個變數賦予 Undefined 還是 Null 來表示初始化與否，則你個人的程式設計習慣雖然我認為這種情況一般用 Null 比較好如果你自己嚴格遵守宣告了但是未初始化就用 Null，那麼 Undefined 就可以被用來確實判斷變數是否宣告與否，或者...

函式的內積為什麼要這麼定義？

虛實道長我想題主的困惑應該是求和完了就完了，幹嘛還要積分。也就是為何還要乘以dx。其實這就是連續的詭異之處。如果只是做離散分割，是可以只求乙個sum。問題在於，離散分割了的，在某個點的f xi g xi 和下個點之間，理論上還有無窮多點！所以在連續的情況下，問題發生了難以理解的改變，f x...

為什麼夏農要將資訊熵公式要定義成 p log p 或 p log p dp？

為什麼化學中有些公式非要將 ln 強行成 lg 與 2 303？

ECMAScript規範為什麼要定義Undefined基本資料型別 為什麼不用null來取代undefined作為宣告了但未初始化值的變數的值

函式的內積為什麼要這麼定義？

其他用戶還看了：

ECMAScript規範為什麼要定義Undefined基本資料型別為什麼不用null來取代undefined作為宣告了但未初始化值的變數的值