周志華《機器學習》38頁關於二項檢驗的公式 2 27 是否有誤？

1樓：GuoQW

符號：代表泛化錯誤率，代表測試錯誤率，是某次進行實驗得到的測試錯誤率。

現假設（是猜測值），得到下式：

，這符合二項分布，接著利用下式計算拒絕域下限：

，若時，拒絕假設（即某次實驗出現該情形，有理由拒絕原假設）；否則，不支援拒絕假設（出現在非拒絕域不代表接受原假設）。

周志華教授《機器學習》（第一版第31次印刷, 2023年9月）38頁關於二項檢驗的公式(2.27)是否有誤？ - 知乎 https://www.

zhihu.com/question/287895170/answer/763223175勘誤中的max也請參考上述推薦答案，就是求。

2樓：PYL

簡單版：公式有誤。從式2.

27前面的「則在1- 的概率內所能觀測到的最大錯誤率如下式計算」和式2.27後面「若測試錯誤率小於臨界值」可以看出是的上限，但式2.27表達的是是的上限，兩者不符。

但按假設檢驗的任務來看，應該是用觀察到的測試值去判斷假設是否應該接受。所以，文字表述部分才是正確意思，公式是錯的。

複雜版：我嘗試從「、、、這幾個數分別是怎麼來的、起什麼作用」的角度來解釋一下，看看能否講明白。

1. 泛化錯誤率是學習器的內在屬性。它是乙個客觀存在的值，但這個值我們測不到。

這也就是為什麼我們要提出「對進行假設檢驗」這一問題。假設檢驗的任務，就是（以某種準確度）對進行猜測。

2. 是人為指定的乙個數值，用於作為的猜測值（等於、不大於、不小於），是題幹的一部分。例如「：

=0.5」這個假設中的0.5就是這個值，這個問題問的是「等於0.

5嗎」。

3. 是的一次觀測值，它和肯定有某種內在的聯絡，所以我們後面要根據它的表現去判斷關於的假設。

4. 臨界值按照文字描述，是的上限，而不是公式所示的上限。先舉乙個假設檢驗的例子。

有一枚硬幣，我們提出假設「它是均勻的，即丟擲正面的概率是p=0.5」，我們要用觀測值來驗證這個假設。比如拋1000次，我們要得到幾次正面，才能說這個假設不成立呢？

理論上不管得到幾次正面都不能說這個假設不成立，因為我們可以得到[0,1000]中任何次數的正面，只是概率不同而已。但生活經驗告訴我們，如果真的丟擲0次或1000次正面，我們就有理由懷疑這枚硬幣不是均勻的，即拒絕原假設（這也是「第一類錯誤概率是」的原因，具體可以看我另乙個答案）。具體地，我們可能丟擲[450,550]次正面才接受原假設，在此範圍之外都拒絕原假設。

回到本問題，我們要用觀測值驗證「」，理論上可以取[0,1]的任何值，但實際上我們要在小於等於某個值的時候才接受原假設，這個值就是。然後就是這個如何計算出來。拒絕域是在大於某個值的範圍，所以我們計算類似於圖2.

6那樣的右側陰影部分，但下限不是圖中的。如圖可見我們向左擴充套件陰影部分時，陰影部分概率和增加，但我們需要陰影部分概率和不超過，所以向左擴充套件有個下限。實際上我們的陰影部分下限就是，拒絕域的下限就是「接受域」的上限，即以下接受以上拒絕，這很自然。

總結一下此處假設檢驗的流程：就是先提出「」這一假設，然後用測試值來驗證這一假設。驗證的原則是小於某個臨界值，就能以的準確度接受這個假設。

比如值在時（瞎編的資料），就可以說，但這個說法不是絕對正確的，而是有的正確度。

周志華《機器學習》38頁關於二項檢驗的公式 2 27 是否有誤？

機器學習（周志華）第2 3 4節中，代價曲線的理解？

南大周志華的《機器學習》這本書怎麼樣？

機器學習方向，南大周志華組lamda實驗室vs申請國外cs？

其他用戶還看了：