李航老師書上的決策樹剪枝的損失函式裡為什麼計算葉節點的的經驗熵時,為什麼葉節點會有很多類?

時間 2021-05-05 15:47:34

1樓:Chen Wang

理想情況下,在完全分類完了之後當然是所有葉節點只有一類,但是講一組葉節點回縮到其父親節點成為新的葉節點之後,這個新的葉節點就不是一類了吧。況且,決策樹分類也可能遇到所有特徵都無法分開的情況,只能取例項數最大的作為類標記,這種情況的葉節點也不是一類。看看5.

3節的演算法描述。

2樓:李龍

在決策樹學習過程中,決策樹構建停止的時機有兩個,乙個是選到某個特徵劃分後可以將當前資料集劃分為純淨的幾類時便可停止,也就是此時葉節點上的樣本都是同一類的,另乙個時機就是特徵集的特徵都用完了,構建不得不停止了,這樣構建出來的葉節點中可能就包含多類樣本,決策樹為了讓每個葉節點都代表一類,通過投票機制選取該葉結點下樣本出現次數最多的那一類作為葉節點代表的類,所以葉節點只代表一類並不意味著葉節點下的樣本只有一類,事實上可能會有多類樣本。

3樓:

乙個葉節點表示一類,有k個葉節點表示分成了k類;

回縮操作是計算有這個分枝時的整體經驗熵和沒有這個分枝時的整體經驗熵的差,以此來決定是否剪枝;

4樓:kksw

純葉子結點只有一類。

通常情況下,資料會有雜訊、測量誤差、錯誤資料等,並不是那麼容易可以分類的,這時候的葉子結點會包含大部分被正確分類的樣本和少部分被錯誤分類的樣本

如何評價李佳航李晟的相處模式?

nothing 我是喜歡晟很多年了 後來她跟她家小黑公布戀情後,真的有愛屋及烏的感覺,越看佳航越喜歡 傳說中丈母娘粉.不得不說晟眼光極好,佳航性格真的太好了,脾氣好,認真工作,也很踏實,目前沒有看到他有什麼缺點,至於晟晟,是很細膩的小女人,愛畫畫愛唱歌養貓貓種種花,很佛的大齡女演員,哈哈哈哈 看到婆...

老師講的很多內容書上都有,老師還是要求你做筆記,這是該怎麼做呢?老師的目的是什麼呢?

徐且長 老師在授課的過程中,學生做好筆記,是很有必要性的。但要怎樣做好筆記,還是一門學問,歷年來一些學霸所做的筆記為什麼能出版成很搶手的書呢?原因就是他們的筆記做得科學 有效率 實用。課堂筆記最關鍵是記好以下幾個方面 第一就是每一節中老師形成的知識導圖,知識框架 第二就是這一節課中的難點突破的方法 ...

李航《統計學習方法》中的Adaboost例項解析(例子8 1)中zm(規範化因子)怎麼求啊?

路飛 想請教您個問題,後邊權值怎麼計算的我明白,但是在進行訓練的時候訓練集和權值怎麼結合的我不大明白,拿第一步來說是怎麼實現訓練集權值是按D1分布的?迭代到第二次,權值變化了D2,分類器的輸入 訓練集 不是也得變麼,那他是怎麼實現訓練集按照D2分布的呢? 天天 問題解決啦。用python編了乙個小程...