三分類不平衡資料集,第一類佔比95 以上,stacking後為何少數類識別效果都不如基模型?

時間 2021-06-09 19:20:09

1樓:張先生

前提:我假設你的訓練準確率是還不錯的(因為你沒具體說)。

首先資料極端不平衡本來就會出問題,像你目前的資料分布,分類器即便把所有樣本都分成A類,由於A類佔比95%,所以也能得到很高的訓練準確率,但實際上並沒有學習到太多B類和C類的特徵,導致分類器過度學習了A類的特徵,而對B類和C類的泛化效果並不好。

現在你又多加了一層,等於是增加了模型的複雜度,資料沒有做任何變化,那麼這種情況會進一步增加模型的這個問題,進一步提公升了對佔比高樣本的學習程度。

所以你最好的解決方式是balance一下資料集,或者是在loss上使用一些加權的方法。

2樓:「已登出」

詳細描述一下問題。三分類不平衡資料集,第一類佔比95%以上,二三類差別不是特別大。用stacking框架實現。

基模型分別選了隨機森林、多分類SVM(加了類權重),adaboost,GBDT,5折交叉驗證,第二層嘗試了回歸、adaboost。stacking後為何少數類識別效果都不如基模型?

心裡十分不平衡(嫉妒)怎麼辦

盼盼 我覺得有這樣的想法是很正常的,而且我覺得這也不是嫉妒,你只是心裡對不勞而獲的行為而感到不恥,也可能包含著對輕易得到你渴望的東西的人而感到羨慕,也可能這兩種情緒交織而成的 得到了自己想要的東西卻不付出對應的努力 這種行為而產生了心理不平衡。現實中的確存在很多這樣的人,學習上投機取巧,外表上光鮮亮...

三國殺究竟有多不平衡?

一路向北 好久沒玩三國殺了,最近無聊重新下回來想玩一玩。然後就碰到了這個畫面 等到我的回合手牌全部到神甘寧手上了整把對面四個人的技能我都沒看完。這還是我認識的三國殺? 紫胤真人frf 想當年單挑四禁是孫權,呂蒙,華佗,曹操。孫權 我制衡的過牌量你們能比?呂蒙 我憋一手牌來個連弩就砍死你。華佗 你們賣...

身邊有小三混得好,心裡不平衡怎麼辦?

小透明 努力活出自己,那你就不會跟小三去比較了,我老公也偏愛小三,在他們感情公升溫期被我強行掰開,不管怎麼樣老公心裡都只有小三還不如盡早拋棄,自己痛不欲生還不如不活在世上 大九九嘍 潛意識你是認可她的行為的,怎麼說呢,這個世界是多元化的世界,外面多的是大佬包養情人,情人過的好的,你如果能接受,你也可...