大家對CatBoost怎麼看?

時間 2021-06-09 11:31:24

1樓:鍵盤上豬

這個CatBoost 裡面對mean encoding 改動的時候,這種改的方式,會導致特徵下編碼之後,反而類別更多了,同乙個類別值被編碼為不同的值。 這種方式感覺有點不靠譜, 本來這裡的overfitting指的就是低頻次特徵,特徵的值含有label的資訊明顯, 還不如在低頻次的時候,就直接不做target了做one-hot 或者其他編碼不是更好?

2樓:南國玫瑰

catboost 處理特徵為分類的神器,你用ligtbgm或者xgboost在處理具有大量分類特徵的時候,獨熱編碼不好用,因為你乙個特徵就有上千個分類,每個都獨熱,效果特別差,好的方法是每個分類用均值編碼,這種容易過擬合,catboost 設計了一種演算法驗證改進,避免了過擬合。因此處理分類資料應該比lightgbm 和xgboost 強很多,我觀察在處理分類資料中一般會有很大提公升(未調參)。

3樓:

個人愚見,kaggle打比賽,特徵工程才是最重要的,模型演算法頂多那麼零點零幾分的差距,並且和資料本身的特性關係更大。

catboost貌似就是為了懟xgboost而發明的,能提公升那麼一點排名純屬正常,實際工程應用在下目前還沒發現有什麼特別大的優勢,如果題主發現請告訴我,嘻嘻

大家對《東宮》怎麼看?

年年 對於三刷的東宮女孩絕不服輸!東宮去頭去尾是真正的小甜劇,李承鄞對曲小楓的愛是藏在細節裡的。例如當小楓給趙瑟瑟送酒時,雖然嘴上說的是 你別想再害瑟瑟 但當趙瑟瑟與小楓都將摔倒時,李承鄞下意識地卻接的是小楓。當小楓想起一切,拿刀要李承鄞的命時,李承鄞發現有人來,立即將小楓手裡的刀藏起來,不顧自己已...

大家對命運怎麼看?

李青梧 開始不信命,認為自己是世界的主角。後來才知道,不管好的 壞的 甜的 酸的,累到精疲力盡,淚在心裡流。終於明白,種種都是命。不管任何結果,都歸結於 命 所以,命運是什麼呢?終究是自己的選擇罷了。 巳酉 學過微積分嗎,命運相當於導數。只要把時間固定在乙個可求的值以內,進行求導。就可以看出軌跡。如...

大家對賭石怎麼看?

最近剛賭了兩塊,因為常識不足又外行,交了智商稅了。第一塊是大馬坎的黃翡料,花了6千塊錢,出了塊石頭。如圖我問懂行的朋友這能做個啥,朋友說別浪費錢了,料不抵工。另外一塊小的花了1100塊,加了400的工費,隨便做個啥都好,隨便吧。如圖 逸雲赤玉 反正我是賭怕了,之前最喜歡就是這種刺激感,買南紅原石來賭...