Libsvm訓練結果準確率很好95 ,但是模型放到測試集上的準確率卻很低,僅有50 左右?

時間 2021-05-29 23:55:47

1樓:畢閣棣

親,這個問題分兩部分:

Generally speaking: train出來的model比較好,說明這個模型可以捕捉training dataset的資訊,而test dataset不好,可能是你的sample方法不夠隨機,導致test dataset和training dataset有較大差異。這時候你需要多做幾次,減少隨機誤差(random error)。

Specifically speaking:

1900分成3:7, train出來的模型bias太大。我們來看prediction的trade-off:

prediction error = bias + model variance + inevitable variance。這裡bias佔的比例可能會比較大。

像phd哥哥說的那樣,feature太多導致overfitting。

2樓:Dai Zhongxiang

95%是訓練準確率還是交叉驗證準確率?如果是訓練準確率的話很可能是overfit的問題,需要用一些正則化方法;如果是交叉驗證準確率的話可能是測試集和訓練集的分布不一樣也就是兩個集差別很大。。。

在訓練cnn的過程中,訓練集準確率逐漸公升高,loss平穩下降,但是測試集動盪劇烈是什麼原因?

暴走的夢想 我覺得首先要看你的訓練集和測試集是否是同乙個資料集,同乙個資料集的話分布應該是大致相同的,當然要確保劃分資料集合理,比如訓練集是否包含了所有種類,是否對資料集進行了隨機劃分 這樣出現測試集acc和loss不穩定的情況就是過擬合了。還有一種情況就是訓練集和測試集沒有來自同乙個資料集,那這時...

kaggle titanic如何做到準確率90 ?

已登出 同很好奇,我用的logisticregression,只到76 丟掉了 ticket,passengersid,cabin,name 四個columns,然後各種調參也只能到76 宋偉 Titanic Machine Learning from Disaster 那些人是怎麼達到1.000的...

筆跡鑑定準確率多高?

明鑑文書司法鑑定所 司法鑑定屬於專家意見,沒有所謂的準確率的說法,如果有原件的話,風險低一些,如果是複製件做鑑定,存在惡意摹仿或者是描摹上去的,會存在相關風險。我們所從2007年成立到現在,沒有因為鑑定結論錯誤而被出現錯案或被有效投訴過。 張禿子 筆跡鑑定是一門科學,有科學依據和方法。在樣本充足的情...