用TensorFlow訓練CNN網路時,測試的loss一直不變且測試準確率也很低,這是咋回事?

時間 2021-05-30 04:42:02

1樓:白色科比

我認為是batch-size設定的有問題,或者說這是應該首先考慮的問題,因為你的這個準確率一直在波動,我之前遇見的大部分模型準確率出現了波動都是調整batch-size最後成功收斂的,

2樓:張帆

提供幾個思路,

直覺是你的訓練集太少了,因為就算模型有問題只要引數多overfit就很有可能做到

dropout 你看下,到底是輸入是keep prob還是drop prob,drop率是多少,不要搞的以為drop了0.1結果是keep了0.1,還有測試時dropout istrainning是true還是false.

有沒有bn和dropout一起用?如果是,留乙個,我推薦用bn,至少引數沒那麼敏感...

lr的話嘗試0.01到0.003,不要太低.

最後就是檢查資料轉換和模型輸入是否正確了,這個出問題的很多因為沒ut難看出來問題

3樓:

先用訓練集測試,判斷是否過擬合;

不是的話再加驗證集;

還沒有用的話檢查資料(如果資料集不是特別大),是否有無效或有毒的;

最後就是調參,判斷模型是否合適,更改模型結構...等;

用tensorflow定義層

金一鳴 凡事總要權衡利弊。錯題本這事也是這樣。其實優先的選擇是直接徹底搞懂。這樣做的收益非常大,風險也非常大,能夠持續地保持對每一道錯題都即刻搞明白,那麼就已經是學霸學神了。然而,事實上是,很多學生對於即刻搞懂一道錯題,可能出現以下情況 1 自己也不知道怎樣才算搞懂 2 搞懂了以後很快就會忘記 3 ...

Tensorflow 訓練時執行越來越慢,重啟後又變好是什麼原因?

大海燕 我的方法是用bash指令碼每隔一分鐘重啟一次python現在模型跑起來了,提前開始過端午了,實習以來下班最早的一天,全靠這個指令碼 bin sh for i in seq w 1300 30 12550 doecho i timeout 60 python my.py isleep 2 do...

企業一般用TensorFlow不用keras,那tf2包含keras的一些東西,會不會也不適應企業

異塵 沒有keras不適合工業界這一說。事實上,在模型設計及訓練的過程中,keras非常好用。tf2砍掉其他的api,把tf.keras提公升至一等公民是非常正確的決定。我認為除了大廠有自己的框架外,普通公司用keras訓練模型,匯出pb後做成tensorflow serving來部署,開發生產兩不...