RNN神經網路訓練過程中weight幾乎不更新，只有bias更新？

1樓：大多萌萌噠

把梯度截斷的c的值增大吧，或者修改啟用函式。一般用ReLU函式的話不會出現這個問題啊。。而且你權重初始化是怎麼初始化的？單位矩陣還是隨機值？

2樓：

其實不太懂RNN，路過問一下

啟用函式用的是啥，relu？

這個網路用來做什麼的，輸入輸出是什麼樣子的，數值範圍？

感覺像是normalization或是初始化相關的問題，今天剛看一篇文章講新手常見坑，感覺值得一看(並不打算提供鏈結 )

3樓：

不太確定，或許可以嘗試下layer normalization。

類似的問題在普通MLP中遇到過，後來分析是梯度消失了，用上batch normalization就解決了。batch normalization可以讓梯度更好地傳遞，但是是針對mini batch，不適用於RNN。RNN可以嘗試下layer normalization。

4樓：王贇 Maigo

我記得我上個月的這次調參經歷中，觀察到最初那些失敗的模型呈現出「weight 幾乎不變，bias 越來越大」的現象。不過我並沒有去觀察最終成功的模型 weight 和 bias 是怎樣變化的。

我覺得可以結合你的 loss 或錯誤率的變化情況判斷一下。如果 loss 或錯誤率不下降，或者稍微下降然後停滯或回公升，那很可能是遇到了跟我一樣的問題。建議狠加 gradient clipping，同時把學習率調高幾個數量級。