CNN 網路應該如何設計?

時間 2021-05-11 15:08:29

1樓:霍華德

設原始影象為 維,卷積核尺寸為 ,在沒有padding和stride為1的情況下,輸出尺寸為

在有padding的情況下,padding尺寸為 ,輸出尺寸為:

在有same padding的情況下,我們希望輸出尺寸與輸入尺寸一致,所以

所以我們可以看出,為了使得 取整數,我們需要使用奇數的卷積核尺寸,否則我們可能會面臨非對稱padding的情況,既左邊多一點,或者右邊多一點,這樣是不合理的。

另外乙個重要原因是奇數卷積核尺寸,我們有對稱中心點,中心點左邊和右邊是對稱的,上面和下面是對稱的。而偶數卷積核則沒有這樣的中心點。

2樓:[已重置]

這個問題是困難的,只能靠經驗,理論的結果是困難的,至少等價於在乙個複雜的黎曼空間上尋找一條終點不確定(只有部分資訊)的測地線,問題的描述需要用元學習的框架對網路結構進行優化。簡化的版本是使用ResNet結構(使用小kernel)進行優化找逼近的,然後通過knowledge distillation逐漸簡化系統結構。

用TensorFlow訓練CNN網路時,測試的loss一直不變且測試準確率也很低,這是咋回事?

白色科比 我認為是batch size設定的有問題,或者說這是應該首先考慮的問題,因為你的這個準確率一直在波動,我之前遇見的大部分模型準確率出現了波動都是調整batch size最後成功收斂的, 張帆 提供幾個思路,直覺是你的訓練集太少了,因為就算模型有問題只要引數多overfit就很有可能做到 d...

卷積神經網路(CNN)和迴圈神經網路 RNN 有什麼區別?

不存在的1990 從字面區分 cnn 裡面的 c指 convolutional operation,是一種提取影象特徵方法。把這一operation加入到layer裡面構成了convolutional layer。rnn裡的r 指recurrent,中文是重複的意思。rnn構造的結構也是recurr...

CNN在設計模型時如何高效地整理不同版本的模型結構?

旅行大喵 如果你用的是TensorFlow的話,可以在中間寫一些用於TensorBoard的輸出,然後每個模型放乙個資料夾,然後用TensorBoard來看這些資料夾的損失函式和Precision,AUC ROC等等。另外TensorBoard可以顯示TensorFlow的模型結構,於是順便也把網路...