cnn 輸入一定是224 224嗎?

時間 2021-09-14 09:43:35

1樓:打遮陽傘的boy

不一定,這個只是當時VGG用的224*224當輸入,其實也可以別的尺寸,然後自己計算經過卷積以後尺寸大小,根據尺寸設計合適的卷積核大小及數量。

其實也可以通過翻轉剪輯等增大或者縮小輸入影象的尺寸,要每一層都計算這樣才能確定引數。

2樓:william

不一定,網路結構可以自行調整,一般來說只需要調fc層的in features就行,甚至只需要在最後加乙個adaptive pooling(pytorch有直接實現)就可以實現任何size的輸入,另外也可參考fcn

3樓:卓不凡

沒有這種限制,先說結論,結論如下:輸入一般為你的特徵圖的大小x2的指數次方,具體跟你網路設計有關。

更為一般的說法為:具體大小和你提取特徵所採用的主幹網路以及輸入影象的原始尺寸都有關聯,以以下經典的分類網路為例說明:

1) 從輸入到卷積特徵圖feature map,就是進行資訊抽象提取的過程,然後就經過全連線層/全域性池化層的變換進行分類了,這個feature map的大小,可以是3x3,5x5,7x7等等。

解答1:在這些尺寸中,如果尺寸太小,那麼資訊就丟失太嚴重,如果尺寸太大,資訊的抽象層次不夠高,計算量也更大。這裡選用7x7的大小作為特徵圖的大小。

2) 影象從大解析度降低到小解析度,降低倍數通常是2的指數次方,所以影象的輸入一定是特徵圖大小x2的指數次方。

以ImageNet為代表的大多數分類資料集,影象的長寬在300解析度左右。

解答2:如果我們要找乙個7x2的指數次方,並且在300左右的尺寸作為網路輸入,其中7x2的4次方=7x16=112,7x2的5次方等於7x32=224,7x2的6次方=448,與300最接近的就是224了。

另外,題目中那個叫resize。。。

離域鍵一定是 鍵嗎??

葉雨塵 瀉藥一般來說離域鍵都是 鍵,但是也有 鍵,這種情況出現在超共軛現象 hyperconjugative effect 中。在1935年的時候,Baker和Nathan發現對位取代的溴苄和吡啶反應,甲基取代的化合物反應速率最快,這和正常的烷基給電子序 叔丁基 異丙基 乙基 甲基 不一致。這個後來...

科學一定是正確嗎?

楊先生的楊太太 不一定哦,科學是對人類已了解得客觀世界做的規律性總結,而這個隨著世界的改變或者科技的進步可能會被修正或是否定,所以它是一種特定情形下的正確。 宗教和鬼神當然不是無稽之談,科學對宗教鬼神領域的研究還有很多未知,最多只是對外在的物質世界有一定的研究,對社會發展有一定的研究,別的還有很多未...

物質一定是離散的嗎

不禿怎麼變強 純哲學領域,同乙個概念在不同的人,不同的語境之下都會有不同的內涵和外延,需要你自己去把握。個人認為你可以自己去發掘,可以從萊布尼茨的 單子論 和斯賓諾莎的 實體說 去找尋什麼是連續,什麼是離散。 萬里一孤人 一定如果物質不離散,所有電子必須被壓縮到k層內,根據泡利不相容原理,這是不可能...