如何評價 Kaiming He 最新的 Mask R CNN

1樓：

誰說FPN是誰誰誰發明的。。。很早之前有個artist在自己的主頁上用tf做image colorization的時候就用了這個網路結構了。。這個FPN完全就是轉殖人家的結果啊。。

2樓：taokongcn

謝幾位童鞋邀，本身自己是做這個方向的，最近忙著開題的事情，也沒來得及回答。

對於Mask R-CNN其實沒什麼可評價的，在這裡我想說的是當我等小輩還在想著怎麼復現大神的此時工作的時候，大神應該在做更加有意思的work。另外，看起來FPN只是中了poster，我比較好奇今年cvpr在object detection/recognition這個section的oral都做到了什麼水平。

3樓：

抖機靈，前幾天凌晨四點多刷手機看這篇文章放出來，迷迷糊糊看了下摘要就清醒了，又看了下作者，FAIR如雷貫耳的神牛，我就意識到object detection、segmentation沒什麼做頭氣了，摔！為做畢設剛讀完rcnn、sppnet、fastrcnn系列,已被RBG壟斷十年[微笑]

4樓：Shuxin Zheng

Kaiming大神對我打擊最大的，不是Dark Channel去霧，不是Faster R-CNN, 也不是ResNet，不是Mask R-CNN。而是

有一次看到他說他忙裡偷閒就上了個傳說。。。

對於常年低保使用者，感覺到一股真切的智商碾壓。。

5樓：cfzd

Mask-RCNN 的結果在不加任何 trick 的情況下能夠超過各種資料增強加持下的 COCO 2016 分割挑戰的冠軍 FCIS 了，乙個特點就是 Mask-RCNN 的檢測和分割是並行出結果的，而不像以前是分割完了之後再做分類，結果是很 amazing 的。

Mask-RCNN 大體框架還是 Faster-RCNN 的框架，可以說在基礎特徵網路之後又加入了全連線的分割子網，由原來的兩個任務（分類+回歸）變為了三個任務（分類+回歸+分割）

主要改進點在：

1. 基礎網路的增強，ResNeXt-101+FPN的組合可以說是現在特徵學習的王牌了

2. 分割 loss 的改進，由原來的 FCIS 的基於單畫素softmax的多項式交叉熵變為了基於單畫素sigmod二值交叉熵，經 @Oh233同學指正，softmax會產生FCIS的 ROI inside map與ROI outside map的競爭。但文章作者確實寫到了類間的競爭，二值交叉熵會使得每一類的 mask 不相互競爭，而不是和其他類別的 mask 比較。

3. RoIAlign 層的加入，說白了就是對 feature map 的插值，直接的ROIPooling的那種量化操作會使得得到的mask與實際物體位置有乙個微小偏移，個人感覺這個沒什麼 insight，就是工程上更好的實現方式

文章還指出在物體檢測中，Mask-RCNN 比一般的 state-of-the-art 方法（用Fatser-RCNN+ResNet-101+FPN實現）在 bounding-box 的 AP 上高3.6個點，1.1來自ROIAlign，0.

9來自多工訓練，1.6來自更好的基礎網路（ResNeXt-101）

說一點個人愚見，這麼好的效果是由多個階段的優化實現的，大頭的提公升還是由資料和基礎網路的提公升：多工訓練帶來的好處其實可以看作是更多的資料帶來的好處；FPN 的特徵金字塔，ResNeXt更強大的特徵表達能力都是基礎網路

原始碼出來之後才能知道更多的細節~

如何評價 Kaiming He 最新的 Mask R CNN

如何評價lisa最新舞蹈

如何評價 DeepMind 最新成果 Alpha Star 的表現？

如何評價 MSRA 最新的 Deformable Convolutional Networks？

其他用戶還看了：