如何評價 Face 曠視科技最新出品的檢測專用 backbone 網路 DetNet ?

時間 2021-05-05 19:57:42

1樓:過若干

嘗試復現detnet,證明detnet59效果比fpn_resnet101還要好。face++確實有一套 https://

2樓:

本文的motivation是想訓練乙個更好的適合detection任務的backbone。現有網路不好的原因很簡單,也就是spatial resolution的不足,以及在FPN網路中額外加入的stage沒有pretrain。所以做法就是對Resnet C4之後的網路加入Dilation,但是很奇怪的是C4 C5 C6的dilation都是固定的2,而不是像正常加入dilation conv那樣加入2 4 8逐漸擴大receptive field。

其他幾個問題包括:

在不同stage之間,原來resnet是因為spatial resolution變化了沒法直接sum了,所以引入了乙個projection conv來降維,但是在這裡同樣解析度還需要這樣乙個projection conv,而且實驗中確實這樣的結果會更好,沒有合理解釋。作者只是claim這樣可以引入乙個新的stage。

雖然作者在文章中一開始就diss FPN,但是作者在實驗中還是用了FPN,但是由於P4 P5 P6的解析度是一樣的,現在怎麼assign這個anchor呢?

實驗中缺乏了嚴重motivation最最重要的乙個實驗,也就是ResNet50(+dilation)和Detnet59不加FPN的比較。因為FPN很大程度上解決了解析度不足這個問題。

雖然在最終實驗中結果都得到了提公升,但是很多問題都沒有解釋清楚,很難認為是乙個solid的工作。

3樓:

我蠻建議arxiv匿名的,不過看樣子去年的light head rcnn好像也沒中,可能big name影響力沒有那麼大

4樓:

我就想知道孫劍老師投出去之前看沒有看過這篇文章,這種水文掛名不怕丟他的面子麼?

detection裡面這種套路還少麼,常見的有兩種,一種是降低downsample次數,例如將vgg16的conv4和conv5之間的pooling去掉,我見過好幾篇做行人檢測的文章就是這麼幹的。還有另外一種套路,就是atrous convolution,參見林倞老師eccv16的行人檢測。

補充一句,圈子浮躁可以理解,畢竟大家都要畢業都要賺錢,但是乙個灌水的東西,往天上吹就過分了。

5樓:萊恩哈特

看到有人說這是水文,感覺是有些低估了這篇文章的質量。

效果且不論,認知上還是非常有啟發意義。用預訓練過的影象分類網路作為物體檢測的特徵提取器是從R-CNN時代就留下的「常規做法」。甚至再往前追溯,這也是影象分類任務中大家的常規做法。

在影象分類任務中,沒幾個人能解釋清楚為什麼預訓練過的網路遷移到新的任務上分類效果會更好,更沒有人能解釋清楚為什麼這種做法放到物體檢測任務中依然有效。作者對這種大家都在用著卻無法解釋的常規作法率先提出質疑並給出自己的改良方案,這難道不是認知上的打破常規嗎?

雖然從設計上看,DetNet並不是那麼驚豔。但它能夠作為通用框架比較容易地無縫銜接到幾乎所有的熱門物體檢測方案中(R-CNN 系、SSD、YOLO系、FocalLoss)中,對於重視軟體工程原則的工業界來說是非常重要的。

6樓:蘇正航

昨天大概掃了一遍,這篇文章感覺有點deeplab segmentation 一些技術的味道,從整體縮放32倍的分類支幹改成縮放16倍來增大做detection的feature maps(tradeoff,如果移動端用怎麼把握計算量也是個問題)。為了增大感受野,也加入了dilation。這些點子在實驗中也嘗試過,但是加了dilation我的實驗裡面是差了。。。

你為什麼加入 Face 曠視科技?

codeworm96 感覺現在回答的都是 research 的人.作為剛入職不煉丹的 brain 平台實習生分享一下自己的答案。1.大四沒啥事情.找事情做 2.面試時 team leader 說有 infra 輪子可以造3.有一些認識的人在 face 0.pingcap 不要我 杜佳慧 可以陪98年...

在 Face 曠視科技實習是一種怎樣的體驗?

曠視 秋招offer提前實習被告知工作不利被主動解約三方 職業發展 牛客網 體驗就是,破天荒的實習被裁。附Offer letter 樓主實名發聲的 木木仙森 某天,我跟mentor說我佔了40張卡。回 40張太少了。太少了。少了。了。趕上疫情在家鹹魚,mentor衝鋒在前,每天做完把實驗結論和進展講...

如何看待曠視科技新產品監視學生上課?

冬己 我覺得監視學生上課也是有不對的地方,因為我覺得這樣也算侵犯了人的隱私吧!感覺學生就是在監視的下學習,我覺得那樣很沒有安全感 剝削階級總是構造出一種無法調動被剝削者積極性的體系,而後又揮舞自己的大棒來迫使被剝削階級按照他們劃定的模板來塑造成某種可以利用的人力資源。譬如大英帝國的布林喬亞們用 新濟...