2023年,計算機視覺領域會有哪些新的研究方向值得提前探索?

時間 2021-05-05 23:16:49

1樓:Julian

掃了一圈看到有人答Federated Learning(FL), 那我接著這個話題往下說說Split Learning(SL).

1. Split Learning的主要動機的什麼?

2.什麼是Split Learning?(框架圖和演算法圖)3. SL與FL以及其他相似演算法的區別是什麼?

4. 效能怎麼樣?

如果要跟這個topic的話,建議可以跟MIT的專案:

pdf答得比較粗淺,後期會修改。。。

2樓:嬉嬉皮

個人認為是弱監督半監督無監督自監督這種一定程度上緩解資料量需求的領域,以及圖神經網路一類可以處理非網格化資料的領域。

應用領域的話,自動駕駛相關,畢竟還有相當長的路要走。

3樓:神燈阿森

個人覺得,2020-2023年,可能並不需要太多的新方向,樓上一些博主已經給出了很好的答案。把已有的方向做一些落地,做一些有創業的事

,可能作用會更大,以國外一些大學為例,目前可能更傾向於做一些落地的事情,比如機械人自動導航等等,畢竟圖靈最初的人工智慧設想還沒實現。目標檢測,影象分類目前也就在人臉識別和醫學CT識別中效果不錯,工業上反饋如何我們不得而知,所以造成了大家的擔憂。工業界也就沒多少動力要人投入計算機視覺。

4樓:崔迪瀟

三維場景感知\重建,3d scene perception/reconstruction,以及基於視覺延拓出來的多模態融合的3d感知。KITTI上depth prediction/completion是近些年才新增的item,作為資料層的研究內容,其本質上也是為後面的3d感知服務的,趨勢可見。

傳統的2d影象感知通常不直接與運動物件和控制物件發生關係,也對安全要求很低;當視覺感知技術開始和物理空間的控制物件直接相關後,3d下的感知和場景重建必須重視和解決。

我個人在招聘中對這個方面很重視,射影幾何、變換、攝像機模型、多檢視幾何等是我常問的問題,但具備這方面知識和經驗的候選人比例不高。希望通過未來幾年的探索,可以提公升我們對這個問題的重視和認識。

2023年了,再談2d的目標感知,已經是耍流氓了。

5樓:

說乙個我自己的方向吧,模型壓縮領域一直存在的問題是「試一下」,壓縮出來的小模型總要fine-tune或者re-train。其次,子領域的剪枝方向,是以縮小模型容量為代價的,是否可以不縮小容量而剪枝呢?

這是最近的一些思考

6樓:Guosheng Hu

不是新方向,但2020仍然值得繼續深入探索。

automl(HPO,高效的nas,auto data augmentation)

網路prediction的不確定性/可解釋性/公平性網路泛化性(對抗攻擊)

7樓:小銘同學

automl

vision + language

transfer learning (domain adaptation, zeroshot, fewshot etc.)

8樓:幼清

不從任務角度而從原理角度方向來想的話,我覺得可能有這幾個:

residual connection. Residual connection still leads the development of DL.

attention mechanism. Channel-wise attention(SENet), Spatial attention (Spatial Transformer), Channel + spatial (BAM, CBAM, AANet), Kernel attention (SKNet)

multi-path.

Updated Nov/18

Local Relationship. 就像去年的Non-Local,這個應該在明年ECCV 2020等會上有很多的拓展。

parameter-free attention. 從NLP上三篇說attention不是重要性的問題上, 從CV上好幾篇就是類似無參的attention。 不知道明年會不會還流行。

19年我看到好多篇。

上面兩個是我自己準備做的兩個工作,準備明年的會。我覺得可以試試。

9樓:

個人感覺視覺和語言的聯合還是很有前途的,雖然說目前坑比較多,但是萬一那一天有了突破就是飛速的發展。

他還舉了個例子,一團煙霧的行為可以用公式描述,但是一顆樹的生長行為是由溫度、光照、水、氣候等等許多複雜的因素在很長時間內連續變化所影響的,那麼它就是沒辦法簡單地解釋的。

舉的這個例子並不恰當,反而恰恰說明了神經網路模型解釋性的迫切性。一棵樹生長的影響因素雖然說是有很多,但是至少我們明確知道控制變數條件下,恰當的溫度、恰當的水分等條件可以明確引導樹向生長較好的方向生長。

然後對於乙個神經網路模型而言,無論是哪個任務,我們都很難說控制只控制某一種因素就可以往預期的方向發展。

如何評價2023年計算機視覺頂會CVPR投稿量破萬的現象?

弗拉基公尺爾 哈哈哈,LSTM投稿法也同樣試用呀 遺忘門,遺忘之前的水文 重置門更新門,重置更新上屆小修文章.本屆文章在作為這一屆的輸入. JunMa 以分割為例,今年的ICCV在月初剛剛落下帷幕,回看一下10年前的ICCV 2009是怎麼做分割的。這篇文章是Pock,Cremers等人發在ICCV...

2023年,計算機視覺領域,你推薦哪些綜述性的文章?

Lizard 瀉藥關於RGBD reconstruction有一篇綜述,介紹了截止至2017年相關工作 2018年的只有一小部分被涵蓋進去 State of the Art on 3D Reconstruction with RGB D Cameras Dave Zheng Point Cloud ...

2020 年,投身計算機視覺是否明智?

Wusdream 如果是因為演算法崗較高的薪水,那不太建議來,因為演算法崗已經很捲了,付出回報不成正比,同樣的努力開發早就去網際網路大廠了。拿演算法預研來說,如果你沒有在演算法精度上做出提公升,每個季度考核一定會非常焦慮,CV預研在工作中的大部分任務都是對訓練資料的處理。比如,真實資料容易過擬合,就...