你所在研究領域(ML CV NLP等AI子領域)在解決什麼問題,最新進展是什麼,有哪些重要文章?

時間 2021-05-07 02:00:16

1樓:

把深度學習和檢索編碼索引結合。

我導師的說法,深度學習和識別分類結合已經爛大街了。檢索至今沒看到有特別好的,大多都是直接抽取cnn的特徵套傳統方法,這幾年無非也就是triplet loss,contrastive loss之類的distance learning特別火,但是對於資料的處理方面太耗時間,效果也不見的很好。深度特徵自身的問題,也導致了索引結構很不好做,更常見的是深度雜湊用於加速。

需要往深度索引結構裡面好好挖一下特徵的本質

2樓:

半入門的來試答一下.

想象乙個遊戲裝置:

比如在乙個屋子裡,你有一把槍(攝像機)和乙個顯示裝置.它可以實時或者非常低延遲地定位攝像機的位置和攝像機姿態.

同時還能構建稠密地圖資訊.也就是系統能知道那裡有一塊牆,知道牆的位置.

然後把攝像機畫面和遊戲動畫實時渲染到顯示裝置.那麼現在你就能和小夥伴一起像真人CS那樣玩槍戰了.與真人CS不同,由於槍和子彈是渲染出來的.

畫面可以更酷炫,更震撼,還能換槍換裝備等輔以更多虛擬資訊.

我想這就是CV的乙個領域--SLAM的終極目標了.也就是像hololens的宣傳片那樣.

快速實時的精確計算位置和姿態.

我只了解PTAM,PTAM用基於稀疏點的視覺跟蹤和姿態估計,一幀能在20ms內計算完乙個新姿態和位置.但是還需要後續更多幀優化姿態才能穩定準確.精度不夠,而且還只能小範圍跟蹤.

不過貌似hololens已經做到了.應該是在姿態估計的時候加入了紅外的景深資訊.

實時的稠密地圖重建

當乙個玩家突然出現在畫面內,我們需要馬上重建出來,感知他的位置,大小.這就幾乎不可能了.

PTAM的地圖重建是稀疏點的.但就是這樣也不能實時,得延遲3 4 秒這樣才能把新關鍵幀出現的點重建出來.

不知hololens以後要怎麼弄.我所知道去年出現了些像Dense Planar SLAM這樣的辦法.只重建一些簡單的幾何平面.

當然個人YY一下,要實現以上遊戲效果還有更多折衷辦法,比如弄個雲端.把玩家們的位置資訊都上傳上去,這樣好歹有位置資訊可以用了.

至於slam的發展不說了..知乎搜一下也看得到就是ptam dtam visualslam orbslam 等等.

你所在的研究領域裡,有哪些工作的結果雖然不是造假,但是是精挑細選出來的

Dennis LIU 積體電路研究,特別是模擬積體電路。如果要展示實物測量結果的話,很多時候都得精挑細選。一般都會選一片測量結果最好的實物。但是出發點實在不是灌水,而是因為晶元製造的過程中變數太大了。如果真正拿去生產了,還是要考慮怎麼讓晶元的產量和效能穩定。 NIPS,嘿嘿,從理論部分就搞笑得像小學...

你所在的科研領域裡有江湖嗎?

可能有吧,許久之前看過乙個控制領域的江湖貼子,裡面說的頭頭是道,不排除陰謀論,具體貼子名字忘了,背景好像是控制領域知名人士王飛躍第一次落選院士那時候。 笨笨熊 肯定有啊。接觸多了發現領域內的大牛之間都有千絲萬縷的聯絡。比如我二導是大導的學生,二導和某美國院士A以前同在另乙個泰斗級院士B手下做過博后,...

你所在的物理學領域有哪些黑話?

Legend Hydrophobicity 疏水性 這個概念似乎很容易理解,比如生活中的例子荷葉不沾水,油不溶於水。然而,在微觀尺度,情況並不樂觀。這個詞涉及的空間尺度從幾個angstrom 水分子的尺度大小 到幾個nm 再到macromolecule或其aggregates,protein fol...