你所在研究領域（ML CV NLP等AI子領域）在解決什麼問題，最新進展是什麼，有哪些重要文章？

1樓：

把深度學習和檢索編碼索引結合。

我導師的說法，深度學習和識別分類結合已經爛大街了。檢索至今沒看到有特別好的，大多都是直接抽取cnn的特徵套傳統方法，這幾年無非也就是triplet loss，contrastive loss之類的distance learning特別火，但是對於資料的處理方面太耗時間，效果也不見的很好。深度特徵自身的問題，也導致了索引結構很不好做，更常見的是深度雜湊用於加速。

需要往深度索引結構裡面好好挖一下特徵的本質

2樓：

半入門的來試答一下.

想象乙個遊戲裝置:

比如在乙個屋子裡,你有一把槍(攝像機)和乙個顯示裝置.它可以實時或者非常低延遲地定位攝像機的位置和攝像機姿態.

同時還能構建稠密地圖資訊.也就是系統能知道那裡有一塊牆,知道牆的位置.

然後把攝像機畫面和遊戲動畫實時渲染到顯示裝置.那麼現在你就能和小夥伴一起像真人CS那樣玩槍戰了.與真人CS不同,由於槍和子彈是渲染出來的.

畫面可以更酷炫,更震撼,還能換槍換裝備等輔以更多虛擬資訊.

我想這就是CV的乙個領域--SLAM的終極目標了.也就是像hololens的宣傳片那樣.

快速實時的精確計算位置和姿態.

我只了解PTAM,PTAM用基於稀疏點的視覺跟蹤和姿態估計,一幀能在20ms內計算完乙個新姿態和位置.但是還需要後續更多幀優化姿態才能穩定準確.精度不夠,而且還只能小範圍跟蹤.

不過貌似hololens已經做到了.應該是在姿態估計的時候加入了紅外的景深資訊.

實時的稠密地圖重建

當乙個玩家突然出現在畫面內,我們需要馬上重建出來,感知他的位置,大小.這就幾乎不可能了.

PTAM的地圖重建是稀疏點的.但就是這樣也不能實時,得延遲3 4 秒這樣才能把新關鍵幀出現的點重建出來.

不知hololens以後要怎麼弄.我所知道去年出現了些像Dense Planar SLAM這樣的辦法.只重建一些簡單的幾何平面.

當然個人YY一下,要實現以上遊戲效果還有更多折衷辦法,比如弄個雲端.把玩家們的位置資訊都上傳上去,這樣好歹有位置資訊可以用了.

至於slam的發展不說了..知乎搜一下也看得到就是ptam dtam visualslam orbslam 等等.

你所在的研究領域裡，有哪些工作的結果雖然不是造假，但是是精挑細選出來的

Dennis LIU 積體電路研究，特別是模擬積體電路。如果要展示實物測量結果的話，很多時候都得精挑細選。一般都會選一片測量結果最好的實物。但是出發點實在不是灌水，而是因為晶元製造的過程中變數太大了。如果真正拿去生產了，還是要考慮怎麼讓晶元的產量和效能穩定。 NIPS，嘿嘿，從理論部分就搞笑得像小學...

你所在的科研領域裡有江湖嗎？

可能有吧，許久之前看過乙個控制領域的江湖貼子，裡面說的頭頭是道，不排除陰謀論，具體貼子名字忘了，背景好像是控制領域知名人士王飛躍第一次落選院士那時候。笨笨熊肯定有啊。接觸多了發現領域內的大牛之間都有千絲萬縷的聯絡。比如我二導是大導的學生，二導和某美國院士A以前同在另乙個泰斗級院士B手下做過博后，...

你所在的物理學領域有哪些黑話？

Legend Hydrophobicity 疏水性這個概念似乎很容易理解，比如生活中的例子荷葉不沾水，油不溶於水。然而，在微觀尺度，情況並不樂觀。這個詞涉及的空間尺度從幾個angstrom 水分子的尺度大小到幾個nm 再到macromolecule或其aggregates，protein fol...

你所在研究領域（ML CV NLP等AI子領域）在解決什麼問題，最新進展是什麼，有哪些重要文章？

你所在的研究領域裡，有哪些工作的結果雖然不是造假，但是是精挑細選出來的

你所在的科研領域裡有江湖嗎？

你所在的物理學領域有哪些黑話？

其他用戶還看了：