當前（2023年）機器學習中有哪些研究方向特別的坑？

1樓：eagletcjy

大坑是純無監督學習。深度學習的很多方法（autoEncoder及變種，GCN等）都不如簡單的S3VM好。當然，如果能想辦法把無監督變成弱監督問題（比方說遷移一下其他模型知識）還是有希望的。

次坑是結構化資料上的有監督深度學習。樓上做CV、NLP的比較多，做結構化資料的人比較少。其實在金融行業（AI最具有工業應用價值的方向之一）大部分都是處理得非常好的結構化資料。

在這裡面，任何深度學習模型要超過GBDT這類的整合樹模型都是很難的。見到過兄弟團隊的人花了幾個月，搞出乙個深度模型在AUC上從0.898提公升到0.

899，基本等於沒有效果。也見過一些人為了發文章各種改演算法，但是就是比不過GBDT，最後近乎於耍賴，拿70維特徵的GBDT和100維特徵的深度模型比效果。。。

還有很多小坑，比方說GAN模型在結構化資料領域理論基礎堪憂；self-training在收斂性上沒有保障；所謂的few-shot learning還是需要很大的資料集來喂，都是坑。

2樓：豬鼻蛇

所有同時滿足以下三點的基本都滿足要求

專家和普通人的能力差距巨大

資料需要乙個很複雜/成本很高的收集過程

要求機器學習方法能取代專家而不是普通人

3樓：唐先生2

深度強化學習！

至少在投資組合應用中表現應該還不如時間序列+馬科維茲模型尤其是那個PG演算法，不就是純粹的隨機優化嘛，喂到那一批次的資料就按照哪一批的優化嘛(tensorflow的本質是優化器！！！)

而且，只有在應用場景基本不咋變動的狀態下(比如馬里奧，敵人移動規律不變)才能使用，不過這樣的話，為啥不直接使用規則定義呢？(比如在特定螢幕中取圖，或者特定移動純粹的if else場景定義！)

4樓：

之後我本想來知乎搜尋以下內容「自然語言處理真的這麼雞肋麼」沒想到第一眼就看到這個問題了。

碩士期間導師基本放羊，很榮幸選了自己喜歡的自然語言處理方向，可是畢業後真正從事NLP相關產品的研發，發現NLP的應用真的很雞肋，落地很難！也有很多和我們類似的產品同樣做的很雞肋。

5樓：[已重置]

最大的坑在理論吧，尋找深度學習的數學框架，不是說這個方向和問題不好，問題是沒有產出預期，你也不知道啥時候能一屁崩對了。問題是，要是老也崩不對呢？

6樓：

含淚寫乙個：

用RL做NLP。

NLP的任務可以說是及其不適合用RL來做了：reward難定義而且sparse；action space不清晰，維度高；兩個state之間的跳躍大，等等等等。

有label的監督任務做不過普通的深度學習，沒label的無監督學習卵都學不出來。

這破玩意成功的浪費了我半年多，我乙個搞NLP的學了一大堆DQN DDPG Actor-critc blabla。

我知道錯了，是我蹭RL的熱點了，我沒有堅守我做NLP的本心。

不過有失必有得嘛，儘管科研不順，但我看的是越來越開了嘛。

7樓：

神經科學與智慧型融合

就是扯淡騙經費的東西，已知的跟神經科學結果相似的結果比如卷積，relu之流，都是做出來效果好才往類腦上扯。

要是真要神經科學啟發人工智慧，咱能不能先把生物實驗結果做明白了，再指導人工智慧也不遲。

8樓：

默默說一句，attention感覺也挺沒有理論支援的，也沒有supervision的方法，相當於乙個side product；

9樓：Rhein

壓縮感知/low rank算統計學習吧，和深度學習比起來挺小眾的，用到的地方很少。

目前有做矩陣補全的，能用到影象去噪和推薦系統。

因為矩陣稀疏低秩的性質，通過約束矩陣的秩(rank)，能獲得去噪和補全的效果。但是秩是難以顯式表達的。所以人們用核範數近似矩陣的秩，再約束核範數的值，把它最小化。

核範數最小化的同時，秩也最小化了。由此得到低秩矩陣，就達到了給影象去噪/補全的效果。

這類優化問題有人關注的。但在影象處理/推薦系統中，深度學習的效果遠遠好於稀疏低秩。Low rank的前提算是一種先驗知識。

和深度學習比起來，它有自己的數學基礎，有可解釋性，但不夠work。

它算是一種優化問題，很多人集中注意力在優化上，但每次迭代後出來的結果(PSNR值什麼的)，總是比深度學習粗糙。大概深度學習的泛化能力太好了。

伯克利的馬毅老師在這有很深的積累，也是懂深度學習的人。偏向優化的傳統方法和泛化能力極強的深度學習哪個好，優化和泛化怎麼樣聯絡起來，很好奇他會怎麼說這些問題。

前幾年，這個領域做出來了挺多的成果，現在能做的比較少了，好像比較重要的是非凸優化。但發展的空間，真的比深度學習/強化學習小很多。

一些這方面的學者，有時候說深度學習cheap，沒啥可解釋性。但效果還是深度學習好啊。稀疏低秩的做法，算是把先驗知識加進去了，但是出來的結果很粗糙啊。

拿個範數來近似，近似的過程本身，就把問題的性質改變了。在這基礎上再進行優化得出的結果，確實比不過泛化能力優越的深度學習，畢竟在泛化上，它發揮的作用很少。傳統方法是工質飛船，深度學習是無工質飛船，擺脫掉束縛，能飛的更遠。

每個方法有它自己適用的問題規模。low rank的計算量比深度學習小，用到物聯網端的小物件或者無線感測器上，是可以的。但是各種大公司和企業界的lab也沒見過關注low rank問題的，估計實際應用價值很小吧。

這個方向很多人在解決問題，而深度學習和強化學習中有很多人在發展問題。當沒那麼多新的好問題能被提出來的時候，它可能早已度過了自己的發展期了。

10樓：

為啥沒人說AutoML…很耗計算資源，問題是architecture search有的時候真的不如傳統pretrain-finetune啊…

11樓：路平糜坤良旭

機器學習再坑，畢竟阿法狗把人類打贏了。事實上，看到大家回答裡聊的那些專業細節，那些搞生物的、搞化學的、材料的，根本就不敢進來湊熱鬧。我們ML裡覺得到處是坑的東西，別人拿到醫學影像裡發Cell、發Nature Medicine，玩的不亦樂乎

12樓：

居然沒人提機器學習硬體？如果說其他坑是吐魯番盆地，那這個坑就是馬里亞納海溝。搞各種「ai晶元」的同僚真的不打算出來現身說法一下嗎？

13樓：裴郢珺

強化學習吧，單層的演算法在稍微複雜一點的環境上就歇菜了，除非自己寫micro-action加進動作空間去，被寄予厚望的分層演算法也完全不work（別和我說option那種偽分層），FuN給了我們希望，但完全是調參地獄啊，本渣渣也試圖設計更簡單的通用分層演算法，但依然完全不work，VAE，WGAN-GP，分階段訓練，transition policy gradient，Dpg通通試過改進演算法。

沒有理論上的突破，單層演算法只能在toy的環境裡玩耍（除非作弊用模仿學習（滑稽

14樓：

安全方向啊。

首先資料集就不好弄，標準資料集也相當少。安全企業裡資料多但是老師不會放人去實習的。標註團隊是不可能有標註團隊的，正在考慮爬一波資料之後根據自己的經驗自己標註。

缺伺服器資源也是真的。在安全領域裡用機器學習的感覺怎麼是小眾中的小眾中的小眾。

15樓：GeorgeLee

我覺得機器學習理論吧。

假設多了出來效能差，假設少了出來的看起來不漂亮。

理論深一點審稿人說我這個地方那個地方不太懂，不確定你證明是不是對的，理論淺一點（效能好一點）審稿人說你這不就是那個誰誰誰的簡單擴充套件嗎，沒有novelty。

哦，對了。理論，尤其是傳統機器學習理論還不好找工作（手動微笑）所以說，還是去玄學煉丹吧。理論真的越做心越涼。

16樓：

meta-learning/few shots這些實用性都不咋地。

RL的東西沒有google的之流的計算力，連調參的資格都沒有。實用性也待考。

17樓：

十五年前，這個問題下面的答案，一定是 neural network，reinforcement learning :D

18樓：厄弗斯Orpheus

遷移學習，結合機械人控制的遷移學習。

說遷移學習坑是因為，首先難以定義兩個任務間的相似性，在不了解任務相似性的情況下應用遷移演算法，效果好不好主要看運氣。

至於與機械人控制結合，機械人收集資料本來就費時費力，再搞個遷移學習...嗯，難上加難。

19樓：

沒人說醫療影像分析？尤其是輔助診斷，資料量不僅少而且還保密，想復現太難，一般的領域資料量少你自己可以標，這個領域可不成了。想灌水倒是很嗨，但是幾乎沒人敢用，看看IBM的沃森有多囧吧。

想跟醫生深入合作那就得看醫生是不是也跟你有相同的理想吧，否則有幫你標資料的時間，醫生們更想多救點人(T＿T)

當前（2023年）機器學習中有哪些研究方向特別的坑？

機器學習中有哪些緩解spurious correlation的方法？

機器學習中有哪些方法可以提高穩定性？

2023年9月，有哪些掃地機械人值得推薦？

其他用戶還看了：