當前(2023年)機器學習中有哪些研究方向特別的坑?

時間 2021-05-06 05:38:26

1樓:eagletcjy

大坑是純無監督學習。深度學習的很多方法(autoEncoder及變種,GCN等)都不如簡單的S3VM好。當然,如果能想辦法把無監督變成弱監督問題(比方說遷移一下其他模型知識)還是有希望的。

次坑是結構化資料上的有監督深度學習。樓上做CV、NLP的比較多,做結構化資料的人比較少。其實在金融行業(AI最具有工業應用價值的方向之一)大部分都是處理得非常好的結構化資料。

在這裡面,任何深度學習模型要超過GBDT這類的整合樹模型都是很難的。見到過兄弟團隊的人花了幾個月,搞出乙個深度模型在AUC上從0.898提公升到0.

899,基本等於沒有效果。也見過一些人為了發文章各種改演算法,但是就是比不過GBDT,最後近乎於耍賴,拿70維特徵的GBDT和100維特徵的深度模型比效果。。。

還有很多小坑, 比方說GAN模型在結構化資料領域理論基礎堪憂;self-training在收斂性上沒有保障;所謂的few-shot learning還是需要很大的資料集來喂,都是坑。

2樓:豬鼻蛇

所有同時滿足以下三點的基本都滿足要求

專家和普通人的能力差距巨大

資料需要乙個很複雜/成本很高的收集過程

要求機器學習方法能取代專家而不是普通人

3樓:唐先生2

深度強化學習!

至少在投資組合應用中表現應該還不如時間序列+馬科維茲模型尤其是那個PG演算法,不就是純粹的隨機優化嘛,喂到那一批次的資料就按照哪一批的優化嘛(tensorflow的本質是優化器!!!)

而且,只有在應用場景基本不咋變動的狀態下(比如馬里奧,敵人移動規律不變)才能使用,不過這樣的話,為啥不直接使用規則定義呢?(比如在特定螢幕中取圖,或者特定移動純粹的if else場景定義!)

4樓:

之後我本想來知乎搜尋以下內容「自然語言處理真的這麼雞肋麼」沒想到第一眼就看到這個問題了。

碩士期間導師基本放羊,很榮幸選了自己喜歡的自然語言處理方向,可是畢業後真正從事NLP相關產品的研發,發現NLP的應用真的很雞肋,落地很難!也有很多和我們類似的產品同樣做的很雞肋。

5樓:[已重置]

最大的坑在理論吧,尋找深度學習的數學框架,不是說這個方向和問題不好,問題是沒有產出預期,你也不知道啥時候能一屁崩對了。問題是,要是老也崩不對呢?

6樓:

含淚寫乙個:

用RL做NLP。

NLP的任務可以說是及其不適合用RL來做了:reward難定義而且sparse;action space不清晰,維度高;兩個state之間的跳躍大,等等等等。

有label的監督任務做不過普通的深度學習,沒label的無監督學習卵都學不出來。

這破玩意成功的浪費了我半年多,我乙個搞NLP的學了一大堆DQN DDPG Actor-critc blabla。

我知道錯了,是我蹭RL的熱點了,我沒有堅守我做NLP的本心。

不過有失必有得嘛,儘管科研不順,但我看的是越來越開了嘛。

7樓:

神經科學與智慧型融合

就是扯淡騙經費的東西,已知的跟神經科學結果相似的結果比如卷積,relu之流,都是做出來效果好才往類腦上扯。

要是真要神經科學啟發人工智慧,咱能不能先把生物實驗結果做明白了,再指導人工智慧也不遲。

8樓:

默默說一句,attention感覺也挺沒有理論支援的,也沒有supervision的方法,相當於乙個side product;

9樓:Rhein

壓縮感知/low rank算統計學習吧,和深度學習比起來挺小眾的,用到的地方很少。

目前有做矩陣補全的,能用到影象去噪和推薦系統。

因為矩陣稀疏低秩的性質,通過約束矩陣的秩(rank),能獲得去噪和補全的效果。但是秩是難以顯式表達的。所以人們用核範數近似矩陣的秩,再約束核範數的值,把它最小化。

核範數最小化的同時,秩也最小化了。由此得到低秩矩陣,就達到了給影象去噪/補全的效果。

這類優化問題有人關注的。但在影象處理/推薦系統中,深度學習的效果遠遠好於稀疏低秩。Low rank的前提算是一種先驗知識。

和深度學習比起來,它有自己的數學基礎,有可解釋性,但不夠work。

它算是一種優化問題,很多人集中注意力在優化上,但每次迭代後出來的結果(PSNR值什麼的),總是比深度學習粗糙。大概深度學習的泛化能力太好了。

伯克利的馬毅老師在這有很深的積累,也是懂深度學習的人。偏向優化的傳統方法和泛化能力極強的深度學習哪個好,優化和泛化怎麼樣聯絡起來,很好奇他會怎麼說這些問題。

前幾年,這個領域做出來了挺多的成果,現在能做的比較少了,好像比較重要的是非凸優化。但發展的空間,真的比深度學習/強化學習小很多。

一些這方面的學者,有時候說深度學習cheap,沒啥可解釋性。但效果還是深度學習好啊。稀疏低秩的做法,算是把先驗知識加進去了,但是出來的結果很粗糙啊。

拿個範數來近似,近似的過程本身,就把問題的性質改變了。在這基礎上再進行優化得出的結果,確實比不過泛化能力優越的深度學習,畢竟在泛化上,它發揮的作用很少。傳統方法是工質飛船,深度學習是無工質飛船,擺脫掉束縛,能飛的更遠。

每個方法有它自己適用的問題規模。low rank的計算量比深度學習小,用到物聯網端的小物件或者無線感測器上,是可以的。但是各種大公司和企業界的lab也沒見過關注low rank問題的,估計實際應用價值很小吧。

這個方向很多人在解決問題,而深度學習和強化學習中有很多人在發展問題。當沒那麼多新的好問題能被提出來的時候,它可能早已度過了自己的發展期了。

10樓:

為啥沒人說AutoML…很耗計算資源,問題是architecture search有的時候真的不如傳統pretrain-finetune啊…

11樓:路平糜坤良旭

機器學習再坑,畢竟阿法狗把人類打贏了。事實上,看到大家回答裡聊的那些專業細節,那些搞生物的、搞化學的、材料的,根本就不敢進來湊熱鬧。我們ML裡覺得到處是坑的東西,別人拿到醫學影像裡發Cell、發Nature Medicine,玩的不亦樂乎

12樓:

居然沒人提機器學習硬體?如果說其他坑是吐魯番盆地,那這個坑就是馬里亞納海溝。搞各種「ai晶元」的同僚真的不打算出來現身說法一下嗎?

13樓:裴郢珺

強化學習吧,單層的演算法在稍微複雜一點的環境上就歇菜了,除非自己寫micro-action加進動作空間去,被寄予厚望的分層演算法也完全不work(別和我說option那種偽分層),FuN給了我們希望,但完全是調參地獄啊,本渣渣也試圖設計更簡單的通用分層演算法,但依然完全不work,VAE,WGAN-GP,分階段訓練,transition policy gradient,Dpg通通試過改進演算法。

沒有理論上的突破,單層演算法只能在toy的環境裡玩耍(除非作弊用模仿學習(滑稽

14樓:

安全方向啊。

首先資料集就不好弄,標準資料集也相當少。安全企業裡資料多但是老師不會放人去實習的。標註團隊是不可能有標註團隊的,正在考慮爬一波資料之後根據自己的經驗自己標註。

缺伺服器資源也是真的。在安全領域裡用機器學習的感覺怎麼是小眾中的小眾中的小眾。

15樓:GeorgeLee

我覺得機器學習理論吧。

假設多了出來效能差,假設少了出來的看起來不漂亮。

理論深一點審稿人說我這個地方那個地方不太懂,不確定你證明是不是對的,理論淺一點(效能好一點)審稿人說你這不就是那個誰誰誰的簡單擴充套件嗎,沒有novelty。

哦,對了。理論,尤其是傳統機器學習理論還不好找工作(手動微笑)所以說,還是去玄學煉丹吧。理論真的越做心越涼。

16樓:

meta-learning/few shots這些實用性都不咋地。

RL的東西沒有google的之流的計算力,連調參的資格都沒有。實用性也待考。

17樓:

十五年前,這個問題下面的答案,一定是 neural network,reinforcement learning :D

18樓:厄弗斯Orpheus

遷移學習,結合機械人控制的遷移學習。

說遷移學習坑是因為,首先難以定義兩個任務間的相似性,在不了解任務相似性的情況下應用遷移演算法,效果好不好主要看運氣。

至於與機械人控制結合,機械人收集資料本來就費時費力,再搞個遷移學習...嗯,難上加難。

19樓:

沒人說醫療影像分析?尤其是輔助診斷,資料量不僅少而且還保密,想復現太難,一般的領域資料量少你自己可以標,這個領域可不成了。想灌水倒是很嗨,但是幾乎沒人敢用,看看IBM的沃森有多囧吧。

想跟醫生深入合作那就得看醫生是不是也跟你有相同的理想吧,否則有幫你標資料的時間,醫生們更想多救點人(T_T)

機器學習中有哪些緩解spurious correlation的方法?

我覺得現有的probability框架下無法緩解,你所謂的spurious是自己主觀認為的,在probability裡都是相關性,沒有任何區別,要緩解你就需要explicitly告訴model那種是spurious的,比如引入causal model OwlLite 當今機器學習 特別地,深度學習 ...

機器學習中有哪些方法可以提高穩定性?

簡單說幾個吧 1 增加資料,在我看來這是最有效的方法。但是現實中並不一定可行。2 選擇更robust的模型,比如random forest等。3 增加regularization,很可能模型複雜度過高,捕捉到了過多的噪音。4 對資料處理,比如PCA降噪,data augmentation增加魯棒性。...

2023年9月,有哪些掃地機械人值得推薦?

皇家馬伕人 要想買的合適的掃地機械人,首先你要確定好規格,比如你家多大?你的預算多少?什麼人使用?老人或是自己用?首先你如果是面積在60 80平左右的你可以選價位在1500左右的就可以,而且如果你家場地內沒有什麼障礙物,你就可以選擇科沃斯 ECOVACS T5 Neo和T5fun如果預算可以也可以直...