深度學習或強化學習在組合優化方面有哪些應用?

時間 2021-05-06 21:09:07

1樓:苦中作樂tttt

其實很多基本組合問題用trick加很好的heuristic,可以優化很好了。當然實際應用中的組合優化問題,可能結構或者限制更複雜,許多漂亮的trick用不了或者對數學要求太高了。退而求其次,如果想稍微通用或者懶一點,可以考慮上神經網路。

整數優化求解器的樹搜尋模組,比較重要的是primal heuristic,即給每乙個node提供乙個盡量好的可行解。這個地方我覺得機器學習可能有用武之地,前提演算法得有泛化能力。

個人覺得問題在於:組合優化很多都有指數增長的圖結構,如果用深度學習在乙個資料集上擬合得很好,其實沒什麼意義。假設根據壓縮感知理論,神經網路可以學習低維的特徵結構。

實際中的高維的線性規劃投影到低維後可行解和最優解,變化有多少?如果差別很大,從壓縮感知角度看,就沒啥意義了。

最近看到乙個非常全面列出深度學習在組合優化中應用的課程:

Deep Learning in Discrete Optimization

2樓:raningtkyH

[1706.07450] A Note on Learning Algorithms for Quadratic Assignment with Graph Neural Networks 有介紹用graph neural network解TSP。

深度強化學習與深度學習的的區別是啥?

Warren 深度學習做的是智慧型感知 通俗來講就是條件反射 屬於連線主義學派,優化目標大多連續函式 對應連續優化和隨機優化 強化學習做的智慧型決策,屬於行為主義學派,優化目標是離散函式 對應組合優化 深度強化學習就是做組合優化太讓人頭禿了,乾脆直接假設個模型去擬合,能有個近似最優也不錯,於是又回歸...

請問大家對深度強化學習中的Data Efficiency有什麼獨到理解或者提公升建議?

關於RL中的sample efficiency問題,Shane Gu過去幾年做了很多相關工作。這是去年他的乙個talk Deep Reinforcement Learning for Robotics Frontiers and Beyond 中的一頁slides,我覺得解釋得比較清楚。白色區域是對...

深度強化學習為什麼在實際當中用的比較少 ?

rxlqn 1 資料量少,取樣到的資料非平穩並且含有雜訊2 系統延時 3 state和action 空間維度過高4 現實環境約束導致不能有過於aggressive的探索策略5 實際應用建立的強化學習模型往往需要較高的時間和經濟成本參考An empirical investigation of the...