深度學習或強化學習在組合優化方面有哪些應用？

1樓：苦中作樂tttt

其實很多基本組合問題用trick加很好的heuristic,可以優化很好了。當然實際應用中的組合優化問題，可能結構或者限制更複雜，許多漂亮的trick用不了或者對數學要求太高了。退而求其次，如果想稍微通用或者懶一點，可以考慮上神經網路。

整數優化求解器的樹搜尋模組，比較重要的是primal heuristic，即給每乙個node提供乙個盡量好的可行解。這個地方我覺得機器學習可能有用武之地，前提演算法得有泛化能力。

個人覺得問題在於：組合優化很多都有指數增長的圖結構，如果用深度學習在乙個資料集上擬合得很好，其實沒什麼意義。假設根據壓縮感知理論，神經網路可以學習低維的特徵結構。

實際中的高維的線性規劃投影到低維後可行解和最優解，變化有多少？如果差別很大，從壓縮感知角度看，就沒啥意義了。

最近看到乙個非常全面列出深度學習在組合優化中應用的課程：

Deep Learning in Discrete Optimization

2樓：raningtkyH

[1706.07450] A Note on Learning Algorithms for Quadratic Assignment with Graph Neural Networks 有介紹用graph neural network解TSP。

深度強化學習與深度學習的的區別是啥？

Warren 深度學習做的是智慧型感知通俗來講就是條件反射屬於連線主義學派，優化目標大多連續函式對應連續優化和隨機優化強化學習做的智慧型決策，屬於行為主義學派，優化目標是離散函式對應組合優化深度強化學習就是做組合優化太讓人頭禿了，乾脆直接假設個模型去擬合，能有個近似最優也不錯，於是又回歸...

請問大家對深度強化學習中的Data Efficiency有什麼獨到理解或者提公升建議？

關於RL中的sample efficiency問題，Shane Gu過去幾年做了很多相關工作。這是去年他的乙個talk Deep Reinforcement Learning for Robotics Frontiers and Beyond 中的一頁slides，我覺得解釋得比較清楚。白色區域是對...

深度強化學習為什麼在實際當中用的比較少？

rxlqn 1 資料量少，取樣到的資料非平穩並且含有雜訊2 系統延時 3 state和action 空間維度過高4 現實環境約束導致不能有過於aggressive的探索策略5 實際應用建立的強化學習模型往往需要較高的時間和經濟成本參考An empirical investigation of the...

深度學習或強化學習在組合優化方面有哪些應用？

深度強化學習與深度學習的的區別是啥？

請問大家對深度強化學習中的Data Efficiency有什麼獨到理解或者提公升建議？

深度強化學習為什麼在實際當中用的比較少 ？

其他用戶還看了：

深度強化學習為什麼在實際當中用的比較少？