AutoML中的超引數優化,除了隨機搜尋,網格搜尋,貝葉斯優化和強化學習四種方案,還有沒有其他的流派?

時間 2021-06-01 13:03:53

1樓:網路人工智慧園地

1、Hyperband:一種基於多臂賭博機(Multi-armed bandit)的超引數優化演算法

將每一種超引數配置看作乙個arm,進而選擇出最優的超引數配置;

採用高效的successive halving技術(Jamieson & Talwalkar, 2016)對每一種超引數配置進行動態資源(如迭代次數)分配

盡可能早地終止表現較差的超引數配置,並為剩下的超引數配置分配更多的資源

Hyperband通過動態資源分配能夠快速過濾掉較差的超引數配置,具有較高的計算效率

2、BOHB:一種結合了貝葉斯優化和Hyperband優點的超引數優化演算法

Hyperband演算法具有較高的計算效率,但是輸入的超引數配置是隨機選擇的

BOHB(Bayesian Optimization + Hyperband)採用基於模型的貝葉斯優化演算法來選擇promising的超引數配置作為Hyperband演算法的輸入

效能優於貝葉斯優化和Hyperband,並具有較高的計算效率

大規模lr訓練中,超引數除了暴力嘗試,是否有更好的優化方法?

用scikit learn裡的random search就行了。可以參考2012年的Random Search for Hyper Parameter Optimization 裡面對比了其他的一些自動調參法包括grid search,low discrepancy序列等等。作者還在文末吐槽說明明有...

python中函式的預設引數和可變長引數如何排列?

孫竟 其實你的問題適合這樣處理 import time deftimeit times 1 def wrap func,args,kwargs start time time clock foriin xrange times func args,kwargs end time time clock...

顯示卡中的引數裡,視訊記憶體 位寬 頻率哪個引數比較重要?

楊帆 顯示卡是乙個小型閉環,配置根據使用需求的不同會出現偏差。比如遊戲,那就得高頻高tdp,核心可以適當的閹割一些換來更高的頻率,視訊記憶體容量也次要些。渲染做電影,那就得大視訊記憶體容量,核心規模越大越適用,頻率反而沒那麼重要。沒錯,就是說的geforce和quadro。具體到產品,每一款晶元的吞...