擬牛頓法和牛頓法有啥區別？

1樓：

牛頓法這個式子是由將f(x)在處進行二階泰勒展開然後令處導數為零得到的，牛頓法的iteration complexity是 ,但問題在於牛頓法每一步迭代所需的開銷太大，即其每一步都需要求Hessian矩陣並對其求逆，其中對矩陣求逆已經需要的時間複雜度了。

擬牛頓法

擬牛頓法就是為解決上面的執行時間太長的問題而產生的，其直接近似Hessian矩陣的逆，具體方法有很多，比較常用的有BFGS方法(以Broyden,Fletcher,Goldfarb,Shanno四位科學家的首字母命名),L-BFGS（Limited memory BFGS)等等。如何判斷Hessian矩陣近似地好不好呢？乙個常用的criterion是gradient matching,具體來說,設為在的二次泰勒展開(其中Hessian矩陣用近似的代替。

那麼乙個很自然的想法就是我讓這兩個函式在和處一階導相等來約束的近似的質量。

擬牛頓法和牛頓法有啥區別？

為什麼深度學習不使用牛頓法或擬牛頓法優化？

多元函式的牛頓迭代和高斯牛頓法怎麼推導？

計算器牛頓法能用來做什麼？

其他用戶還看了：