LeCun 說的可微分程式設計是什麼？

1樓：MindHiking

就是在微分的基礎上新增更多的「程式設計」的元素。用於控制網路的前饋過程、反饋過程，控制資料的餵給過程，控制多個網路之間的協調過程。

簡而言之，是將大型專案的中高層次由人類構建，中低層次由網路從資料中學習。將學習好的神經網路直接作為函式呼叫。

pytorch只是乙個自動求導的工具，動態圖計算框架。沒有它不過就是麻煩了點。

2樓：Wheeler

以前我們程式設計的時候，需要在乙個函式裡定義變數a,b,c,d，然後基於if else while寫邏輯，然後給出返回。

未來，我們在乙個函式裡定義一組張量 A,B,C,D，然後給出一組矩陣運算公式然後返回新的張量。

這樣乙個函式就是乙個可微的NN模組。而乙個複雜的程式由大量的基本NN模組組合而成。

傳統的函式寫出來就能直接執行，基於NN的函式都需要訓練來得到引數。但是前者永遠只能處理確定性資料計算，後者可以復現我們的大腦。

3樓：大白

早上看到了新聞，匆匆看了一眼了，我對他的觀點深以為然。這裡解釋一下，權當拋磚引玉。

簡單的神經網路，一層加一層，每一層有N個節點，forward過程做加權，backward過程，因為每個節點都是可以微分的，做反向傳播(BP)。

CNN，每一層改為乙個3維或者4維的層級，每一塊掃瞄，每一塊可微分。forward加權，因為每個節點可微分，做BP。

RNN，每個層可以向自己做微分。

GAN，兩個網路，每層都可以微分，特殊的loss函式。

那我們可以看出來，其實任何神經網路都可以像搭積木一樣拼出來，這個積木只需要乙個條件，就是可以微分，這種可微分是做BP的必要條件, 而且可微分有乙個很好的特點，就是鏈式法則，這樣決定了所有的微分可以組合起來。除了這個之外，和普通程式設計沒有什麼區別。我想這就是可微分程式設計的來歷。

想一想，這對以後的程式設計有什麼影響，以後寫神經網路。直接提供給你幾個可以微分的模組(就像Drag and Drop UI 裡面的這種模組), 你簡單的組合起來, 加上loss function, 就可以形成你的神經網路了。

我覺得有點像Keras現在做的，但是現在Keras只提供了有限的Cell。以後的模組應該只要滿足模組可微分就可以了，這個比現在的Keras Cell 要多的多得多。