以AlphaGo為例，如何理解神經網路的儲存容量 storage capacity ？

1樓：

神經網路當然沒有儲存所有局面的情況。它學習的人類棋譜和它的自我對局共同組成了它的經驗，至於經驗以外的局面怎麼應對要靠舉一反三，也就是泛化。

不過神經網路的儲存容量是個很有意思的問題。比如說，可以考慮一定規模的神經網路，可以學習多大容量的訓練資料。當訓練好的神經網路受到一定損傷，又會失去多少習得的規矩。

這些都是值得研究的課題。

2樓：Tattletale

神經網路有泛化(generalization)能力。用通俗的語言說，神經網路記住的是規律，而不是訓練集裡所有局面下的應法，更不是任何局面下的最佳應法。

如果神經網路（相對於訓練集）太小，會發生underfitting，也就是說找到的規律太粗疏。

如果神經網路（相對於訓練集）太大，會發生overfitting，也就是說記住的規律太多太具體，更像是死板地記住了訓練集裡局面與應法的一一對映，不夠抽象。

做圍棋AI的運氣好，拿kgs上（也許再加上gogod和tygem）區區幾十萬局遊戲當訓練集，就可以用乙個適當大小的神經網路提取出足夠多的規律。如果我們在公元2023年想做圍棋AI，那麼肯定會碰到資料不夠的情況，必須減小神經網路的規模才能有效訓練，而神經網路規模小了，可以儲存的規律也就少了。

把應用範圍推廣，判斷什麼東西是可以有效訓練的，什麼樣的tuning方法才可以有效訓練，以及訓練集與神經網路大小的關係，都還是算命和煉金術，離science的程度還有點遠。

補充乙個例子：google translate的神經網路版更新，個人估計在碰到小語種的時候會有麻煩，因為小語種的文字資料不夠神經網路塞牙縫的。這就是為什麼他們想方設法要弄zero shot learning，重用大語種的訓練結果，把現成結果硬拿給小語種用。

3樓：王導

直接儲存肯定是不行的。

如果有足夠大的儲存和運算速度，計算機靠硬算就能贏了人類了。

所有的技巧和演算法都在於，怎麼在有限的儲存和有限的計算資源下，取得最大概率的勝利，這時，壓縮儲存，省略調無用和重複的資訊就是一直在研究的工作。