LSTM的cell個數是如何設定？

1樓：劉青豪

cell的數量不需要設定吧網路中cell 的數量顯然是輸入序列的長度然後每個cell 都會有輸出值，最後乙個cell的輸出值才是該層隱含層的最終輸出。

2樓：我的上鋪叫路遙

你對cell的概念理解有誤，我不說LSTM，就拿最基礎的RNN來說吧，cell其實就是乙個RNN的網路，網路的輸入形狀就是[batch_size, time_step, embedding_size]，隱藏狀態是[batch_size, hidden_size]（或者叫num_units也行），輸出形狀同隱藏狀態。你可以把這個網路等同於dense（全連線），hidden_size就是每個cell裡神經元的個數——當然，LSTM的網路就複雜多了，但是也可以視為很多個dense的組合。

再說一遍，cell不是神經元，cell表示某個時刻（序列）RNN的網路，到下乙個序列時刻，cell的內部狀態（神經元）就會更新。也就是說，從空間上講，cell是同乙個，但是時間上，cell_1表示輸入x(1)，隱狀態h_1，cell_2表示輸入x(2)，隱狀態h_2。

你所說的256應該指的是hidden_size，也就是隱狀態的維度，神經元的個數，而不是cell數目。至於這個大小設定，應該是來自計算力與表達能力的權衡。越多的hidden_size可以包含更多的細節，以及更豐富的表達能力，但是同時也會帶來過擬合以及耗時間等缺點。

3樓：

和你each step的特徵維度有關. 一般可以設定為輸入層節點數的2倍，然後利用Greedy Search去進行超參調整.

4樓：深度學習雜談

對於MLP來講，同一層內unit的個數決定了在當前維度的表達能力上圖可以表達三維空間的線性可分問題，增加unit後可以表達更高維的線性可分問題。

增加層數後可以表達線性不可分問題。

由上可以看出，當unit足夠多時，網路會具有足夠多的weights去擬合當前問題，但是換來的可能是過擬合和訓練速度嚴重下降。從經驗來看，很少有人在rnn的層裡面加很大的unit數量上去，計算量是很恐怖的，而且獲得的效率提高可能只是一點點（比如tensorflow的官方教程裡ptb的例子，雖然有1500個hidden unit，但是實際提公升相比較於200的並不是很明顯）。所以一般128或者256的就已經足夠了，單純RNN的學習能力很一般，需要組合其它手段去提高準確率（可以看看keras的 example目錄，裡面有很多實踐好的引數可以參考）

LSTM的cell個數是如何設定？

如何看待所謂「設圈」的「賣設」「買設」「玩設」，以及私人約稿的問題？

如何理解計算物理中的元胞鏈結列表（Cell Linked List）演算法？

如何判斷拼音的音素個數？

其他用戶還看了：

LSTM的cell個數是如何設定？

如何看待所謂「設圈」的「賣設」 「買設」 「玩設」，以及私人約稿的問題？

如何理解計算物理中的元胞鏈結列表（Cell Linked List）演算法？

如何判斷拼音的音素個數？

其他用戶還看了：

如何看待所謂「設圈」的「賣設」「買設」「玩設」，以及私人約稿的問題？