NLP任務中LSTM以及雙向LSTM的如何處理長度不一的句子輸入？

1樓：dilligencer

我覺得向前補齊和向後補齊都可以，只是performance可能會存在差別，在pytorch裡面有兩個函式用來處理這種情況乙個是pack_padded_sequence，另乙個是pad_packed_sequence。這兩個函式聯合起來使用來針對LSTM處理變長資料。

2樓：zy ye

可以設定max_seq_len,超過擷取，少於的話padding，可以前向padding也可以後向padding，對於BiLSTM來說，反向句子和正向句子的padding需要保持一致。當然也有動態LSTM，可以每個batch設定個最大長度，從而加快速度，特別是在decode的過程中。

3樓：Maybewuss

不一定要用最大長度進行padding，也可以設定某個長度進行截斷。

如果你使用的框架是pytorch，那麼它有乙個函式叫pack_pad_sequence，具體名字記不清，這個函式可以接受兩個引數，乙個是pad過後的句子，還有乙個是每個句子pad前的長度。印象中tf中的dynamic_rnn好像也可以實現類似操作。

我覺得雙向rnn的反向應該是從pad部分開始的吧。。。具體也不太了解，tf裡面好像有個函式叫reverse_sequence的，你可以看看。

4樓：小明

可以設定乙個最大長度，乙個batch裡面，超過長度的sequence就截斷到最大長度，不到長度的sequence就補齊到最大長度，這樣方便對整個batch的資料進行矩陣操作