seq2seq 中的 beam search 演算法過程是怎樣的？

1樓：

可看著閹割版的維特比演算法，它更一般，維特比和貪心的greedy search可以看做它的特例

假設建模單元個數為n，beam size為k，解碼需要的時間步驟為t

(1)如果k=1，即為greedy search，時間複雜度為O(t*n)

(2)如果k=n，即維特比演算法，時間複雜度為O(t*n*n)，此時有全域性最優解

(3)其他即為常說的beam search，時間複雜度為O(t*k*n)，區域性最優

2樓：

首先需要確定乙個`Beam Size`，這裡設定為2，意思是每個`word`後面的分支考慮概率最大的那兩個`words`。比如下面的例子，從下往上首先分成A、B兩個words，然後繼續往上傳播，句子變成是AA/AB/BA/BB這四種情況（綠色虛線）。考慮到`Beam Size=2`，選擇概率最大的兩個，假設是AB/BA（橙色大箭頭）。

然後以選擇的AB/BA繼續向上傳播，又出現了四種情況ABA/ABB/BBA/BBB，依然是選擇綜合概率最大的兩個ABB/BBB。以此類推，直至句子結束。只要可以調整好`Beam Size`，就能夠使用最小的計算量，得到最優的結果。

3樓：書生打柴

beam search只是乙個搜尋策略，對於語言生成的模型中，你給定語言模型，它可以搜尋出更差異化、更合理的結果。beam search功能上等價於最簡單的單步最大概率，或者viterbi演算法等等。所以沒有什麼時候用的問題，只是一種搜尋策略而已。

seq2seq 中的 beam search 演算法過程是怎樣的？

seq2seq模型和 encoder decoder模型有什麼異同？

Produce101 season2中的舞台表演中你最喜歡哪個？為什麼？

如何看待 DOTA2 中的暫停？

其他用戶還看了：

seq2seq 中的 beam search 演算法過程是怎樣的？

seq2seq模型 和 encoder decoder模型有什麼異同？

Produce101 season2中的舞台表演中你最喜歡哪個？為什麼？

如何看待 DOTA2 中的暫停？

其他用戶還看了：

seq2seq模型和 encoder decoder模型有什麼異同？