推薦系統中的多路召回如何確定每一路的數量和總召回數量？

1樓：厚德載物丶

首先，這個問題應該建立在召回數量在之後的粗排，精排能夠承受的前提下。

那麼，目前有幾個想法，最開始就是根據某個指標，拍腦袋決定每個路召回個數；

接下來，就可以考慮召回數量個性化，可以把當個特徵，或者用類似強化學習的思路，學習K值，這個群組喜歡哪路多一些，就多召回一些。

再後來有什麼方案，期待後面大佬補充

2樓：劉峰

總召回數量，取決於線上系統能承受多大的量，原則上當然是召回越多越好，但後續排序所需要考慮的候選也會相應增多，計算量增大，所以總召回量需要在效果指標和服務耗時上做折衷。

每路召回的數量，取決於每路召回的價值有多大，這個價值包含兩方面：

第乙個是獨有價值：如果該路召回結果能被其他召回所覆蓋，那麼這路召回不要也罷，因為沒有任何獨有價值。所以，獨有價值小的召回，召回量可以較少，不應該占用太多召回的quota。

第二個是效果價值：單獨統計每路召回的ctr、時長等指標，看看是否比其他路召回更有優勢，優勢越大召回量也應該應該越大。

推薦系統的召回集補全策略有哪些，在精確性和多樣性方面如何權衡？

往事俱沉暮雨瀟瀟召回策略有很多，覆蓋很多方面。所謂召回補全還是第一次見到，並不請楚你想補全的是哪方面。常見的召回策略有新熱召回標籤召回 trigger觸發召回 embedding 召回 swing I2I 馬爾科夫召回等等。還有一些根據其他模型計算的U2I作為召回結果，常見的有用協同過濾做的，...

推薦系統中如何做 User Embedding？

朱果汁社交網路領域會用到很多對user進行embedding的方法，需要使用者與使用者之間的關聯資訊比如共同參與活動或者是互相關注生成使用者的網路以後來進行embedding。 Louis 1.根據pretrain的item的embed，weighted pooling user的embed ...

推薦系統或者ctr預估中，如何區分或者如何定義高頻低頻特徵有通用的閾值區分嗎？

失落的薩特問題中的頻率的定義是什麼。比如在樣本中出現的次數？特徵非空非零值的覆蓋度？還是對於正負樣本的區分度？比如實際情況會考慮的，乙個是特徵的覆蓋度，即非空非零的樣本比例，如果覆蓋度太低那麼這個特徵對於大部分樣本的學習沒有任何幫助乙個是這個特徵的區分度，即這個特徵能不能把待排序的樣本區分開來。...

推薦系統中的多路召回如何確定每一路的數量和總召回數量？

推薦系統的召回集補全策略有哪些，在精確性和多樣性方面如何權衡？

推薦系統中如何做 User Embedding？

推薦系統或者ctr預估中，如何區分或者如何定義高頻低頻特徵 有通用的閾值區分嗎？

其他用戶還看了：

推薦系統或者ctr預估中，如何區分或者如何定義高頻低頻特徵有通用的閾值區分嗎？