推薦系統中的多路召回如何確定每一路的數量和總召回數量?

時間 2021-05-07 07:23:28

1樓:厚德載物丶

首先,這個問題應該建立在召回數量在之後的粗排,精排能夠承受的前提下。

那麼,目前有幾個想法,最開始就是根據某個指標,拍腦袋決定每個路召回個數;

接下來,就可以考慮召回數量個性化,可以把當個特徵,或者用類似強化學習的思路,學習K值,這個群組喜歡哪路多一些,就多召回一些。

再後來有什麼方案,期待後面大佬補充

2樓:劉峰

總召回數量,取決於線上系統能承受多大的量,原則上當然是召回越多越好,但後續排序所需要考慮的候選也會相應增多,計算量增大,所以總召回量需要在效果指標和服務耗時上做折衷。

每路召回的數量,取決於每路召回的價值有多大,這個價值包含兩方面:

第乙個是獨有價值:如果該路召回結果能被其他召回所覆蓋,那麼這路召回不要也罷,因為沒有任何獨有價值。所以,獨有價值小的召回,召回量可以較少,不應該占用太多召回的quota。

第二個是效果價值:單獨統計每路召回的ctr、時長等指標,看看是否比其他路召回更有優勢,優勢越大召回量也應該應該越大。

推薦系統的召回集補全策略有哪些,在精確性和多樣性方面如何權衡?

往事俱沉暮雨瀟瀟 召回策略有很多,覆蓋很多方面。所謂召回補全還是第一次見到,並不請楚你想補全的是哪方面。常見的召回策略有 新熱召回 標籤召回 trigger觸發召回 embedding 召回 swing I2I 馬爾科夫召回等等。還有一些根據其他模型計算的U2I作為召回結果,常見的有用協同過濾做的,...

推薦系統中如何做 User Embedding?

朱果汁 社交網路領域會用到很多對user進行embedding的方法,需要使用者與使用者之間的關聯資訊 比如共同參與活動或者是互相關注 生成使用者的網路以後來進行embedding。 Louis 1.根據pretrain的item的embed,weighted pooling user的embed ...

推薦系統或者ctr預估中,如何區分或者如何定義高頻低頻特徵 有通用的閾值區分嗎?

失落的薩特 問題中的頻率的定義是什麼。比如在樣本中出現的次數?特徵非空非零值的覆蓋度?還是對於正負樣本的區分度?比如實際情況會考慮的,乙個是特徵的覆蓋度,即非空非零的樣本比例,如果覆蓋度太低那麼這個特徵對於大部分樣本的學習沒有任何幫助 乙個是這個特徵的區分度,即這個特徵能不能把待排序的樣本區分開來。...