nce loss 與 sampled softmax loss 到底有什麼區別?怎麼選擇?

時間 2021-05-30 12:14:27

1樓:

nce_loss 與 sampled_softmax_loss如何選擇

nce_loss用的是logisticLoss,sampled_softmax_loss 用的是softmax,可以從下面loss的形式看出,對於每乙個樣品i,logisticloss可以有多個標籤,就是同時訓練多個二分類器。而softmax只有乙個正標籤。

這張圖也來自tensorflow的文件

Tensorflow的取樣方法:candidate sampling

這個博主看法,對於多標籤多類別的分類任務使用Logistic比較好,對於多標籤單類別的分類任務使用softmax比較好,取樣中,採用tf.nn.sampled_softmax_loss訓練cbow模型比較好,而 tf.

nn.nce_loss訓練skip-gram比較好。

Candidate Sampling 及TensorFlow中的實現

這個博主認為NCE loss的直觀想法:把多分類問題轉化成二分類。之前計算softmax的時候class數量太大,NCE索性就把分類縮減為二分類問題。

之前的問題是計算某個類的歸一化概率是多少,二分類的問題是input和label正確匹配的概率是多少。二分類問題群眾喜聞樂見,直接上logistic regression估算一下概率。Sampled softmax則是只抽取一部分樣本計算softmax。

這個想法也很好理解,訓練的時候我不需要特別精準的softmax歸一化概率,我只需要乙個粗略值做back propoagation就好了

Similarity between NCE and IS

sampled softmax與其在框架中的使用 - 我要給主播生猴子的文章 - 知乎 https://

zhuanlan /p/12

9824834

2樓:龍翔天翼

stackoverflow相似問題,感覺回答的並不清晰https://

考研與德勤與CPA

有關係VIP進四大不是分分鐘的事嗎?既然都VIP了,自己又想去德勤,考研無非也就是給自己乙個考CPA的時間吧。三年研究生讀出來第一年基本工資就比本科高300塊,個人感覺本科能去就沒必要拖到研究生了,而且你VIP,我就不信小黑會有敢delay你的。匿了。 我在銀行工作,推薦你去德勤,辛苦了還有結果,銀...

與自己對話 反思與行動

高效人生手冊 人唯一完整擁有,可以完全控制的東西,只有自己!包括自我的身體,意志和行為。我們要承認自己的孤獨,容易走極端。往大處看容易陷入無力,虛無感,人存在沒有意義,到頭來一場空,何必努力。往小處看,盡是芝麻綠豆小事,索然無味,陷入如此平凡之生活中,有何樂趣。所以每個人都會不自覺地尋找存在感,找到...

電子與通訊 資訊與通訊?

Marie 在我的學校 重慶郵電大學 這只是專碩和學碩的區別。在研究生階段,二者只有畢業要求不同和學碩可以讀博的區別。具體做什麼方向只與導師的方向有關。 yan li 乙個偏硬體,乙個偏軟體,搞電子的可以去搞電路,半導體,晶元,搞資訊的可以了解信源編碼,加密解密,協議信令,至於樓上說需要好老師的,我...