FastText是如何在分類的同時生成詞向量的?

時間 2021-06-02 22:08:59

1樓:bupt.lee

對,我也有問題想請教一次。CBOW訓練的輸入是context的one hot之和,而fasttext則說輸入是每句詞向量+subword(n gram)的詞向量之和,建立的是關於類別個數的哈夫曼樹,而cbow是根據每個單詞詞頻的個數建的哈夫曼樹。所以,我覺得fast text首先訓練關於輸入和subword的詞向量,這裡詞向量建立的是關於單詞個數的哈夫曼,最後講embedding輸入fasttext建立關於類別的哈夫曼樹。

所以採用了同是層次softmax,我覺得wordvec不可能比fasttext慢。

2樓:張小憨

你好,我最近也在疑問這個問題。現在我大致理解的是,fasttext輸入就是乙個簡單的embedding,避免使用one-hot形式,這個embedding相當於用one-hot做了乙個全連線對映的值,但是這個vector。並不是真正的word2vec。

至於為什麼fasttext使用的輸入就是embeeding後的呢,這個主要是兼顧了低頻詞在one-hot上面得不到充分的訓練。

3樓:崔向陽

原來的word2vec是訓練乙個language model,產生了乙個副產品是word vector

現在做這種研究的少了,在資料量足夠的情況下,很多任務都可以用類似的方式生成word vector。

資料量充足的情況下,單獨用language model生成word vector以後,再應用到分類等等任務上,和直接做分類任務,附帶生成word vector相比,並沒有明顯優勢。

牙齒是如何分類的?

正畸大講堂 如果張開嘴巴照鏡子會看到牙齒的形態不一樣,因為形態不同有不同的名字,比如切牙 尖牙 磨牙,前面.上下各有4顆像斧子一樣的牙叫切牙,最主要是切斷食物 啃咬食物。尖牙另外乙個稱為叫犬齒,最主要是撕碎食物,人類因為吃的食物越來越精細,常吃煮熟的食物所以這個功能下降了,尖牙上下左右各有1顆,很少...

人格型別是如何分類的?

人格型別的分類是我所見最大的自私。把人按照對社會 其實是對自己 有什麼用,分成各種職業物化,我覺得過去心理學愚蠢之處就是急於幫助制度去物化他人。通過一種星座占卜的方式讓人相信自己天生就是如此。作為西方國家職業指導理論。20 世紀 60 年代中期美國職業指導專家霍蘭,在一定程度上幫助了社會進行特長分類...

你們是如何進行知識分類?

神術師 第一類知識 理解宇宙以及人類生存的環境所需要的知識,這類知識基本都屬於自然科學,包括物理學 生物學 地理學 氣候學 宇宙學 數學 概率統計等。第二類知識 理解社會形成和制約個體的社會環境 商業經濟環境所需要的知識,這需要涉獵社會學 人類學 經濟學 政治學 歷史學 法律學等。第三類知識 理解自...