如何提公升文字相似度匹配?

時間 2022-01-06 11:17:23

1樓:瞎bb隊長

NLP問題的模型對語料的依賴非常大,通用的語料訓練出來的模型一般也就當個引數的初始化,需要結合自己領域的語料去做fine-tune.

既然要做文字相似,就要有標註的資料,包括相似語料的樣本,和不相似的語料樣本,然後可以通過triplet-loss 的方式去進行fine tune.

Google 公開的Bert 模型可以作為乙個初始化的模型輸入,後面接多層的全聯接. 然後使用自己的資料再繼續訓練。

2樓:Nick Cao

只想用詞向量的話那就baseline needs more love了解一下咯

可以去了解一些經典的natural language inference模型,比如:孿生網路,infersent等

匹配聚集, decomposable attention,ESIM, BIMPM等

粗暴一點那就bert咯

3樓:nlp小菜雞

無監督的方法就是構建各種文字的表示了,然後計算向量的距離,傳統的如詞袋模型,或者word2vec等,關於文字表示,可以參考https://

。監督的方法,可以試試siamese network,當然bert裡也提供了pair classification,也可以試試。

如何定義 相似度 ?

wai 我想到一種相對簡單易理解的辦法,就是假定部分的相似度大致反映整體相似度。具體來說,先測量樣本人群每個人鼻尖相對面部的高度,然後計算標準差 測量樣本貓群每只貓的鼻尖相對面部的高度,同樣計算標準差。因為人和貓塊頭不一樣,為了消除這一影響,可以把各自的標準差除以各自的體積 為了方便,可以用體重代替...

如何提公升腳踝靈活度?

雷澄運動康復師 踝關節 由脛 腓骨下端的關節面與距骨滑車構成,故又名距骨小腿關節,最常見的傷痛為扭傷。提踵訓練 是訓練腳踝力量最基本也是最安全的方法 如果你想增加訓練難度,可以用雙腳前腳掌站立在台階上,後腳跟保持懸空,以增加動作幅度。也可以採取增加負重的方式。單腿屈膝支撐訓練 上身微微前傾 支撐腿屈...

申請master時如何判斷德國課程匹配度?

我大二就有想去德國留學的想法,找了麥熊的中介,開始學德語。後來大四結束,沒有gap一年直接上學。在這裡我想說留學準備還是越早越好。如果你是想申請德語授課,那一定要盡早學習德語,如果你想申請應授的話,那就把英語學好。另外,我覺得課程匹配度非常的重要,當時為了申請我想申的學校,而且我報名中介比較早嘛,顧...