有沒有好的深度學習方法來描述資訊損失?

時間 2021-05-11 14:56:07

1樓:David

是個有趣的問題,個人認為這個問題應該從先驗知識方面理解。

比如,我不知道「等你下課」是首周杰倫的歌,第2句話就會很難理解。所以,「周杰倫」還是給了我很大的資訊量。

2樓:網感至察

網感至察:TML KnowledgeCloud如何實現「小知識+大資料=大知識」

網感至察:上半場的大資料你知道了,下半場的資料治理你聽過嗎?

網感至察:網感至察發布「認知雲」新產品——提供一站式知識圖譜服務

3樓:

我並不知道等你下課是周杰倫的作品,甚至我並不知道等你下課是首歌[攤手]

想定義這種資訊損失,可能要先定義每乙個接受這個語言的使用者吧

4樓:斤木

我覺得還是需要把任務定義清楚。如果不考慮知識圖譜的話,這兩句話之所以相似很大程度上是在IR的場景下作query得到的candidates會很類似,導致「周杰倫」這個定語的資訊有限,丟掉也沒什麼損失。但這個損失還是對query的任務而言的。

換個例子如果把歌名換成「愛」,因為這首歌估計有一百個歌手唱過,前面加個歌手名就資訊量很大。這很顯然不是文字內可以表達的資訊了,甚至用知識圖譜都需要進一層的推斷,用tf-idf去描述顯然不合適了。

5樓:

這個方向本身我不怎麼了解,直觀上覺得這個問題可以用類似於搜尋結果多樣化領域中的MMR方法的思想來解決:既然等你下課是周杰倫的,那麼這兩個詞在語義上肯定是具有相似性的——於是這樣一來就可以把一句話分詞之後依次計算詞袋中任意兩個詞的不相似性,作為這句話在語義上的「多樣性」,詞與詞之間的不相似性越大,句子資訊量肯定也就越大。

行測有沒有什麼好的學習方法?

中公教育沽源分部 建議從四個步驟科學學習 第 一 初步感知 做幾套河北省歷年省考試題題,感受一下省考考試內容 難度和做題壓力。之後,找一些專業教材或專業人員了解行測每個部分考查知識點的數量為多少,具體的備考時間分配是什麼,根據了解到的情況,逐一進行基礎理論的學習,並配以適當練習。第 二 系統刷題 按...

有沒有什麼比較好的學習方法或關於學習方法的書 求推薦,謝謝。

學習的過程不外乎要像泡茶一樣有耐心 醫學知識放在現實世界並不會只出現你所劃記的部份對病患的需求來說能治得好他才是重點 可是在醫者的角度而言 遇到的病徵病狀可就多了去了 常見的 常用的先學起來叫基本 最適合最有效最迅速的處理 這才是專業嘛 先找到問題,才會有重點。和他人比較可以是阻礙 也可以是砥礪 只...

有哪些好的方法來學習 Cpa 的《財務成本管理》科目?

1高度 把握知識結構,明確知識點的位置 2深度 從目的,邏輯,標準,方法深入思考 3熟度其實想配一張自己做題的草稿紙,奈何本人從來不做題以上,祝好。 攬海聽風 高票回答已經把財務管理的框架和考試內容進行了拆解分析,很詳細,我就說說自己的體會。我是前年通過了CPA財管的科目考試,目前在一家輔導機構做兼...