知識圖譜是先有雞還是先有蛋的問題?

時間 2021-07-09 20:26:58

1樓:post

正常專案實施的話,依據專案規模,如果專案規模較小前期沒有很多語料的情況下,基本都是人工根據業務經驗(專業名詞)構建實體和關係,實現專業知識圖譜(有些也叫領域知識圖譜)構建。後續上線後會以詞頻統計、聚類、關聯規則等演算法挖掘輔助推薦實體新增,當然也需人為確認。

並不是說不提倡使用演算法進行實體、關係挖掘,只是出來的結果準確性遠不如人為參與構建準確,且出來的知識圖譜架構遠遠脫離也業務架構。

如果專案較大、前期有大量語料的基礎上,進行資訊抽取實體構建以及關係挖掘來構建知識圖譜也未嘗不可。在此基礎上也不是完全脫離人為參與,出來結果多需要人為干預確定和修改的。

這裡就有疑問了,為什麼演算法出來的實體以及關係任然需要人為干預呢,這就涉及到知識圖譜的應用了,如:知識搜尋、知識泛化、知識管理等。舉個政務行業的例子,如人才補貼事項,各市的政策都不一樣,各區的也有細微的差異化,而人才補貼事項往往又會涉及到很多固定關係實體,如辦理條件、辦理位址、辦理所需時間等(這些是事項的通用關係實體),讓這些完全交由演算法去挖掘實體,最終實體會出來一些,但結構混亂了。

這種帶有政治職能賦權的政務事項往往脫離了組織架構,且完全脫離了業務主線——事項名稱,進行組合的交叉知識體系。最後人為去修正,會讓人抓狂的,與其修正這些雜亂無序的知識架構,倒不如以業務主線人為重新構建。

這裡並不是不認同資訊抽取系統提取實體關係構造知識圖譜,只是目前深度學習出來的很多東西不可解釋,而且很多語料在特定場景下都隱藏了很多資訊,而這些資訊無法納入訓練集中。最終出來的結果可想而知。

針對知識圖譜構建是先有雞還是先有蛋的問題,我的觀點是先有雞後有蛋,知識圖譜體系架構必須人為構建知識體系後,才可有演算法進行查缺補漏。

PS:以上觀點前提是業務發展出現了瓶頸確確實實需要使用知識圖譜解決,實體較少且關係簡單的業務,這些知識圖譜可用可不用的情況不考慮在內。

世界上,是先有雞,還是先有蛋?

陳曦 先有雞蛋。正本溯源,正經回答這個問題先要認清以下事實。第一 一種動物的子嗣不一定就是此種動物。比如馬和馿生的是騾子。獅子老虎生的是獅虎獸或者虎獅獸。同理,鳥生的不一定是鳥蛋。第二 蛋,尤其是大小相同的蛋往往不好分辨是哪種蛋,杜鵑把蛋產在別的鳥窩裡面,鳥媽媽還不是照孵照喂。第三 即便回到過去,第...

世界上先有雞還是先有蛋?

123think 我認為作者問題有個缺陷,就是 什麼動物的蛋呀。先預設雞蛋吧。那應該是先有雞。雞首先是從1.4億年前的遠古恐龍時代中期的始祖鳥進化來的。如果沒有始祖鳥就沒有雞,自然也沒有雞蛋了。如果就是蛋,那應該是先有蛋。這種蛋是5.1億年前晚寒武紀至早奧陶紀時期一種魚的卵。其尺寸很小。這個問題早在...

到底應該是先有雞還是先有蛋?

月隱 實不相瞞,我六七歲時就被乙個做老師的叔叔逗樂問過這個問題,然後我義正言辭的告訴他先有雞,因為萬物都在進化,早先的禽類可以進化成雞但是我沒聽說過啥玩意能進化成蛋的!那叔叔說對是對,但是他本來是想告訴我 雞蛋 是雞在前面,所以先有雞的.直到去年年底,和乙個比我小一歲的妹子聊起這個話題,她堅持先有蛋...