新世紀的語言學研究跟之前比有什麼大的變化麼?

時間 2021-06-01 01:03:12

1樓:Daniel

未來語言學最有前景的方向,必定是與神經科學和自然語言處理交叉的方向。語言學者一貫以來缺乏工程性的思維,很多理論都是無法應用到自然語言處理中去,這也是目前為什麼語言學在目前NLP發展大潮中缺位的原因。

2樓:

上世紀時(這裡主要指上世紀後幾十年),語言學最大的亮點就是與計算科學結合催生了計算語言學(Computational Linguistics)。那時計算語言學和語言學是很難分開的,因為計算語言學需要大量的規則(詞法、語法、文法等),也需要大量的語義資源(如詞典、詞義網(WordNet類的)、句法語義框架(FrameNet類的))。這些資源上的需求使得這兩個學科緊密聯絡在一起。

同時,由計算語言學帶來的統計語言學的方法在很多語言學領域上也是有所建樹的,比如《紅樓夢》的版本分析與《楚辭》的作者判定。這也就導致了上世紀末,語言學越來越靠近計算和統計的領域。

本世紀開始,隨著深度學習(Deep Learning)與表示學習(Representation Learning)的興起,在越來越多的應用領域中,人們發現語言學的成果在逐漸失效。因此,基於語言學先驗的方法逐漸在被純粹地表示學習的成果所取代。比如機器翻譯中,端到端的Encoder-Decoder模型完爆之前基於短語對應和句法重構的模型;在語音識別中,基於神經語言模型的結果也較之前的n-gram的統計方法要好很多;在關係提取與知識圖譜構建中,人工寫規則的方法也早已因為過高的成本與過低的召回率被拋棄。

計算語言學(或者說用現在比較流行的名字:自然語言處理(Natural Language Processing))開始和傳統的語言學分道揚鑣。

個人感覺,新世紀的語言學發展應該要逐漸回歸傳統,將著眼點放在自然語言處理與深度學習夠不到的地方。比如一些資料資源比較少的領域,中世紀西歐地區詞彙的演變之類的,完全沒有足夠的資料供深度學習來研究,就只能靠語言學和人文學科案例分析的方法來取得進展了。只有這樣做到揚長避短,語言學才能夠更好地生存。

而現代語言由於其資料充足,且靈活多變地富有活力仍然在發展,語言學必定難以在這個領域和自然語言處理分庭抗禮。所以純粹的語言學還是要回歸傳統才更有潛力。

現在雖然仍然有一些人在嘗試將傳統語言學的方法和深度學習的方法進行結合,但在學術領域中這種結合並沒有顯現出多少的潛力。雖然自然語言處理是否可以完全不需要任何語言學的先驗尚無定論,但是越來越多的經驗表明,在很多領域中結合越多的語言學先驗效果就越差,而好的深度學習的設計幾乎可以取代所有語言學先驗。就如同IBM的Fred Jelinek所言,「每當我解雇乙個語言學家,語音識別系統的效能就會改善一些。

」 (Every time I fire a linguist the performance of the recognizer improves.)。

(這是上世紀80年代末的話,現在的事實是在這樣的專案中已經基本沒有語言學家了...)

目前語言學的相關專業,最前沿已經研究到什麼程度了?

理論語言學的話,建議自己動手去翻一翻Language,這種事可以寫個幾卷本了,哪是一句話兩句話能說清楚的。說起大的趨勢,那就是理論翻新並不多,但整個學科更加科學化實證化。我覺得需要再次強調,現代語言學是心理表徵的理論,當更科學的研究正規化進入,坐著編句子,坐著想規則,隨意提出解釋的時代可能快要謝幕了...

學習語言學的研究生 博士需要什麼能力?

我來說說實驗語音學 統計學基礎 了解常用的統計推斷 假設檢驗方法的使用 適用範圍及其原理。前置技能 微積分知識初步 前置技能 線性代數知識入門 聲學基礎 對聲學現象的物理規律有一定掌握前置技能 物理學知識初步 前置技能 微積分知識初步 前置技能 復變函式入門 可選修 電路分析基礎 心理學基礎 對實驗...

語言學研究在現階段對機器翻譯有實質性的幫助嗎?

講真,現階段語言學是幫不上機器翻譯的,但我認為這是人工智慧還沒發展到能跟人工翻譯競爭的地步,如果有一天機器翻譯能完全達到信的程度了,那接下來的達和雅絕對是需要語言學的幫助的。你問我為啥?因為人工翻譯質量的提公升也離不開語言學,人工智慧如果能發展到人工的程度那必然是跳不過語言學學習的,不然其演算法沒法...