語料庫 Corpus 在語言學研究裡面扮演的角色是什麼?在學術圈會不會越來越重要?

時間 2021-06-01 17:47:36

1樓:若者

但是根據題主的描述,估計是要做corpus developer。如果是做語料庫開發的話基本上就類似於搬磚了。因為現在對語料的收集,標註等都是費時費力的工作。

儘管有標註工具能夠減輕部分工作量。當然這其中可能還要涉及一些程式設計以及一些技術手段,但這些其實不佔主導地位。其實相對來說,文字語料還比較好收集,麻煩的是聲音語料。

這也是為什麼當下的語料庫以文字語料為主的原因。

2樓:桑默

參加過一點兒最基礎的語料標註工作,學校也有定期舉辦語料庫語言學沙龍,感覺語料庫的發展前景還是非常好的,這是乙個造福千秋萬代的工程,耗時耗力,但對於研究者來說,用途是極廣的。上課時常聽老師講起最先的語言學研究是自己去做卡片,耗費時間去做分類、做統計,而現在語料庫的發展為目前的語言學研究提供了諸多便利。很多語言研究都可以去語料庫裡查詢需要的語料,很多語料庫中的語料是已經進行標註的熟語料,省時省力,而且很多語料庫有相應的資料分析,還不斷地補充語料進行更新,版本公升級,不斷改進。

Corpus在未來重要與否,應該是肯定地,但這也取決於語料庫的質量,被淘汰的也不少。若語料基數太小,重複使用太多,也會被取代。總之,看好語料庫的發展前景,值得投入時間去做一做。

是否可以用演算法,從一門(人類)語言的語料庫算出這門語言的語法(以 CF 或者 CS 產生式表示)?

斷水流大師兄 正好在上Machine Learning 和Text Analytics這兩門課,提供乙個思路,說的不對求輕噴 假如這是一門外星人的語言,地球上沒有人看得懂但是獲取了足夠龐大的語料庫,在沒有任何訓練集的情況下用機器學習的思路試圖分析出語法結構。這裡我把語法簡單的理解為基於詞性的排列組合...

在語言研究中,如何看待語料的使用?

王泓硯 句子接受度體現個體的認知水平,認知水平包括兩個方面,一是對事物聯絡的認知,比如事物之間的相似性 能動性,由於生活環境不同個體對事物的認識水平差異很大,有的人可能還有特異功能,對事物有全新的解釋 二是對表達手段的認知,比如某些人的詞彙量很大,懂得承轉啟合 條分縷析,這種手段反應在句子上就是語法...

外國語言學及應用語言學專業研究生人才引進時被判定為非英語專業怎麼辦?

是的,我保研選了外應之後也有一段時間比較後悔,但是去年跑了校招,很多地區也會要招老師外應專業的,東北的瀋陽還有長春,還有廈門深圳都是會要外應專業的同學的 南方印刷工 如果外國語言學或應用語言學應該是乙個大學科,下面是不是還有各種語言的二級學科?那如果制定政策者是像我這樣的行外人,會質疑這個學科下面是...