計算機視覺和自然語言處理,哪個更具有發展前景呢,還是各有千秋呢?

時間 2021-05-06 10:14:55

1樓:機智子

cv確實是perception為主,包括檢測、跟蹤、識別、重建等,主要是其資料比較原始,但是也在往cognition上前進,包括描述、關係等。

nlp以cognition為主,處理的物件是人為了交流傳播的文字,主要任務是分析、對話、翻譯等,通常都是一些結構化的方法,近幾年一些直接處理更底層character的方法也在出現。

具體哪個更有前途是看時間的應用的成熟度的,在與自然互動上cv目前及今後一段時間肯定是主導,一方面是演算法發展階段目前也就是perception部分可用,另一方面nlp做機械人等與自然環境互動的也不可能。nlp這一類cognition肯定要等到perception成熟才會有大的應用,目前主要是一些搜尋、對話等虛擬應用。

2樓:OliviaLD

我認為二者相通看你讀碩士還是讀博士還是創業,如果你讀碩士,可以玩玩cv,如果你讀博士,趕緊都學通了,因為你要做的東西一定是融合版的,任何乙個分支都不足以支援你博士畢業了。如果你做工業,放棄吧,這片魚塘屬於大公司。

3樓:Milo Sun

這個問題提得好,各位也說了自己的看法。我說個純理論上的問題,比較計算機視覺和自然語言處理本身就是個偽命題。計算機視覺跟自然語言處理從人類認知的角度來看,其實根本就不是乙個層面上的問題。

現有的視覺技術感知為主,可以認為是perception的問題,但語言完完全全是perception上面一層cognition的問題。perception相對客觀,而cognition層面的語言在複雜度或者說混亂程度上更勝一籌。

現有的CV技術都是從畫素直接提取特徵,然後做分割,或者識別。而語言處理問題主要把文字作為輸入物件,進行句法分析,語義分析,翻譯或者其他工作,自然語言處理已經假設了我們預處理得到了文字。

完全對應現有CV技術的領域其實是語音識別。都是純訊號層輸入,然後進行識別分類。

語言還有個幾乎無解的地方是變體太多:人類有6000種語言,每種語言還有各種方言變體。視覺也有類似問題,但至少人眼在識別特徵上並沒有這麼大差異。

4樓:cstghitpku

文字是最常見的資料格式,也是資料量最大的,需求方面高下立判。工作機會跟需求可能不是線性相關,但一定是正相關的。

AI的發展一定是為了方便人類的生活,而大部分場景下跟人互動最直接、有效的方式是文字,市場空間高下立判。

影象處理會比文字處理需要更多的資源,這點有朋友說過了,具體不再解釋。成本越高越不利於前期發展,尤其是小公司、缺經費的實驗室。

不過影象相比文字也有很多優點,比如更直觀、資訊量更大、更容易吸引人眼球等。

初學者會覺得玩影象、語音比文字更酷,也比文字更難處理(不只是剛入門的會有這個誤解,微軟某應用科學家親口說他也有過這個誤解)。但學習時間越長越發現不是這樣,因為影象、語音相對來說更客觀、規律性更強,自然語言更具有人的主觀、更加抽象、對應的場景更多、更加多義性並且容易歧義。

目前來說,無疑cv發展更成熟,nlp還需進一步取得大突破、挑戰也更大,可能需要十年甚至幾十年的多人努力,任重道遠但也恰恰提供了更大的發展空間。

不過,cv和nlp很多模型、方法都是相通的,大同小異。未來推動人工智慧發展的不僅僅是cv,也不僅僅是nlp、語音識別,而是多個領域的共同發展。

最後,cv和nlp都是好方向,選那個都行,根據興趣決定就好,把興趣當職業的人最幸福也最有效率!祝好!

5樓:

CV啊,因為NLP現在都沒有啃下來(模型、計算資源、資料,都沒搞定),CV幾個大任務,反正在公開的資料集上都快被啃得差不多了。

如果解決了NLP,也就是自然語言理解的問題,我覺得離AGI也就不差幾步了,語言的發明本來就是人類歷史的乙個飛躍,難度可想而知。在這之前,估計一般人投身進去都是去填坑。CV現在技術基礎已經有了,玩點兒應用出成果的可能性還是有的。

6樓:閔可銳

張華考上了北京大學;李萍進了中等技術學校;我在百貨公司當售貨員:我們都有光明的前途。

《新華字典》1998修訂本 P673

7樓:

大概掃了下,這個問題的回答目前大多來自並沒有真正做過NLP的童鞋們……這也基本可以反應整個智慧型資訊處理大環境下CV和NLP相關研究人員的比例有多不均衡。

這裡需要強調一點:NLP不是字串處理,也不是簡單的詞袋或文字分類。很多任務要做好就需要知道給你的句子或語段到底在講什麼。

暫且先不考慮整個篇章級別的資訊結構。給定任何乙個句子,都可以有相對句長達到指數級數量的結果來解析它的語法結構,然而其中只有乙個或極少個是語義上正確的。同時,同乙個意思有無窮多種方式可以表達出來,絕大多數表達模式在大家手上的實驗資料中可能出現都從來沒出現過。

Ambiguities(乙個表達多種意義)和variations(乙個意義多種表達)是NLP的根本難點,短期內不會有任何工作可以提出通用有效的解決方案。

如果你要問發展前景,那短期內必須是vision。原因很簡單:就相關問題本身的難點以及目前的支撐技術發展狀況來看,想做好NLP的難度遠遠更高。

這其實也是前面有人講「目前大部分有影響力的工作都是從視覺開始的」的原因。

8樓:

自然語言處理處理的是高階,抽象,無法量化的訊號,計算機視覺是底層訊號。論前景,短期內計算機視覺更有前景,長期來看nlp更有前景

9樓:cheng tang

說前景我覺得是計算機視覺,視覺傳達的東西比文字肯定更豐富。

但是按照現在的技術而言,自然語言處理更有價值。視覺的價值還需要另乙個技術上的突破。

10樓:Silver Guo

利益相關,NLP應用領域工作

兩個都是和深度學習結合起來的大熱門啊,隨便哪乙個的需求都是相當的大啊,不管學好哪乙個都有大把的offer吧(滑稽)

都是非結構化資料,但由於影象是數碼訊號,處理和特徵提取的手段更加豐富和可靠,文字資料提取特徵難度較大,比較主流的就是詞頻矩陣和word2vec,而且由於語言種類很多,並且文字資料普遍質量不好,資料清洗和預處理的工作比較多。

個人以為,NLP現在對於淺層次的特徵提取,分類等問題已經比較成熟了,而深層次的語義理解是現在大家研究的熱點,也是和深度學習結合密切的方面。比如這兩年以來Neural machine translation在機器翻譯上相對於以前Phrase-based ML所取得的長足進步。並且現在工業界對於NLP的期待很大,在chatbot,翻譯,語義分析,summarization,資訊提取和本文分類都有很多嘗試。

影象這方面,是最先開始和深度學習合作的領域,現在已有不錯的工業化的例子,比如在醫療領域的協助診斷,安防的人臉識別,但都是淺層(並不是指方法簡單)的影象處理技術,感覺對於影象深層次含義的理解和挖掘還需要很多努力,估計這方面未來也需要借助自然語言的研究成果。

簡單來說,兩個都是非常棒的方向,大有可為。影象的工業化方面的例項不少,研究領域也看得到很多前景。NLP初入坑會很多,但應該是之後這幾年業界會投資很多的領域,並且一些方向已經快達到了工業化所需要的效能。

11樓:張少典

目前有的答案大多都是從技術的角度,已經分析的很好了。補充一點,任何技術的發展前景,歸根到底是取決於它的應用尤其是商用前景。年輕人如果想選擇自己畢生從事的領域,首當其衝要考慮的可能並不是乙個東西在技術上還有多少現存問題沒解決,而是乙個東西在未來20、30甚至50年有沒有可能代表乙個龐大的市場應用。

如果有,那麼自然會有無數的技術問題被創造出來,需要無數的人才投入,那麼自然而然的好的「發展前景」也就形成了。所謂選錯行、站錯隊,大多數時候即是在這樣的選擇上出了問題。當然,timing也很重要,最典型的例子就是當年的生命科學....

作為AI的分支領域,CV和NLP根本上來說就是代表了人希望機器能「代替自己看」和「代替自己讀和寫」(聽和說也依賴NLP但隔了一層speech)。短期之內,可能是侷限在某些場景下(例如安防人臉識別、人機自動問答)。但長期來說,只要看好AI,就必須認識到CV和NLP會在越來越多的場景下取代人的「看」和「讀寫」功能。

那回過頭來評價這兩個領域的前景,只需要考慮:這些被CV和NLP所取代的man power,到底代表了多大的生產力、時間和精力投入,就可知這個領域的前景最大可能有多大。再本質一點說,我們作為人,到底有多少時間精力是花在「看」上,多少時間精力花在「聽說讀寫」上,也許就代表了CV和NLP領域本身的終極potential。

再腦洞開一點,如果有一種方式,能夠計算一下人類平均來說有多少卡路里是消耗在「看」相關的行為上,多少是消耗在「聽說讀寫」相關的行為上,估計就是CV和NLP領域的最終「發展前景」大小了。

所以,答案就是,對大多數人來說,CV和NLP是兩個潛力都大到根本不值得你現在去考慮選誰的領域。

就像你現在考慮是嫁給鹿晗還是嫁給井柏然...

12樓:李虎

瀉藥。我更看好計算機視覺。

資料:與影象,音訊不同,『自然語言』 不是自然訊號,而是一種特殊的人工訊號,本質上是不太適合用NN做pattern extraction的。

應用:自然語言作為人工智慧的介面,當然十分重要,但當前階段無非就是拿字串當做label。據我所知,現在連乙個比較make sense 的 sentence level embedding 都沒有.

cv的應用潛力極大, AmazonGo,Self Driving Car.以上

13樓:醒了就去看文獻

私以為目前這兩個都太火太普遍了。。前景來說還是方興未艾的生物資訊學吧更新於一年半以後

身邊北美bioinfo的一年級phd學長也開始打算quit了歷史的程序走得太快了……

14樓:野白樹根

cv目前商業應用較為成熟,比如人臉識別等,處於乙個平穩的發展期(拓寬應用場景,提高識別精度等)。

而nlp則比較尷尬(不包括語音識別),現在比較常見的任務,比如機器翻譯,自動摘要等,效果都不太理想,只能作為人工的輔助工具(計算機輔助翻譯等)。

從學術角度講,我個人認為nlp更有挑戰性,因為nlp下一步必然是向nlu發展的,結合語言學,認知科學,神經科學等,而這些也許就是通往人工智慧的道路。

為什麼相比於計算機視覺 cv ,自然語言處理 nlp 領域的發展要緩慢?

我覺得計算機視覺的進展也很緩慢 雖然已經能解決一些問題。自然語言處理的問題很複雜,複雜到計算機視覺的規模僅僅是自然語言處理的乙個子模組。計算機視覺早晚也會遇到自然語言處理一樣的瓶頸,而且必須依靠自然語言處理的進步來實現。 特里在納舍科技 語言在於上下文不一樣,會有不一樣的意思,比如 波 在訊號處理裡...

自然語言處理(NLP)和計算語言學之間的區別和聯絡是什麼?

RUBY 一方面,從學科劃分而言,計算機語言學是在語言學領域,一般國內的院校都劃入了人文學院中文系下面,而自然語言處理多在計算機學院 另一方面,兩門學科的應用場景是不一樣的,計算語言學,追求的是乙個統一的模型,能夠解釋語言的生成,探求人腦對語言理解的過程 自然語言處理其根本出發點是為了讓機器能夠理解...

計算機視覺和影象處理有區別嗎?

極視角科技 關於影象處理和計算機視覺的劃分並沒有乙個統一的標準,它們之間存在很多重疊,但又有一些不同,來說說它們的區別吧。影象處理是對輸入的影象做某種變換,輸出仍然是影象,基本不涉及或者很少涉及影象內容的分析。比較典型的有影象變換,影象增強,影象去噪,影象壓縮,影象恢復,二值影象處理等等。基於閾值的...