交通銀行機械人是如何做到如此智慧型的?

時間 2021-06-02 09:35:39

1樓:「已登出」

1、從神經網路和機器學習演算法來看,理論上是能做到的;

2、至於你遇到的這台機械人背後有沒有人工參與,你完全可以測出來的啊,問它一些人類無法回答的問題,比如大數乘法、瞬間記憶、絕對音感等等;

2樓:Xingyu Na

瀉藥。語音合成+識別從業多年。

1、排名2和3的答案已經把系統圖貼出來了,應該很有說服力了2、從機械人說話的感覺看,不是語音合成,至少不是我們常說的所謂TTS。現在國內做得效果最好的是迅飛,捷通也還可以,但自然度不如迅飛。這個機械人說話的效果,應該是人聲做了變聲的結果。

3、從語義理解的效果看,這貨絕對能過圖靈測試啊!中國CS的春天來了啊!快去送測!準備好軟文!

4、語音識別就不說了吧,營業廳雜訊、混響等等,喝喝

3樓:iceage123

絕B不是電腦自己生成的對話。。。。那個語言韻律就不是電腦合成得來的,而且語音識別的速度未免也太快了!甚至它說話的時候人再跟它講話,它都能正確識別然後給出回應。

這個就是人工的智慧型,不是人工智慧。

4樓:軒尼詩道

瀉藥,明天,營業部就正式上了一台,這個東西已經不是什麼新技術了,連到網際網路裡面,跟Siri原理一樣,跟去年春節,奶茶弄得小冰一樣,跟原來校內網上的小黃雞沒事區別,只是放在了不同的渠道上面。

5樓:趙elly

我覺得以目前水平做出來的機械人,基本上只能做到簡單的能聽會說功能,這個功能依託於背後的中遠場的語音識別技術,語義分析/理解和語音合成功能。如果分清楚某個特定的人,那還會增加一項說話人識別(也就是樓上朋友說的聲紋識別功能)。每個功能模組效能的還壞直接決定了該機械人的使用體驗。

個人感覺這些技術目前都還不太成熟,實際體驗遠遠達不到宣傳中的那種效果:

1)首先是語音識別的準確性問題。當背景雜訊存在或者是多說話人同時說話是,機械人都不太能識別得到使用者說話的內容,這會導致機械人後續一連串的反饋不符合使用者的心意。另外乙個問題是遠場的問題,當使用者發指令的位置離機械人較遠的時候,體驗也會比較差。

2)語義分析/理解的歧義性問題。同樣的一句話,自然人理解起來都需要根據上下文分析,得到正確的語義,何況是機器。例如:

「你真行」,在語句「你真行,這麼難的事情你都能做成功」和語句「你真行,這麼簡單的事情都被你搞砸了」中,意義是不一樣的。我只列出了一種問題,其餘的可能還有很多問題。

3)語音合成(即TTS)自然度的問題。一般來說,經過TTS合成出來的語音,都存在不自然的問題。

4)聲紋識別技術,需要一些說話人語料去註冊聲紋,但是依然達不到指紋識別和人臉識別的精度。一旦說話人的發音特性(如感冒、喉嚨痛等)改變了,識別率嚴重下降。

另外一些變聲技術等,可能都不是主要的技術難點。

Git commits歷史是如何做到如此清爽的?

汪志成 Angular開發組有乙個很明確的commit規範,包括英語語法要求之類的都給你講清楚了,不想研究的話直接follow就行了。至於時間線方面,rebase已經是常規的開發習慣了,只是有些場合有坑,坑不多,自己用用,避開就是了。 程墨Morgan 要求功能分支進入master branch必須...

明星是如何做到如此高強度的練習的?

可能是豬吧 張藝興的嚴格,對練習生的不滿意,都說明他經歷的,承受的,要比那些練習生多得多 不為別的,自己選的路跪著也要走完,為自己驕傲 XXX 明星也不是超人,但是現在藝人的競爭真的很激烈。長的好看的人很多,所以藝人都知道實力很重要,實力也是最基本的。而且,當練習生的投入真的很高相當於燒錢,付出相對...

Pepper 機械人是如何識別人的情緒的?

夢旅人 觸覺感應系統和類似內分泌系統的多層神經網路是pepper系列機械人的核心支撐點 從觸覺感應系統說起 pepper體內被植入可以感知溫度 空氣濕度,以及外界壓力變化的觸控系統,在這套裝置的幫助下,pepper就有了和人類類似的感知系統 陳一佳 在某種程度上,機械人識別語音語言的可能會比人類更有...