交通銀行機械人是如何做到如此智慧型的？

1樓：「已登出」

1、從神經網路和機器學習演算法來看，理論上是能做到的；

2、至於你遇到的這台機械人背後有沒有人工參與，你完全可以測出來的啊，問它一些人類無法回答的問題，比如大數乘法、瞬間記憶、絕對音感等等；

2樓：Xingyu Na

瀉藥。語音合成＋識別從業多年。

1、排名2和3的答案已經把系統圖貼出來了，應該很有說服力了2、從機械人說話的感覺看，不是語音合成，至少不是我們常說的所謂TTS。現在國內做得效果最好的是迅飛，捷通也還可以，但自然度不如迅飛。這個機械人說話的效果，應該是人聲做了變聲的結果。

3、從語義理解的效果看，這貨絕對能過圖靈測試啊！中國CS的春天來了啊！快去送測！準備好軟文！

4、語音識別就不說了吧，營業廳雜訊、混響等等，喝喝

3樓：iceage123

絕B不是電腦自己生成的對話。。。。那個語言韻律就不是電腦合成得來的，而且語音識別的速度未免也太快了！甚至它說話的時候人再跟它講話，它都能正確識別然後給出回應。

這個就是人工的智慧型，不是人工智慧。

4樓：軒尼詩道

瀉藥，明天，營業部就正式上了一台，這個東西已經不是什麼新技術了，連到網際網路裡面，跟Siri原理一樣，跟去年春節，奶茶弄得小冰一樣，跟原來校內網上的小黃雞沒事區別，只是放在了不同的渠道上面。

5樓：趙elly

我覺得以目前水平做出來的機械人，基本上只能做到簡單的能聽會說功能，這個功能依託於背後的中遠場的語音識別技術，語義分析/理解和語音合成功能。如果分清楚某個特定的人，那還會增加一項說話人識別（也就是樓上朋友說的聲紋識別功能）。每個功能模組效能的還壞直接決定了該機械人的使用體驗。

個人感覺這些技術目前都還不太成熟，實際體驗遠遠達不到宣傳中的那種效果：

1）首先是語音識別的準確性問題。當背景雜訊存在或者是多說話人同時說話是，機械人都不太能識別得到使用者說話的內容，這會導致機械人後續一連串的反饋不符合使用者的心意。另外乙個問題是遠場的問題，當使用者發指令的位置離機械人較遠的時候，體驗也會比較差。

2）語義分析/理解的歧義性問題。同樣的一句話，自然人理解起來都需要根據上下文分析，得到正確的語義，何況是機器。例如：

「你真行」，在語句「你真行，這麼難的事情你都能做成功」和語句「你真行，這麼簡單的事情都被你搞砸了」中，意義是不一樣的。我只列出了一種問題，其餘的可能還有很多問題。

3）語音合成（即TTS）自然度的問題。一般來說，經過TTS合成出來的語音，都存在不自然的問題。

4）聲紋識別技術，需要一些說話人語料去註冊聲紋，但是依然達不到指紋識別和人臉識別的精度。一旦說話人的發音特性（如感冒、喉嚨痛等）改變了，識別率嚴重下降。

另外一些變聲技術等，可能都不是主要的技術難點。