語音合成領域的研究是不是涼涼了?

時間 2021-05-29 23:13:07

1樓:洪浩

我覺的現在的語音應用還是太少,導致語音合成基礎研究沒有更多玩家加入。

但是最近大家已經不滿足語音普通的語音合成了,比如音色、情感、等等方面都提出了更高的要求。

2樓:

我想樓主的意思是說,語音合成在單話者,單語種,朗讀型別上的效果已經很好了,還有必要繼續做研究嗎?

我有限的認知裡,認為語音合成恰恰開始了一次新的征程。無論是在學術界,還是在工業界,都需要繼續工科更多的技術難題和科學難題。

語音合成的效果,我們暫時還沒有辦法靈活的控制音色,語種,情感。將音色,語種,情感融合起來,用乙個系統實現,也仍然有很長的路需要走,這將會是乙個多方面齊頭並進才能實現的工作,包括需要演算法的更新,需要技術的進步,語料的豐富,理念的更新等等。

當可以控制上述特徵是,我們又如何實現更加細粒度的控制?生活中的人,可以交談中迅速的變換態度,語調,韻律等等,如何在詞級別、字級別實現精確的控制,雖然已有很多機構和公司在嘗試,但是仍然需要優化和更新。

此外,與語音合成相關的領域不僅僅是文字到語音這乙個簡單的問題需要解決。

模型的壓縮,合成的加速,低資料資源情景下合成系統的實現,移動端高質量合成的實現,非平行語料下的變聲等等,工業界的問題,學術界的問題都依然廣泛存在。

拼接合成的效果的確聽起來機械,不連貫。端到端的合成基本解決了這個問題,MOS達到4.2是乙個比較能夠讓使用者滿意的效果。

但是在端到端上面如何繼續大做文章,也許是我們需要繼續思考的問題。

3樓:淺笑梨渦

個人覺得目前還不會,

語音合成,相對於高速發展的現在,它的市場空間還是很大的。

不過任何事物都會有它的平淡期,在這段時間根據市場需要,盡可能的滿足快速消費時代的人,它的未來還是很明朗的。

4樓:老艾

正在英國參加ICASSP2019會議,語音合成基本沒人玩了,語音編碼也基本沒人玩了,聲紋識別也是快不行了。語音識別還在走。傳統的語音技術方向,現在都在考慮極為特殊的應用場景,比如環境很吵等。

VRay是不是要涼涼了,是不是用Vray的人越來越少了?

高力 不請自來回答下這個問題,現在市面上的渲染器Vray,Corona最流行,Vray的模擬渲染肯定不如Corona的物理渲染,從光線上就可以看出。但是!在全世界都覺得Corona要取代Vray的時候,Vray的母公司ChaosGroup收購了Corona,Vray最近更新的5.0版本中混合燈光有很...

相親後對方這樣 是不是代表涼涼了?

宅聞天下 有些男生的確很現實,聽說你有弟弟妹妹就覺得拖累,不過大部分男生更看重的還是你人本身,弟弟妹妹後面再說。少部分相親男是還沒玩夠,但大部分則是不擅長追女生,所以女生不要太主動不意味著你乙個主動話題都不開啟全靠對方起頭,他的三板斧使完你還沒啥興趣的樣子,他也會很沮喪,大部分男生如果女生表現出一點...

起點六萬字沒簽約,我是不是基本上涼涼了

呼吸 不要擔心,有我陪你 同六萬單機,我見過三十五萬才簽約 也知道忘語四十萬才簽約 如果是想靠網文吃飯,建議切了 如果純粹是興趣使然,建議第一本堅持下去,全當練筆。沒有大神的天賦,那就踏踏實實一步步,先把文筆提上去。 傻狍子 10W字簽約那叫安慰籤矮子裡面挑將軍同樣的10W字說不定人家已經走完一兩個...