有哪些聽起來很普通實際上很高大上的東西?

時間 2021-05-30 12:57:57

1樓:百度

)有一些朋友會覺得,不就是個語音包嗎?明星不是都錄過嗎?有這麼複雜嗎?

嘿,這件事,還真的就挺複雜的。

「錄製湯唯語音包的時候,湯唯可是實實在在的錄入了兩千句語料,用了好幾天時間,很辛苦的。」

作為語音定製專案的發起人,際洲說,如果說我們普通人的一生中曾經享受過什麼「超明星待遇」的話,個性化語音包的製作絕對可以算得上乙個了。

那麼,究竟是什麼樣的技術,讓我們在同一件事的效率上,提公升到了明星的百倍呢?

很快,際洲找到了乙個答案:

「在一次會議上,一名同學說:『我特別希望有一天我能用語音合成技術,把自己的聲音變得逼真,這樣我的女兒就能每天都聽著我的聲音入睡了,不在家的時候也能給她講故事。』」

這樣的技術情懷感染了際洲,不久之後,際洲也公升級成為了爸爸,當寶寶七八個月大時第一次喊出「爸爸」時,際洲瞬間理解了同事的感受。

「我當時覺得這就是世界上最美的聲音,沒有為人父母的時候是很難體會到這種情感的。所以我突然在想,如果以後我開車的時候,導航的聲音是我家寶寶該有多好。」

能否通過 AI 技術,為每個人定製乙份屬於自己的語音包呢?

體會了做爸爸的感受的際洲,從家人的聲音中感受到了幸福,也就是在此時,「語音定製功能」的創意在際洲心中開始萌芽。

有了初步的想法後,際洲正式向上級申請,提出了定製地圖語音包的想法,也得到了從技術層面具備可行性的肯定答案。

技術上雖然有可行性,但執行起來困難非常多。

首先,定製表情包在過去之所以是「明星專屬」,是因為其需要在專業的錄音棚裡錄製大量語料,製作時間長達幾個月。

而要完成際洲的這個想法,需要用使用者的手機作為錄音工具,市場上的手機型號千差萬別,錄音環境也不確定,怎麼保證使用者上傳的語料資訊是合格的呢?

更重要的是,能否徹底顛覆過去需要錄製幾千句語料才能製作語音包的高門檻,改進成只需要使用者錄製寥寥數句語料即可生成出與發音人聲音高度逼真的語音包?際洲及專案組的同學們自己心裡也沒底。

方向明確後,專案組成員們分頭從技術和產品層面行動,各自調研、各自開發,同時相互同步、相互支援。在確認產品 demo 的效果後,大家定下了發布會的時間,倒逼著所有人去推進。

負責語音技術的同學們,為了趕進度頂著壓力夜以繼日,事後在開慶功會的時候,大家分享了共同的心路歷程:「既然答應了際洲,每次推進中遇到搞不定或者難度太大的問題,就會想到說承諾的事情得做到才行。」

在經歷了技術與產品之間的反覆權衡後,專案組最終確認了使用者需要上傳的語料數量——20句,而且都是幾秒鐘的短句,在幾分鐘內就可以錄完。為了測試這項產品,專案組的同學們找了身邊好多人來測試實際效果。

際洲印象最深也是最成功的一次「使用者內測」,發生在自己家裡。

為了驗證生成的語音到底像不像,際洲一次下班回家時直接帶上了接近發布版本的產品。因為老婆忙著帶娃,際洲就找岳父幫忙錄了乙個語音包。

切換語音包的瞬間,房間裡響起了際洲岳父語音包的聲音——「定製語音包設定成功」,這句話話音還沒落,家裡不到兩歲的寶寶立馬喊了一句「姥爺~」。

「我當時就覺得這個事兒成啦,這麼小的寶寶也不會說謊,一定是真的認出了姥爺的聲音。」提起自家寶寶的真實使用者反饋,作為專案負責人的際洲還是開心得不行。

事實上,覺得語音包很逼真的使用者,不只是際洲家裡的小寶寶。在後來的大規模內測中,大家的打分也證實定製語音包的逼真度已經超過了90%。這樣的資料,讓專案組的同學們也一下子有信心了,踏實了。

語音定製功能正式上線後,同學們的心思就牢牢被使用者反饋拴住了,到底產品好不好用,到底還是要使用者投了票才最安心。

「我其實都沒想到過還可以這麼用。」際洲感慨說,「這些真真實實的使用者反饋,對我是特別大的認可和激勵,怎麼說呢,那一瞬間的美好感受是其他任何獎勵都無法比擬的。」

「概括地說,我們幹的事情就是技術驅動的差異化產品創新體驗。」

實現夢想的過程中,每乙個參與成員的角色和作用都很重要。語音技術、地圖、市場,法務,以及來自 PM、UE、OP、QA、運營、系統部、AI 技術生態部、安全部等團隊的同學們,穩穩地組建起了乙個靠譜的戰隊。

最重要的是,戰鬥力是會傳染的。從上游到下游,每一部分的負責同學,都在把最好的一環往下傳,這是對彼此最好的鼓勵和打氣,最終把最好的結果傳給使用者,也是大家肩負的最大責任。

「真實的測試情況下,意想不到的困難會源源不斷地襲來,這個時候需要的就是無條件地信任,誰都不甩鍋不後退,一起想辦法解決。」

在未來,我們也許不僅能定製語音包,還能定製語音包主人和車主的關係!打個比方——那些用自家寶寶語音包的爸爸們,啟動導航時聽到的就不是「導航開始」了,而是超萌的「爸爸咱們出發吧!」

在我們不知不覺中,AI 對生活的改變正在慢慢發生。

有哪些聽起來很歡快實際上很悲傷的歌曲?

竹田 子守唄。被重新填詞變成了 祈禱 歌詞特別暖心,但小時候第一次聽就覺得不太對勁,調子涼冰冰的,歌詞背後像是有什麼東西讓人極不舒服。一直到兩年前,我才知道這首歌原來是翻唱的,原詞如下 守 守著孩子已經厭倦了,盆 先 盂蘭盆節來到前,雪雪已經飄了,子 泣 孩子也在哭。盆 來 盂蘭盆節到了,何 有什麼...

有哪些聽起來很浪漫,實際上很殘酷的事?

吾笑我 大學畢業時有人打著不想錯過的名號在寢室樓下表白,說什麼沉默了四年終於鼓起勇氣在最後的時刻牽你的手,只為了今生不再錯過。屁嘞,一群生計與前途都還沒著落的愣頭青懂個屁啊,不過是眼看著就要各奔東西了,想打個免費炮後提褲子走人罷了,真以為那麼多的愛在心頭口難開? 再也沒有以後 你愛的人口中的等待。等...

有什麼行業聽起來高大上,實際上薪酬少的可憐?

Young 寵物行業 寵物行業看似暴利高階,轉診動物醫院特別豪華大氣,總覺著工資很高,實際工資少的可憐一般的獸醫助理基本都是乙個月200 240個工時工資永遠叫不上稅資深助理能夠到達稅後收入。醫生如果是住院醫上不了門診的那種也達不到交稅水平,上了門診上個半年一年可能才能達到交稅的實力。PS 任何薪酬...