唇語可以用技術識別嗎?

時間 2021-06-03 03:30:57

1樓:姚光超

這個已經實現了,效果還行,但是提公升餘地很大,我們搜狗語音組也在嘗試。請參看:谷歌人工智慧唇讀術完虐人類,僅憑5千小時電視節目!人類古老的技藝再次淪陷

2樓:

題主關心的是聾啞人?聾啞人用的是手語。。。

手語識別其實是乙個計算圖形學的問題,比如kinect團隊這方面有所積累。但是這個問題其實還是很有難度的,因為手語涉及到手指語、手勢語和表情的綜合理解。之前在德國薩爾的MCCI(或者是DFKI?

)關注過類似的研究,聾啞人和程式進行互動,程式模擬出來的手語連貫性和準確程度都會差一點,可被理解的程度大概是50-60%。

如果識別唇語的話,我覺得難度應該更大,感覺每個唇部動作的多義性更明顯。

題主還提到了不同的人嗓音不同,speaker recognition還是能做的,比如只有我使用某指令可以觸發某些功能,其他人不行。主要還是調調引數,看你側重的是精確性還是易用性。

如果電腦還得一直監視唇語的話,那就得安好幾個攝像頭了,我覺得這樣。。。挺費電的。

nuance的dragon tv會用攝像頭來判斷屋子裡誰在說話,然後接入靠近那個人的麥克還進行語音識別並讀入指令。(至少某次看他們演示了這個功能,不知道有沒有完全上線)。但是通過攝像頭來判斷使用者具體在說什麼,現階段應該不行,至少沒到能實用的階段。

人臉識別技術是否可以用來發現被拐賣小孩?

可以。這個是學術界最近正在研究的問題,可以使用人臉比對 face verification,人臉識別的子問題 方法來解決 或者使用kinship recognition的方法。兩種方式本質上都是研究相似性度量的。雖然在一些標準資料集上取得了一些效果,但由於現實應用中存在年齡 性別 光照等複雜條件的影...

是否可以用 web font 技術來解決冷僻漢字的顯示問題?

科技表音字 完全可行,為了減少空屏時間,可以用Google的Web Font Loader.例子可見 http biaoyinzi.com 使用超大新創表音字字型檔 齊凡 這個想法是很可行的,我做過測試了。把乙個頁面上所有的生僻字做成乙個web font字型,然後整篇文章設定成這個字型,這樣生僻字自...

欲 可以用 欲 嗎?

欲 應該是正確的 雖然我也不明白 欲 可以用助詞 霓虹人經常使用 欲 這種用法 就算你告訴 欲 用法是錯誤的,但無論是辭典上的記錄還是霓虹人的用法都告訴我們的確可以這樣用,很 迷惑 啊!真的很迷惑! 有個未經證實或證偽的猜想,分享一下 欲 在搶占 欲 的定義域,原因是和英語want的雙語互譯。在一般...