聲紋識別演算法有哪幾種？

1樓：卡日曲的狗

一張圖告訴你聲紋識別的演算法有哪些？

補充回答 10-11

知名聲紋技術廠商快商通的AI研發中心總監、快商通聲紋研發團隊的核心成員李稀敏博士在一次專訪中闡述過聲紋識別技術的發展過程，其將聲紋聲紋識別技術的發展總結為3個分水嶺

第乙個分水嶺是2023年。在2023年以前，進行聲紋識別驗證，主要是基於模板匹配，這種演算法基於訊號比對，通常要求比對雙方的內容相同，比如要驗證說「床前明月光」的人是誰，那驗證人也必須要說「床前明月光」才能驗證，如果他說「疑似地上霜」的話，驗證就不能完成。2023年以後，開始出現基於高斯混合模型的聲紋識別演算法，高斯混合模型是典型基於統計學習理論的方法，該演算法採用大量資料為每個說話人訓練模型，使用高斯混合模型驗證已經與文字無關了，即要驗證「床前明月光」的說話人時，說「疑似地上霜」也能夠驗證成功。

之後產生的許多主流研究方法都是在高斯混合模型的基礎上改進的，但高斯混合模型註冊語音的時間過長，無法滿足實際應用場景的需求，因此需要新的技術來突破限制。

第二個分水嶺是2023年左右，這時候出現了iVector/PLDA演算法。iVector最大的亮點在於，把語音對映到了乙個固定的且低維的向量上，這意味這所有機器學習的演算法都可以用來解決聲紋識別的問題了，因此這是乙個巨大的進步。PLDA是一種通道補償演算法，因為在iVector中，既包含說話人的資訊，也包含通道資訊，而我們只關心說話人的資訊，所以才做通道補償，目前PLDA是最好的通道補償演算法，但雜訊對結果依然有很大的影響。

第三分水嶺是在2023年，在第十一屆全中國人機語音通訊學術會議上，鄧力分享了他在微軟DNN-based speech recognition的研究結果，將識別率提公升了30%，這將聲紋識別的準確率一下子提公升了乙個層次。DNN能從大量樣本中學習到高度抽象的說話人特徵，並對雜訊有很強的免疫力，至此深度學習被引入業界，國內對聲紋識別技術的關注點也放到了深度學習上。

2樓：Leon晉

樓上提到的都是主流技術，我就再補充幾個，MFCC、Fbank、BNF特徵，GMM-UBM、ivector+PLDA/CDS、GMM+SVM、d-vector最近也挺火的自從谷歌帶起來

聲紋識別演算法有哪幾種？

綠茶有哪幾種？

創業補貼有哪幾種？

劍道架勢有哪幾種？

其他用戶還看了：