hmm隱藏狀態是什麼?

時間 2021-06-05 02:17:47

1樓:

挖墳答。看題目描述,題主主要考慮語音方面的應用。

1、HTK文件說hmm訓練資料需要被標註。

語音識別的訓練資料可以在很多不同級別上做標註,例如幀級別(語音的每一幀對應於什麼音素)、詞級別(某一段語音的幀對應了哪個單詞)、序列級別(一整條發音樣本對應了一句什麼話)等。HTK文件說的標註是指【序列】級別的標註。

2、可我不明白EM演算法不是可以無監督學習嗎?

EM演算法確實可以無監督學習,但無監督地學習效果肯定不如有監督學習的效果好。語音識別裡的無監督並不是說完全沒有任何監督訊號,而是想強調沒有【幀】級別的監督訊號(標每一幀太累了,而且需要有語音學知識的人才能完成)。序列級別的監督訊號可以給 EM 演算法乙個很好的初始化(例如某一句話都包含哪些隱狀態,先後順序是什麼,時長分別大約是多少),從而加速訓練收斂。

假如連序列級別的監督訊號都沒有,直接收集一堆語音資料丟給 HMM-GMM,告訴它從資料裡找出 150 個隱狀態,那麼:一方面因為沒有好的初始化,模型收斂會變慢;另一方面缺乏把模型隱狀態和人類知識對齊的途徑,即便模型收斂了也不一定能給每個隱狀態找到乙個鮮明的物理意義(例如某個隱狀態 s 代表了 /t/ 的除阻階段的聲學特徵)。

標註的問題在 1 裡已經說清楚了。不過這裡再補充幾句:

i)即便有了幀級別的標註,有標註和隱藏序列也不矛盾。隱狀態是一種對資料生成方式的建模,它認為資料生成分兩步,先選取乙個隱狀態,然後從隱狀態生成觀測結果。隱藏是說【推斷】的時候你只能看到觀測序列而看不到隱狀態序列,但這不影響【訓練】的時候把隱狀態暴露給你。

比如說把音素當成隱狀態,乙個接受過語音學訓練的人就可以對著語譜圖把訓練資料的音素序列標出來,但推斷的時候只能模型自己上,不能再找個人標音素序列。如果訓練的時候把隱狀態暴露給你,就叫有監督訓練;如果訓練的時候不把隱狀態暴露給你,就叫無監督訓練。

ii) 人工設定 HMM 狀態數和拓撲結構的時候引入了語音學知識,並且我們希望模型能夠學到這些知識(即HMM隱狀態能跟我們希望它表示的音素對應上)。但模型實際學習的效果到底是不是這樣是沒法保證的(例如我們本意想讓某個 HMM 狀態對應於乙個音素的開始階段,結果模型實際學到的結果是一點點靜音+該狀態對應音素的開始階段),只能說通過大量資料的調整、精心設計的訓練流程,模型學到的狀態和我們期望它所具有的含義往往是一致的。

Faker 是狀態差還是隱藏實力?

Lzm666 Faker的最強能力體現在對線的絕對壓制力。但是當前乃至近幾個版本,都不是乙個位置的人風生水起就能夠決定整局比賽輸贏的。 灌籃高手小凌 首先第一點faker是打了很多年頭了狀態確實有些下滑了,但是看了一圈下來你們是不是有問題沒搞明白faker打了多少年了,當年faker出道即巔峰送走了...

19歲的你是什麼狀態,應該是什麼狀態?

仄言 應該是什麼狀態我不知道,我只知道自己很迷茫。要死的是我知道自己這樣不對,不應該這樣下去,但最後還是把自己困在了自己劃的舒適圈裡不願意出去。 努力搬磚,早上趕著朝陽,夜晚趕著星光,孤獨的為了生存,生活。前路漫漫,家庭不好,索性工作上公升空間大,自己之前也還算努力,勉勉強強能不靠著父母了。希望自己...

狼人殺網殺的隱藏規矩是什麼?

ignite 1.不貼臉。不賭咒發誓,什麼 我要是狼人,我直接解除安裝遊戲。這種肯定不行的。不要罵人。比如你是好人被推出去了,不要 問候 其他人。或者被推出去了,然後氣哭,無論是真氣哭還是做作地演,都破壞了這個遊戲的公平與規則。2.不要場外。比如你是女巫,讓和你對跳的狼描述一下女巫牌長什麼樣?你讓人...