深度學習中為什麼可以通過疊加的RBM提取出高度抽象的特徵?

時間 2021-06-03 02:05:33

1樓:賣糰子的小喵吉

修改之前的答案,之前說的也對,但是不全對。深層的dbn的w無法直接視覺化,但其實也是保留有特徵的,具體可以參考文獻 visualizing higher-layer features of a deep network 爪機沒法給鏈結,抱歉。其實ng的課程也講過相關東西,之前理解不到位,抱歉

新手自答,不知題主所說的疊加RBM是指DBN還是DBM,這兩者是有區別的。然後我想說明的是,其實可以把RBM看成是乙個降維器,PCA可以提取資料特徵 RBM自然可以。而題主想問我覺得可能是RBM疊加後(DBN)為何能抽取不同層次特徵?

抱歉,其實DBN只會將資料特徵保留在第一層的w,而深層w只是高度抽象的特徵的特徵,可能有點繞,不夠做個試驗可以很好看出來這個圖是乙個三層DBN第w1所繪製的,可以看出還是很好的保留了資料的一些特點,

而此圖是w2繪製的,可以看出只是反映了抽象的資訊而已。

2樓:

可以看一下這篇文章http://arxiv.org/abs/1302.3931,

這篇文章提出了乙個資訊抽象原則,從資訊幾何角度,解釋RBM模型對資料的抽象,進而解釋DBN的資訊抽象原理

3樓:

簡單的說:RBM就像你見到文章所說的,是基於統計力學發展出來機器學習技術,統計力學能夠用來描述我們所在的現實世界,而RBM所模仿的是這個世界中生物的神經系統,RBM展現出來的功能,正是人類向自然和和自身(大腦)學習的結果,RBM能夠得到抽象特徵就是很自然的事情。

最後乙個分類器可以使用Logistic Regression、Bayes's、SVM等有監督分類器。

貪心學院 深度學習是很多模型的疊加,這種深度模型跟淺層模型相比有什麼優勢呢?

Hanamaki 有一種說法 在自然語言領域,淺層模型解析的是語法結構,深層模型解析的是語義結構,例如 我愛北京和北京愛我 從語法上來說兩個都是對的,都是主謂賓,但是從意義上來說,第二句不對因為北京是個地點無法有愛這種動作。語義建模 或語義語法 通常與語言建模 或語言語法 相比較,我們現在從二者的定...

深度學習中的深度一詞怎麼理解?

按照 Bengio 的說法,3 層以下為淺層。反之你可以理解為深。Bengio,Y.Learning deep architectures for AI.Foundations and Trends in Machine Learning,2009.2 1 從字面意思理解,深度 是指一種空間關係。後...

為什麼目前的深度學習 Deep Learning 只是比較成功運用到影象 語音上?

尋常巷陌 在振動訊號上也是比較成功的。深度殘差收縮網路就能夠很好地從含噪振動資料中提取有用特徵,用於機械故障診斷。其實,在很大程度上,問題在於大部分企業不公開裝置監測資料。Minghang Zhao,Shisheng Zhong,Xuyun Fu,Baoping Tang,and Michael P...