神經網路能夠學到0意味著資料缺失嗎?

時間 2021-06-06 18:12:51

1樓:孫佳偉

"缺失值設定為0是安全的,只要0不是乙個有意義的值"

其實,說到底只是編碼的問題。

0不是乙個有意義的值,是說原先的特徵列中沒有0值。那麼這裡用0填充缺失值則是一種編碼方式,用來表示缺失值,而沒有其數值含義

如果是類別特徵,那麼一般後續還會做一步One-Hot編碼,那麼這裡用0還是別的就更無關緊要了

2樓:劉巨集

下方分割線以下是我前面寫的內容。但是我實在寫不下去了,所以就停下來,來到了這裡。

題主寫的這一段應該來自於某段翻譯過來的文字?

應該說,這段翻譯不是最好的。過份一些說,翻譯得,有不太負責任,的嫌疑。

要基於這段翻譯文本來解釋清楚,實在是費力不討好,哈哈

別怪我這麼說。

這樣吧,建議題主還是更關注原著,和領域的基本概念。打好基本功還是很重要的。

當然,如果有更多的上下文,能夠對照,有可能容易一點點。但是已經不重要了。

放棄這篇翻譯過來的「二手貨」好了,如果是我的話。

先複寫一下題目,能夠看得懂:

一般來說,對於神經網路,將 UNK 設定為0是安全的,只要0不是乙個有意義的值。網路能夠從資料中學到「0意味著 UNK」,並且會忽略這個值。

說實話我是看了好幾遍才明白過來的。

其中 UNK 是乙個常用的符號,表示在資料集中出現次數很低的資料。

那麼,1、所謂「設定為0」。我的理解,乙個可能是,使用 UNK 符號,並將其 id 設定為0。這個背景是使用 embedding而不是 one-hot。

......不行,我寫不下去了。

卷積神經網路和BP神經網路的關係?

乙個維度的BP神經網路就相當於CNN中的全連線了,無非是多幾個全連線,CNN是二維,二維如果搞成全連線就導致運算量巨大,所以有了權重共享,大大減少了運算量,CNN卷積的思想肯定也源於BP神經網路就,在影象上做二維卷積的CNN發出炫目的光芒下,BP神經網路就已經快被人們遺忘了,但是不管CNN再怎麼發展...

卷積神經網路(CNN)和迴圈神經網路 RNN 有什麼區別?

不存在的1990 從字面區分 cnn 裡面的 c指 convolutional operation,是一種提取影象特徵方法。把這一operation加入到layer裡面構成了convolutional layer。rnn裡的r 指recurrent,中文是重複的意思。rnn構造的結構也是recurr...

如何看待人工神經網路ANN和脈衝神經網路SNN的發展?

十萬個為什麼 SNN起源於人類對生物神經網路的解剖,是一種機理模型 ANN是一種工程模型,架構上源於生物學基礎,但是又採用了數值優化的方法進行求解。當前的科技發展水平下,ANN更實用,可以解決很多實際問題,而SNN在功能性角度方面遠遠弱於ANN。從發展前景方面,ANN顯然不及SNN,因為生物神經網路...