什麼是稀疏特徵 Sparse Features

1樓：

首先什麼是稀疏特徵？在這之前先看看稀疏表示。

從乙個簡單的例子說起，相信大多數人學過線性代數或者矩陣論之類的課程吧，再線性代數中，最初始的時候就會學到關於如何判斷一大堆向量線性的相關或者不相關性，進而確定一組線性無關組。這裡比如說空間中乙個向量X是乙個三維座標點吧，用(x,y,z)表示。假設現在有一堆點X1(1,0,0);X2(0,1,0);X3(0,0,1);X4(4,3,5);X5(2,1,4)……等等吧，那麼我們是不是可以找到這一大堆向量的最大線性無關組其實就可以用X1,X2,X3來表示，其他的任何向量Xi都可以用這三個向量來線性表示，當然用X1,X2,X3來表示任何乙個向量來表示是最簡單情況，你乙個向量同樣可以用X1,X2,X3,X4,X5來表示，不過這個多兩個待確定係數而已。

好了現在假設我們已知有X1~X10這十個向量，那麼同空間中有乙個向量我們就可以用X1~X10這十個向量線性表示，就有10個待確定係數。但是我們事先是知道乙個向量只需要用X1,X2,X3來表示即可了，那麼我們可以讓上面需要確定的10個引數中的後7個引數約束為0即可，那麼其實這個過程就是一種稀疏表示思想。

可以看出稀疏表示就是找到空間中的一組基，用這組基可以擴充套件到空間中的任何向量。

稀疏表示的好處在於降低表示複雜度，更直白的原因其實就是減少係數引數，通過稀疏表示，可以充分發揮資料所含有的資訊，去掉冗餘的資料資訊，達到最大化利用資料，這一點是非常重要的。

被稀疏表示的特徵即是稀疏特徵。

參考：深度學習系列（四）：什麼是稀疏編碼 - CSDN部落格

2樓：周培

請問，對於分類問題，對提取的影象特徵採用稀疏編碼的方法，首先得到稀疏字典，然後得到稀疏係數矩陣，那麼接下來，如何使用這些稀疏稀疏矩陣進行分類呢？？

3樓：

我來舉個具體的例子吧 ! 我們將每個樣本表示成乙個10000維的向量 ,

下面是某個樣本的向量表示:

0 123:0.122519644924 2097:0.0707110935549

0代表類別標籤 , 123和2097就是feature index , 後面的數就是特徵表達

也就是說這個向量在123和2097維上有資料其餘都是0 假如每個維度上都有值 , 本來是在10000個維度上來表達這個樣本, 而現在只有兩個維度上有效地表達了這個樣本, 你說, 特徵是不是超級稀疏啊

4樓：

feature index is much larger than the actual number of non zero features.

什麼是稀疏特徵 Sparse Features

特徵稀疏是指特徵值過多還是過少？

為何稀疏特徵不適合使用樹演算法？

稀疏表達的意義在於？為什麼稀疏表達得到廣泛的應用？

其他用戶還看了：