如何畫出影象識別所得到的多元函式影象？

1樓：

把離散的二維畫素點集表示成高維函式，再通過降維或者直接擬合乙個高維函式並不是乙個好做法，原因在於：

1）畫素點個數不定，難以處理

2）畫素點順序會變化，這就要求你想要擬合的函式對每個變數都是對稱的，這是個很強但是也很難處理的constraint

Vision中通常的處理方式是直接把影象看成是由某個隨機分布生成的二維點集合，不同的數字（符號）對應不同的隨機分布。如果從生成式模型的視角來看，你需要的是通過這些影象來估計你的分布，混合高斯分布，CRF甚至樸素貝葉斯都可以拿來做這件事。如果從判別式模型的角度來看，你只需要找到不同分布的判別面就行，SVM、LR也都可以用來做這個事情。

乙個可行的，簡單的但是效果未必好的方法是，根據影象（二維畫素點集合）間的切空間距離做聚類，每個cluster的類別對應這個cluster中最most common label, 對於新的影象，找距離他最近的聚類對應的標籤作為prediction.

2樓：Minchern

這張圖來自SCAPE: Shape Completion and Animation of People [Anguelov et al. 2005]，是他們用乙個人體三維模型資料庫裡的所有各種體型相同姿勢的人體模型來做PCA，然後按上述方法把前四個重要的維度視覺化出來得到的效果。

我們可以看到這前四個維度分別大致表徵了人體的「weight

and height, gender, abdominal fat and chest muscles, and bulkiness of the chest versus the hips」。我想同label的數字影象這樣處理後也會有類似的效果吧。

3樓：

這個...

n<=3的話可以直接用平面或者空間直角座標系表達。

n = 4，且有一維設定在有限區間(a,b)上的話可以設定成時間維度，設定乙個三維直角座標系，隨著時間的t的進展，比如把(a,b)分割為N份，每一秒鐘進1格，這樣的話剩下三個維度在這個t值下面會有乙個三維影象，把它畫出來就行了。

n=5，且有兩個維度是有限區間（a,b)x(c,d)那麼可以設定乙個網格，把(a,b)x(c,d)這個長方形劃分成N^2個小網格，其中分割點為, 其中i=1,2,3,..,K , j = 1,2,3,...,L, 則每次選取不同的I,J可以有一條三維直線，把它畫出來即可。

n>5 則以此類推，設定三維，四維或者更高維的網格，每次取點，依據點位畫三維曲線。

如果是線性方程的話，矩陣秩小於等於3的話可以有一條曲線或者曲面表達解空間，這個也是可以的。

其實只要維數高於3，就不可以直觀表達出來，畢竟人類只能感知三維。

暫時只想到一些簡單的情況...

如何畫出影象識別所得到的多元函式影象？

影象識別創業,現階段的影象識別技術可以運用到哪些行業呢？

dsp和stm32哪個適合影象識別？

Android開發者，想轉行影象識別，需要學習哪些知識？

其他用戶還看了：