如何畫出影象識別所得到的多元函式影象?

時間 2021-05-06 01:55:01

1樓:

把離散的二維畫素點集表示成高維函式,再通過降維或者直接擬合乙個高維函式並不是乙個好做法,原因在於:

1)畫素點個數不定,難以處理

2)畫素點順序會變化,這就要求你想要擬合的函式對每個變數都是對稱的,這是個很強但是也很難處理的constraint

Vision中通常的處理方式是直接把影象看成是由某個隨機分布生成的二維點集合,不同的數字(符號)對應不同的隨機分布。如果從生成式模型的視角來看,你需要的是通過這些影象來估計你的分布,混合高斯分布,CRF甚至樸素貝葉斯都可以拿來做這件事。如果從判別式模型的角度來看,你只需要找到不同分布的判別面就行,SVM、LR也都可以用來做這個事情。

乙個可行的, 簡單的但是效果未必好的方法是,根據影象(二維畫素點集合)間的切空間距離做聚類,每個cluster的類別對應這個cluster中最most common label, 對於新的影象,找距離他最近的聚類對應的標籤作為prediction.

2樓:Minchern

這張圖來自SCAPE: Shape Completion and Animation of People [Anguelov et al. 2005],是他們用乙個人體三維模型資料庫裡的所有各種體型相同姿勢的人體模型來做PCA,然後按上述方法把前四個重要的維度視覺化出來得到的效果。

我們可以看到這前四個維度分別大致表徵了人體的「weight

and height, gender, abdominal fat and chest muscles, and bulkiness of the chest versus the hips」。我想同label的數字影象這樣處理後也會有類似的效果吧。

3樓:

這個...

n<=3的話可以直接用平面或者空間直角座標系表達。

n = 4,且有一維設定在有限區間(a,b)上的話可以設定成時間維度,設定乙個三維直角座標系,隨著時間的t的進展,比如把(a,b)分割為N份,每一秒鐘進1格,這樣的話剩下三個維度在這個t值下面會有乙個三維影象,把它畫出來就行了。

n=5,且有兩個維度是有限區間(a,b)x(c,d)那麼可以設定乙個網格,把(a,b)x(c,d)這個長方形劃分成N^2個小網格,其中分割點為, 其中i=1,2,3,..,K , j = 1,2,3,...,L, 則每次選取不同的I,J可以有一條三維直線,把它畫出來即可。

n>5 則以此類推,設定三維,四維或者更高維的網格,每次取點,依據點位畫三維曲線。

如果是線性方程的話,矩陣秩小於等於3的話可以有一條曲線或者曲面表達解空間,這個也是可以的。

其實只要維數高於3,就不可以直觀表達出來, 畢竟人類只能感知三維。

暫時只想到一些簡單的情況...

影象識別創業,現階段的影象識別技術可以運用到哪些行業呢?

田志超 我是從事建築能耗模擬和能耗資料分析工作。現在我們在做專案過程中遇到乙個比較大的問題是 能耗模型建模時間過長。其中很大一部分精力是花在由2維CAD圖重新建立3維幾何模型。是否可以利用影象識別技術自動根據CAD圖紙建立3維模型?一般來說CAD圖紙上的標記都是比較完善的,例如門 窗 柱和牆都是比較...

dsp和stm32哪個適合影象識別?

我的結論是 DSP.但是從作者的身份來看,我猜想是成本不敏感的型別.當然我說的成本不敏感是在40塊錢的stm32和80塊錢的dsp中做選擇,而不是一下子上到1k塊錢的dsp.惜命,莫噴.我猜想應該是網上有這樣的聲音 多感測器強調控制,所以要選stm32.搞影象要上dsp.所以才需要 艱難 選擇.實際...

Android開發者,想轉行影象識別,需要學習哪些知識?

懶人元 1.NDK和C 把C 工程移植到Android端 2.OpenCV,這個是基本的影象處理的工具庫 3.OpenGL,簡單了解就好,這個是用來展示影象處理的結果 4.一些簡單的機器學習和深度學習基礎知識,深度學習的話請參考cs231n課程 5.掌握一種或多種深度學習框架,如caffe,tens...