在做主成分分析(pca)時,選取的主特徵是原來資料的哪些特徵呢?

時間 2021-05-30 17:58:13

1樓:終不似少年遊

PCA實際是一次相似變換,變換之後的特徵不再是原始特徵了,舉個例子:

原始資料好比是一張被揍成豬頭的臉,pca相當於是一套「還我漂漂拳」,經過這一套線性拳擊變換以後你驚奇的發現,原來這個豬頭是秋香。

PCA就是這麼神奇,將原本雜亂無章的資料特徵通過一系列計算之後得到在你認知範圍的資料,並且降低了特徵維度。

用一句數學語言需要概括就是: 找到一組基向量,使得能夠對角化原始資料的協方差矩陣。

2樓:想戒咖啡

依照你的例子10*10->10*2, 簡單的說你打算將10維的資料減低到2維。 再看看PCA的作用,PCA是在高緯度空間裡面找兩個維度的variance(方差最大)所以說你降低到2維的這兩個維度擁有方差最大的屬性(這麼說有點抽象).

舉個例子乙個班的同學語文,數學,英語,化學,物理成績。

假設語,數,英大家的成績都差不多都是99~100.化學和物理成績變化比較大80~100之間

你在做pca的時候減低到2維度反應出來的資訊就是化學和物理成績的變化。但是這個例子比較極端,生活中的大部分例子都是之前的回答說的是幾個維度共同決定的結果。

3樓:理查德帕克

PCA所得到的投影矩陣是將原來的資料投影後能最大保留資料方差(資訊)的方向,這是乙個新的空間,每一列可能有對應的具體意義,但是通常而言大家只關心最大的那幾個特徵向量,其實你的問題可以翻譯成:協方差矩陣的每乙個特徵向量到底是什麼含義?這個問題,我也想知道,哈哈!

4樓:Jack Zhao

上面大家說的都很多了,樓主還需要繼續仔細看一看主成分分析的內容,理解有偏差。每一列主成分都是原來資料的線性組合:第一主成分T1=L1*X;第二主成分T2=L2*X,而L1和L2就是強兩列主方向,也就是資料變異方向最大的兩個主方向(這兩個主方向相互正交)。

5樓:雷傑

PCA降維後的特徵並不是簡單的選取了原有特徵中的一部分,而是將原有的特徵進行線性組合,得到新的特徵。然後根據特徵值大小判斷對應特徵的重要性,選取出其中最重要的一部分,即為降維後的特徵。對應題主的例子,降維後的兩列也就是選取了重新線性組合後的十個特徵的最重要的兩列。

PCA(主成分分析)和EOF(經驗正交函式分解)有什麼區別?

tina 我理解的PCA和EOF都是一回事,EOF本身就是多元統計分析中的主分量分析PCA在氣象場序列中的應用,多元正態變數X x1,x2,x3,xp 可理解為空間上網格點資料序列,也可理解為任何一組具有不同物理意義的多元正態變數。EOF著重是分解,對於任一網格點的原序列而言,X LY將氣象場要素X...

主成分分析PCA演算法 為什麼去均值以後的高維矩陣乘以其協方差矩陣的特徵向量矩陣就是「投影」?

WEARE 簡單點來講,把PCA轉換成乙個contrarined optimization的問題,使用lagrange multiplier,會發現剛好eigenvector的方向會讓variation最大. PCA的目的就是將樣本點 向量 向資料方差最大的方向投影,而樣本協方差矩陣的特徵向量就是方...

如何通俗易懂地講解什麼是 PCA 主成分分析?

白瞳西伯利亞騎士 橫看成嶺側成峰,遠近高低各不同。樣本的差異資訊分散在各個維度上,旋轉一下角度,原來分散的樣本資訊集中到了少數新維度上,捨棄其他維度,資訊損失很少,達到降維的目的。樣本差異資訊就是方差,新的維度就是主成分,是舊維度的線性組合。有多少個舊維度就能構建多少個新維度,彼此不相干,叫作正交。...