在做主成分分析（pca）時，選取的主特徵是原來資料的哪些特徵呢？

1樓：終不似少年遊

PCA實際是一次相似變換，變換之後的特徵不再是原始特徵了，舉個例子:

原始資料好比是一張被揍成豬頭的臉，pca相當於是一套「還我漂漂拳」，經過這一套線性拳擊變換以後你驚奇的發現，原來這個豬頭是秋香。

PCA就是這麼神奇，將原本雜亂無章的資料特徵通過一系列計算之後得到在你認知範圍的資料，並且降低了特徵維度。

用一句數學語言需要概括就是: 找到一組基向量，使得能夠對角化原始資料的協方差矩陣。

2樓：想戒咖啡

依照你的例子10*10->10*2, 簡單的說你打算將10維的資料減低到2維。再看看PCA的作用,PCA是在高緯度空間裡面找兩個維度的variance（方差最大）所以說你降低到2維的這兩個維度擁有方差最大的屬性(這麼說有點抽象).

舉個例子乙個班的同學語文,數學，英語，化學,物理成績。

假設語,數,英大家的成績都差不多都是99~100.化學和物理成績變化比較大80~100之間

你在做pca的時候減低到2維度反應出來的資訊就是化學和物理成績的變化。但是這個例子比較極端，生活中的大部分例子都是之前的回答說的是幾個維度共同決定的結果。

3樓：理查德帕克

PCA所得到的投影矩陣是將原來的資料投影後能最大保留資料方差(資訊)的方向，這是乙個新的空間，每一列可能有對應的具體意義，但是通常而言大家只關心最大的那幾個特徵向量，其實你的問題可以翻譯成:協方差矩陣的每乙個特徵向量到底是什麼含義?這個問題，我也想知道，哈哈！

4樓：Jack Zhao

上面大家說的都很多了，樓主還需要繼續仔細看一看主成分分析的內容，理解有偏差。每一列主成分都是原來資料的線性組合：第一主成分T1=L1*X；第二主成分T2=L2*X，而L1和L2就是強兩列主方向，也就是資料變異方向最大的兩個主方向（這兩個主方向相互正交）。

5樓：雷傑

PCA降維後的特徵並不是簡單的選取了原有特徵中的一部分，而是將原有的特徵進行線性組合，得到新的特徵。然後根據特徵值大小判斷對應特徵的重要性，選取出其中最重要的一部分，即為降維後的特徵。對應題主的例子，降維後的兩列也就是選取了重新線性組合後的十個特徵的最重要的兩列。