各位大神，請問主成分分析中自變數可以既包括連續性變數也包括分類變數嗎？

1樓：陳曦

傳統主成分分析PCA中，要求所有自變數都符合連續性。定序變數，例如李克特量表，你在一定意義上也可以認為是連續性。

如果實在嚴格要求自己，覺得定序變數不能這麼做；並且你的資料中存在分類變數，可以使用分類主成分分析（catPCA）來進行，比較簡單易懂，並且在SPSS內就可以完成。如果需要學習更高層次的，其他軟體的降維，那還可以使用專案反應理論IRT或者一些其他的方法來做。

2樓：劉一刀

這個理論上不建議的

並且還有這個界定，你的分類變數分幾類？

比如你分類變數就分01，那麼這個資料本來就是不適合做因子分析的，你可以把他們當做啞變數單獨處理

如果分很多類呢？比如你分了五類，然後你有很多分類變數，從資料上來講，你的連續性變數和分類變數應該資料不同型別或者方面的資料，然後主成分就是物以類聚人以群分嘛，所以你放一起聚類也是可以的

如果你的連續性變數和分類變數如果屬於不同資料型別，比如連續性變數是自變數，分類變數是因變數，那一般是要分開做因子分析的

PCA（主成分分析）和EOF（經驗正交函式分解）有什麼區別？

tina 我理解的PCA和EOF都是一回事，EOF本身就是多元統計分析中的主分量分析PCA在氣象場序列中的應用，多元正態變數X x1,x2,x3,xp 可理解為空間上網格點資料序列，也可理解為任何一組具有不同物理意義的多元正態變數。EOF著重是分解，對於任一網格點的原序列而言，X LY將氣象場要素X...

如何通俗易懂地講解什麼是 PCA 主成分分析？

白瞳西伯利亞騎士橫看成嶺側成峰，遠近高低各不同。樣本的差異資訊分散在各個維度上，旋轉一下角度，原來分散的樣本資訊集中到了少數新維度上，捨棄其他維度，資訊損失很少，達到降維的目的。樣本差異資訊就是方差，新的維度就是主成分，是舊維度的線性組合。有多少個舊維度就能構建多少個新維度，彼此不相干，叫作正交。...

主成分分析PCA演算法為什麼要對資料矩陣進行均值化？

我叫平沢唯只有居中，才能使均方誤差最小以下來自位維基百科多維資料處理之主成分分析 PCA 我叫平沢唯部落格園劉理理 PCA可以從SVD演變過來，SVD其實就是在單位圓上找乙個向量，讓資料X在其上的投影的長度平方和最大化，非中心化時中心偏移了 0,0 這時候也可以找那個最大化投影，但不能準確...

各位大神，請問主成分分析中自變數可以既包括連續性變數也包括分類變數嗎？

PCA（主成分分析）和EOF（經驗正交函式分解）有什麼區別？

如何通俗易懂地講解什麼是 PCA 主成分分析？

主成分分析PCA演算法 為什麼要對資料矩陣進行均值化？

其他用戶還看了：

主成分分析PCA演算法為什麼要對資料矩陣進行均值化？