各位大神,請問主成分分析中自變數可以既包括連續性變數也包括分類變數嗎?

時間 2021-06-05 19:43:18

1樓:陳曦

傳統主成分分析PCA中,要求所有自變數都符合連續性。定序變數,例如李克特量表,你在一定意義上也可以認為是連續性。

如果實在嚴格要求自己,覺得定序變數不能這麼做;並且你的資料中存在分類變數,可以使用分類主成分分析(catPCA)來進行,比較簡單易懂,並且在SPSS內就可以完成。如果需要學習更高層次的,其他軟體的降維,那還可以使用專案反應理論IRT或者一些其他的方法來做。

2樓:劉一刀

這個理論上不建議的

並且還有這個界定,你的分類變數分幾類?

比如你分類變數就分01,那麼這個資料本來就是不適合做因子分析的,你可以把他們當做啞變數單獨處理

如果分很多類呢?比如你分了五類,然後你有很多分類變數,從資料上來講,你的連續性變數和分類變數應該資料不同型別或者方面的資料,然後主成分就是物以類聚人以群分嘛,所以你放一起聚類也是可以的

如果你的連續性變數和分類變數如果屬於不同資料型別,比如連續性變數是自變數,分類變數是因變數,那一般是要分開做因子分析的

PCA(主成分分析)和EOF(經驗正交函式分解)有什麼區別?

tina 我理解的PCA和EOF都是一回事,EOF本身就是多元統計分析中的主分量分析PCA在氣象場序列中的應用,多元正態變數X x1,x2,x3,xp 可理解為空間上網格點資料序列,也可理解為任何一組具有不同物理意義的多元正態變數。EOF著重是分解,對於任一網格點的原序列而言,X LY將氣象場要素X...

如何通俗易懂地講解什麼是 PCA 主成分分析?

白瞳西伯利亞騎士 橫看成嶺側成峰,遠近高低各不同。樣本的差異資訊分散在各個維度上,旋轉一下角度,原來分散的樣本資訊集中到了少數新維度上,捨棄其他維度,資訊損失很少,達到降維的目的。樣本差異資訊就是方差,新的維度就是主成分,是舊維度的線性組合。有多少個舊維度就能構建多少個新維度,彼此不相干,叫作正交。...

主成分分析PCA演算法 為什麼要對資料矩陣進行均值化?

我叫平沢唯 只有居中,才能使均方誤差最小 以下來自位維基百科 多維資料處理之主成分分析 PCA 我叫平沢唯 部落格園 劉理理 PCA可以從SVD演變過來,SVD其實就是在單位圓上找乙個向量,讓資料X在其上的投影的長度平方和最大化,非中心化時中心偏移了 0,0 這時候也可以找那個最大化投影,但不能準確...