因子分析法和獨立成分分析法的區別?

時間 2021-05-29 22:39:46

1樓:

通過主成分分析所得來的新變數是原始變數的線性組合,每個主成分都是由原有P個變數線組合得到,在諸多主成分z中,Z1在總方差中佔的比重最大,說明它綜合原有變數的能力最強,其餘主成分在總方差中佔的比重依次遞減,說明越往後的主成分綜合原資訊的能力越弱。以後的分析可以用前面幾個方差最大的主成分來進行,一般情況下,要求前幾個z所包含的資訊不少於原始資訊的85% ,這樣既減少了變數的數目,又能夠用較少的主成分反映原有變數的絕大部分資訊。如利用主成分來消除多元回歸方程的多重共線性,利用主成分來篩選多元線性回歸方程中的變數等。

通過因子分析得來的新變數是對每乙個原始變數進行內部剖析。打比喻來說,原始變數就如成千上萬的糕點,每一種糕點的原料都有麵粉、油、糖及相應的不同原料,這其中,麵粉、油、糖是所有糕點的共同材料,這正好象是因子分析中的新變數即因子變數。正確選擇因子變數後,如果想考慮成千上萬糕點的物價變動, 只需重點考慮麵粉、油、糖等公共因子的物價變動即可。

所以因子分析不是對原始變數的重新組合,而是對原始變數進行分解,分解為公共因子與特殊因子兩部分。即因子分析就是要利用少數幾個公共因子去解釋較多個要觀測變數中存在的複雜關係,它把原始變數分解為兩部分因素,一部分是由所有變數共同具有的少數幾個公共因子構成的,另一部分是每個原始變數獨自具有的因素,即特殊因子。

1,因子分析中是把變數表示成各因子的線性組合,而主成分分析中則是把主成分表示成各個變數的線性組合。 在主成分分析中,最終確定的新變數是原始變數的線性組合,如原始變數為x1 ,x2 ,. .

. ,x3 ,經過座標變換,將原有的p個相關變數xi 作線性變換,每個主成分都是由原有p 個變數線性組合得到。在諸多主成分Zi 中,Z1 在方差中佔的比重最大,說明它綜合原有變數的能力最強,越往後主成分在方差中的比重也小,綜合原資訊的能力越弱。

2,主成分分析的重點在於解釋個變數的總方差,而因子分析則把重點放在解釋各變數之間的協方差。

3,主成分分析中不需要有假設(assumptions),因子分析則需要一些假設。因子分析的假設包括:各個共同因子之間不相關,特殊因子(specific factor)之間也不相關,共同因子和特殊因子之間也不相關。

4,主成分分析中,當給定的協方差矩陣或者相關矩陣的特徵值是唯一的時候,的主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉得到不到的因子。

5,在因子分析中,因子個數需要分析者指定(spss根據一定的條件自動設定,只要是特徵值大於1的因子進入分析),而指定的因子數量不同而結果不同。在主成分分析中,成分的數量是一定的,一般有幾個變數就有幾個主成分。

和主成分分析相比,由於因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有優勢。大致說來,當需要尋找潛在的因子,並對這些因子進行解釋的時候, 更加傾向於使用因子分析,並且借助旋轉技術幫助更好解釋。而如果想把現有的變數變成少數幾個新的變數(新的變數幾乎帶有原來所有變數的資訊)來進入後續的分析,則可以使用主成分分析。

當然,這中情況也可以使用因子得分做到。所以這種區分不是絕對的。

總得來說,主成分分析主要是作為一種探索性的技術,在分析者進行多元資料分析之前 ,用主成分分析來分析資料,讓自己對資料有乙個大致的了解是非常重要的。主成分分析一般很少單獨使用:a,了解資料。

(screening the data),b,和cluster analysis一起使用,c,和判別分析一起使用,比如當變數很多,個案數不多,直接使用判別分析可能無解,這時候可以使用主成份發對變數簡化。(reduce dimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數),還可以用來處理共線性。

在演算法上,主成分分析和因子分析很類似,不過,在因子分析中所採用的協方差矩陣的對角元素不再是變數的方差,而是和變數對應的共同度(變數方差中被各因子所解釋的部分)。

應用中的優缺點比較(一) 主成分分析

1、優點。首先它利用降維技術用少數幾個綜合變數來代替原始多個變數,這些綜合變數集中了原始變數的大部分資訊。其次它通過計算綜合主成分函式得分,對客觀經濟現象進行科學評價。

再次它在應用上側重於資訊貢獻影響力綜合評價。

2、缺點。當主成分的因子負荷的符號有正有負時,綜合評價函式意義就不明確。命名清晰性低。

(二) 因子分析

1、優點:第一它不是對原有變數的取捨,而是根據原始變數的資訊進行重新組合,找出影響變數的共同因子,化簡資料;第二,它通過旋轉使得因子變數更具有可解釋性,命名清晰性高。2、缺點:

在計算因子得分時,採用的是最小二乘法,此法有時可能會失效。

2樓:焦一平

我對這個問題也特別好奇,目前還沒有什麼好的理解只是感覺從求解方面,因子分析仍然是從方差解釋的角度考慮的,而ICA則是從概率分布的角度考慮似然函式的

此外似乎,因子分析、主成分分析等傳統方法都要求原始變數是高斯的,而ICA是針對非高斯的?

期待更深刻的解讀

扔乙個鏈結上來

What is the relationship between independent component analysis and factor analysis?

好像也是從高斯性、非高斯性的角度解讀的

如何看待 中藥不講成分,不能用成分分析法來評價中藥材的功效 這種觀點?

和風初景 有效成分這種說法是有問題的。比如呼吸運動中吸入的有效成分是氧氣吧?但你只吸氧氣試試 事實是濃度不對人就會產生不適 難道氮氣和空氣中的其他成分對氧氣的稀釋作用就可以視而不見?藥物的研究同理。紅花和綠葉可能都重要,不能只看到紅花。 soap 一般藥劑都是幾種不同的藥一起,同樣的配方單個數量的多...

聚類分析可否用於內容分析法的編碼過程?

華天清 內容分析法作為一種比較有歷史的方法,已經相當成熟了,狹義的內容分析法是一種量化分析方法,跟質性分析不一樣。無論質性分析還是量化分析,信度和效度向來是很受關注的,所以,分析方法的規範性就至關重要,從研究問題的確定,到取樣,到編碼,到統計和解讀,都有很成熟的方法。發展到90年代,計算機技術迅猛發...

搜尋or大資料?一道基於層次分析法的OFFER排序題。

說句題外話。我覺得吧,題主看書太少,想得太多了 另外你沒有特別想去的公司麼?如果這幾家都差不多,那做個選擇就是了,在乎錢就選錢多的,在乎面子選牌子大的。你把行業方向是想好了,可是還是有很多不可控的因素,比如你做的專案,比如你跟的老闆,比如現在炒的熱的不流行了呢。 首先樓主這種SEO是基本沒有作用的 ...