方差分析的基本思想是什麼?

時間 2021-05-07 11:54:08

1樓:靜學社-學無止境

如果你是乙個新手,建議首先看看最高贊的回答,他的回答寫的很好。但是他的文章很長,導致一些重要思想淹沒在了一些不重要的文字之中。如果不仔細品並且悟性不好,這些重要思想你是無法理解的。

那我就簡單粗暴一點,直接把這些思想直白的告訴你。所以,我的回答對於新手並不友好,因為需要有乙個好的統計學基礎知識才能理解我的回答。

要理解方差分析,首先要搞懂F檢驗統計量,不是原始的F分布密度函式,而是在同方差假設下兩個樣本方差之比符合F分布。

方差分析的檢驗統計量是乙個符合F分布的統計量,簡單來說就是樣本方差之比(分子是乙個樣本方差,分母也是乙個樣本方差)符合F分布,其中樣本方差=離差平方和除以離差平方和的自由度。如果不同組無差異,那麼分子的期望和分母的期望的比值應該是1,如果有差異,則該比值會大於1。專業一點的書籍,只要涉及到F檢驗,可能會給你證明分子的期望是什麼,分母的期望是什麼。

方差分析的核心思想再重複一遍:如果不同組無差異,那麼分子方差的期望和分母方差期望的比值應該是1,如果有差異,則該比值會大於1。不同組無差異」這句可以換成其它的,比如線性回歸中「某乙個或者某幾個回歸係數為零」,隨機效應模型中「某個隨機效應的方差為零」等。

如果不同組無差異,那麼分子方差的期望和分母方差期望的比值應該為1,如果有差異,則該比值會大於1。懂得了這句話的含意,方差分析就是一件自然而然的事情了。

對線性回歸「欠擬合」的研究(基於Evgeny Slutsk的進一步研究)讓 Fisher發現兩個樣本方差的比值符合卡爾-皮爾遜6型分布(也就是今天的F分布),從F分布的形式(兩個樣本方差之比)以及「欠擬合」檢驗的思想(這個思想最初來自Evgeny Slutsk,並不是Fisher的獨有發現),Fisher經過自己的努力最終提出了「方差分析」這個統計方法。從方差分析的發展歷史我們就能看到,方差分析的兩個關鍵點:1,兩個樣本方差比可以構成乙個F分布;2,如果零假設成立,F統計量的比值接近1,如果計算出的F統計量非常大,大到進入零假設的拒絕域,則拒絕零假設。

方差也可以理解為離差平方和,從F分布的構造就能看出,只要構造出兩個離差平方和,就能構造出乙個F統計量(當然,是有條件的,這些條件對於我們理解方差分析的思想並不重要,所以我就不細說了)。然後再結合「如果不同組無差異,那麼分子方差的期望和分母方差期望的比值應該為1,如果有差異,則該比值會大於1。」這句話,方差分析水到渠成,只要統計學稍微學的好點的,幾乎都可以很快理解過來,然後靈活運用到各個地方。

舉個例子。單因素方差分析,設處理平方和均方 MS處理(F統計量的分子部分),殘差平方和均方 MSE(F統計量的分母部分)。如下圖:

假設組間無差異,也就是各組均值都相等,那麼Ti=0(Ti為處理i相對於總均值的差值),則E(MS處理)/E(MSE)=1,如果各組均值不相等,則Ti不全為零,則比值會比1大。

如果零假設為真(也就是各組無差異),那麼通過一次抽樣進行檢驗,計算出的F統計量值在1周邊才是正常現象,如果出現乙個非常大的值,則屬於小概率事件發生,拒絕零假設。

大家再回去看看線性回歸模型顯著性的方差檢驗法是不是就是這麼幹的,隨機效應模型中隨機效應方差是否為零方差檢驗法是不是也是這麼幹的。

道理就是如此樸實無華,簡單到驚呆你的下巴。

2樓:「已登出」

Using categorical variables to predict changes in continuous variables.

3樓:magic2728

談思想,我就盡量不列公式和說細節了。

本質上,方差分析是一種因果或相關關係有無的判別,用的是假設檢驗的技術。這是大前提。

小前提是,自變數是分類變數,比如因素水平,性別,顏色等;因變數是數值變數,比如產量,大小,合格率等。

這種場景下,要判斷兩個變數的因果關係,用假設檢驗的方差分析技術,再具體點就是F檢驗。

當然,為了滿足F檢驗條件,還有一系列關於變數分布的假設,比如要求因變數是正態分佈,相關關係是線性的等等。若不滿足則要麼承擔這層錯誤,要麼,另行推導。

還有自變數的型別變化時候,這種因果或相關關係的判斷也基本有體系了,分別是列聯表的卡方,費雪檢驗;回歸方程的引數f,t檢驗;還有經典的雙總體假設檢驗。加上方差分析一共4個型別,連續和離散變數兩個型別的二元元組也是4種,大家對號入座。

4樓:輕風

先問自己乙個問題,方差分析是拿來幹嘛的?方差分析是為了檢驗多組資料平均數是否有差異。

那如何說明這多組資料平均數就是有差異的,而不是因為偶然因素產生的差異?因為三組及以上平均數用t檢驗沒法定義,那麼就引入了方差的概念。根據方差分析把多組資料的差異分為組間變異和組內變異。

接下來的這一步就是關鍵了,將組間變異除以組內變異,所得的值如果超過1,其很有可能就是是由於處理產生的,為了保險那麼就是要達到0.05的水平。

如果我只說這麼一點,我相信很多人還是糊塗。這裡面沒有解決乙個問題,為什麼要組間變異除以組內變異?我翻了好幾本國內的教材,都語焉不詳,直到我後來看到一本國外教材。

裡面提到,組間變異是處理效應加偶然因素產生的變異,組內變異是偶然因素產生的變異。那如果處理沒有效用,那麼這個兩者的商就為1。之前看過老師說,其值可以小於1,其實是不對的。

如果沒有處理效應,組間變異只剩下偶然因素產生的變異,跟分母組內變異產生的變異一致,所以最小值只能是1。如果這個商值和F分布結合起來,其值達到F分布的小概率事件,就是其值落於F分布的百分之5的概率區間內,我們就有可能相信這兩個平均數之間的差異不是偶然引起的。

5樓:桃子VC

最簡單的理解:

當進行多個總體間進行比較的時候,t檢驗不再適用,如果強行使用t檢驗就會犯統計學的一類錯誤。

方差分析的基本思想:變異。將總的變異分為組間變異和組內變異。

組內變異一般是個體差異導致的,一般不會太大。而組間變異,除了個體差異,還有干預措施導致的變異。因此,fisher認為,如果組間變異除以組內變異,結果遠大於1,就認為干預措施有意義。

6樓:小黃

我補充乙個白話的版本:

拋開所有概念和定義,方差分析就是對於方差的分析。

方差分析的思想,就是把變異分為【組間變異】和【組內變異】,搞清楚整體的變異是哪個為主導的。

F這個引數,定義就是【組間變異】/【組內變異】,通過在分布圖上查詢對應的F值,就能知道變異誰主導。搞定啦

7樓:

其實本質上是廣義線性模型的Likelhood ratio test,是在比較兩個nested model,複雜的那個model有沒有比相對簡單的model更好。

方差分析和回歸分析的異同是什麼?

你再說一遍 MLR主要擬合線性關係 方差分析是分析每種因素對因變數的影響程度 符號區分 再補一張筆記 和方差分析處的公式有一點區別 指路課本版本 Psycho.杜先生 簡單來說。1 殊途同歸,方差分析處理的自變數的是稱名資料,回歸處理的是 自變數 等距或等比資料。2 方差分析處理的是實驗資料,回歸處...

《作為意志和表象的世界》的基本思想是什麼?

作為意志與表象的世界 中的 表象 對應的德文是 Vorstellung 對應的英文含義是 idea 和 representation 的混合。這種一語雙關現象反而使漢語讀者從英譯本中比從德文原著更能獲得啟發,而從漢語簡單的 表象 一詞無法引發以下複雜的思考 這就是為什麼要從西方語言而不是漢譯本出發研...

t檢驗與方差分析F檢驗的區別和聯絡?

yayiyo t分布是 student t 在研究 小樣本 的過程中發現的 無論總體分布如何,在其中取小樣本,得到的平均值和標準差的比值的分布服從t分布。因此,t檢驗可以用於檢驗乙個小樣本是否來自於某個大樣本。t分布的意義在於,它在紛繁複雜的分布之中,找到了乙個共性,使得工作可以唯一話,流程化。方差...