如何學好線性回歸分析?

時間 2021-06-05 23:07:13

1樓:暮雪寒泉

首先,你需要了解線性回歸的理論假設和數學推導,線性回歸有幾個很強的假設:

(1)模型的整體的形式是線性;

(2)嚴格外生性,即擾動項與自變數是無關的;

(3)不存在多重共線性,即乙個自變數不可以是另乙個或其他自變數的線性組合;

(4)擾動項滿足同方差和無自相關的假設

然後,對於一元線性回歸(y=ax+b)本質就是找一條回歸線,使得所有觀測值距該線的距離平方和最小;對於二元回歸(y=ax+bx+c)本質就是找乙個回歸平面,使得所有觀測值距該平面的距離平方和最小;同理,對於多元回歸,就找乙個超平面。

其次,在確定了線性回歸的形式後,則需要對該模型進行模型引數標定和檢驗,包括回歸方程的有效性檢驗、係數的顯著性檢驗以及模型的擬合優度檢驗。

在值得注意的是,在應用線性回歸模型時候會遇到些難點,比如互動效應、調節效應等,需要閱讀專門的教材,最推薦謝宇的《回歸分析》,上面將回歸分析講的非常細,並且假設大家都是數學小白,所以啃完這本書肯定對線性回歸有更深的理解。

為什麼線性回歸叫做 回歸 ?

這個問題也困擾我很久,我覺得身高那個均值回歸的例子沒有完全解答我和答主的疑惑,下面說說我個人的理解吧。我們可以對比回歸模型和投影模型兩種基本的計量模型,他們的估計方法都是線性擬合,估計量的表示式也是等價的,為什麼乙個叫 回歸 乙個叫 投影 呢?原因在於回歸模型在最小二乘的目標函式中是以條件期望作為因...

多元線性回歸係數是正的,但是相關性分析卻是負相關,該怎麼解釋 處理?

你要搞懂回歸到底研究的是什麼,舉個簡單例子講清楚就好了。你去看乙個clinical data,比如9 18歲青少年肺活量 每週吸菸根數 年齡。如果你直接看每週吸菸根數和肺活量,是正相關的。你是能得出吸菸和肺活量存在邏輯上的因果嗎?不符合常識。加入年齡校正之後回歸,你就會發現回歸係數是負的。原因在於,...

如何自己做多元非線性回歸模型?

用多層感知機吧,理論證明能逼近任何非線性函式。至於你調參能不能調出來 資料量夠不夠解決過擬合那就是你的本事了 做學問不是過家家,科學是嚴謹的,不知道模型的大致樣子,說明你研究的還不夠。非線性建模是在大量研究和沉澱之後的結晶或者這個模型是理論上已經存在 比如地球重力,化學反應公式 不是坐在辦公室一拍腦...