多元線性回歸係數是正的,但是相關性分析卻是負相關,該怎麼解釋 處理?

時間 2021-05-10 04:20:08

1樓:

你要搞懂回歸到底研究的是什麼,舉個簡單例子講清楚就好了。

你去看乙個clinical data,比如9-18歲青少年肺活量 ~ 每週吸菸根數 + 年齡。

如果你直接看每週吸菸根數和肺活量,是正相關的。你是能得出吸菸和肺活量存在邏輯上的因果嗎?不符合常識。

加入年齡校正之後回歸,你就會發現回歸係數是負的。原因在於,隨著年齡增長青少年的身體長大了,肺活量增大了,肺活量增大並非是吸菸導致的,而是年齡增大學會了吸菸並且越吸越多;在同一年齡控制後,你會發現吸菸越多的人,肺活量是在同一年齡層是越小的。同組內的貢獻的確是負的。

這裡年齡增大->肺活量增大,年齡越大->越多的人吸菸/吸菸頻率變高。年齡在這是乙個confounding factor。

你的例子裡肯定也有某個confounding factor對你的interested factor和因變數都存在causal paths。只不過恰好和上面的例子反了過來而已。

建議你去找本biostat看看Confounding effect章節。

線性回歸方程中虛擬變數的回歸係數怎麼解釋?

靜學社 學無止境 主要看虛擬變數是如何編碼的,編碼不一樣,代表的意義不一樣。比如SPSS軟體對於二分類邏輯回歸和cox回歸預設提供了7種編碼,如果使用Python或者R則可以自定義任何編碼。編碼的設計可以依照方差分析中的Contrast 中文翻譯為 對比 或者 對照 來設計,首先設計 對比 然後得到...

回歸係數不顯著怎麼辦?

莊李秦 可以參考這個Github專案裡的方法,成功執行後能找出來妨礙顯著的樣本,妨礙顯著的樣本其實經常都不多,也就佔5 10 經驗證,篩選後的樣本,在SPSS,Stata中也可以穩定得到顯著的結果。 cnYuan 上面很多答案提到 多重共線性可能是導致不顯著的乙個原因。我想針對這一點展開說一說。我專...

計量經濟學裡不滿足經典回歸模型的回歸係數的標準差怎麼算?

Skywalker 這要看模型,如果observation滿足 的話一般是用Huber white standard error。理論上講,假設 1 滿足 2 可逆,其中 那麼,於是有 其中,相應的估計量是 這倆依概率接近 和 Huber white standard error就是實際操作上很簡單...