加入某個控制變數後原解釋變數不顯著了是什麼原因?

時間 2021-05-13 00:23:38

1樓:

如果總體模型顯著但模型裡面的Inde V或者control V都不顯著,就代表裡面有multicollinearity.

可以用VIF算一下值,如果小於4,其實沒事兒。大於4或者6就有問題了,就需要處理一下共線性。(咳咳,默默傳兩張課件圖...)

2樓:Sarah

樣本量有多大?

有多少個解釋變數?

Y和X's 都是怎麼測量的?

新加的控制變數,和其它解釋變數的correlations是怎樣的?

有時VIF這個指標可能沒有超過標準,但變數之間的correlations可能已經比較高了。

3樓:連玉君

我用幾張圖來做個說明,不需要太多的言語:

常規情形

特殊情形一:可遇不可求

特殊情形二:柳岩的高調出場令所有女星黯然失色特殊情形三:黃渤和王寶強「單獨\一起」走紅毯我的主頁:

我混跡於連享會,折騰那些有趣又傷神的問題。

. ssc install lianxh

快速查詢 Stata 資源和推文,專案主頁。

4樓:李曉煦

問題在於數學物件的語言誤讀。加了不同的控制變數,原來的回歸係數定義相應發生變化,數學上可能從正(顯著)變零(不顯著),甚至可能從正變負。放幾頁課件,講一下多數教材在回歸章節的這個盲點:

1.上面這個式子不涉及統計與分布的個體差異,懂初中數學的同學都應該看得懂、推得出。

2. 然後給出違和感的由來:因為短時記憶窄頻寬,自動省略某個細節資訊,導致誤讀。下面解釋省略了什麼資訊

3. 真相大白:控制其它X變數(IV=Independent Variable)不變,這半句話的省略造成最後的誤讀

4. 第一遍學這個知識點,可以自測一下上面的第3種說法「父親收入+1;同時母親收入-1 」,不同的人頭腦中的解讀可能不同!

有經驗的研究者預期父親收入與母親收入相關不低,比如0.5,在研究的群體中,如果兩個個案父親收入差距為1,母親收入的差距自動預期為0.5,從0.

5變成-1是-1.5的變化程度,需要選那種母親原生家庭階層比父親原生家庭階層低非常多的特殊個案。語文成績與數學成績類似,這種特殊個案的偏科程度比字面上第一印象的解讀要嚴重得多。

現在流行的大多數教材都把這個(回歸係數名字引發的第一印象解讀 ≠ 數學內容的)效度問題避而不談,只談(多重共線性引起的標準誤放大的)信度問題。這是錯誤的。因為可以設計出很極端的資料讓父親收入與家庭總收入相關很低(父親收入與母親收入負相關),這個時候信度問題沒了但效度問題仍然存在。

這其實是教學層面比較基礎的問題。我自己上世紀就學了回歸,十幾年都沒有意識到這個問題,後來2023年開始教書,大約在2023年偶然發現。2023年我博士畢業到復旦作 Job Talk 仔細講了這個問題,發現還真是乙個很普遍的盲點,所有到場的同行都是第一次了解到。

與中介模型的關係

@gesellschaft 的回答一語中的,熟悉中介變數的研究者與初學者對這個問題感覺非常不同。中介模型 X → M → Y ,改變M的內涵(不是改變M的水平),X 到 Y 的「直接效應」的數學定義就發生了改變。然後可以發現「直接效應」這個術語也是誤導的,其實這個效應並不會更直接,相反,這個效應是「剩餘的、過程未被研究的」。

回歸方程中內涵的選擇(不是數量的選擇)決定了回歸係數的內涵,這個命題在中介模型裡就是 M 內涵的選擇決定了 X 到 Y 所謂的「直接效應」的內涵。

可能因為中介模型太強調因果方向。即使很熟悉中介模型的研究者,多數人也沒有留意到:如果 X 的內涵改變,居然導致中介模型中 M 到 Y 的回歸係數內涵改變。

我的意思是:熟悉中介模型對這個現象的理解有幫助,但是「回歸係數的內涵效度受其它自變數內涵影響」這個現象,與中介或者因果方向都沒有關係,適用於所有情形的回歸方程解讀。

斷點回歸估計中是否需要新增控制變數?

連玉君 在斷點回歸中,若使用最小二乘法估計,研究者通常會加入不受政策影響的協變數,如人口統計特徵 而使用非引數區域性多項式法,研究者大都不考慮協變數,這使得估計量並不總是引數的一致估計。為此,Calonico 等 2019 將協變數納入非引數多項式回歸中,以估計區域性政策效應,並對相應的統計推斷進行...

大學一定要加入某個組織嗎, 會不會影響學習呢?

ibcLee 好處 認識一幫朋友,在大學中我認為是很重要的,甚至還可以交到男 女 朋友 可以經常聚餐,也可以把這個看成是壞處,會顯得你的大學生活灰常充實,如果宿舍再有幾個宅男,看你經常出去吃吃喝喝會非常羨慕的,因為他們不是自願想當宅男的,是沒機會認識班級外的其他人 最後的簡歷裡可以提一筆,也只是一筆...

如果工具變數(IV)是省層面的,那還需要控制省份固定效應嗎?

Case 1 IV 沒有 within province variation 包括截面資料 控制省份固定效應後IV沒有 variation 了,顯然沒法控制。Case 2 IV 存在within province variation 取決於對 IV exogeneity 的假設。如果假設 IV 的外...