工具變數 Instrumental variables 的作用到底是什麼?

時間 2021-05-10 23:23:24

1樓:連玉君

專題:IV-GMM

twostepweakiv:弱工具變數有多弱?多個(弱)工具變數如何應對-IV-mivreg?

Note:產生如下推文列表的 Stata 命令為:

lianxh 工具變數

安裝最新版 lianxh 命令:

ssc install lianxh, replace專題:Stata命令

多個(弱)工具變數如何應對-IV-mivreg?IV:工具變數不滿足外生性怎麼辦?

IV-工具變數法:第一階段係數符號確定時的小樣本無偏估計

IV:可以用內生變數的滯後項做工具變數嗎?Stata:

工具變數法 (IV) 也不難呀!IV-估計:工具變數不外生時也可以用!

專題:內生性-因果推斷

工具變數-IV:排他性約束及經典文獻解讀

2樓:分析101

在做回歸時,很多時候會有的情況,這也意味著不滿足外生性條件,此時的OLS估計量就不再滿足無偏性,並且隨著的變大,它的bias也無法變小。

此時該怎麼辦?一種解決方法是利用一些與無關的變數,這就是工具變數(instrumental variables,下文統稱IV)。我們假設找到的IV是一些的向量,再將它排成的矩陣。

IV需要與原來的足夠接近,因此(為矩陣)必須滿列秩。而我們尋找IV的目的,就是要讓IV滿足,由資料生成過程可知,我們要求解的就是滿足的。

我們無法知道和,但可以用樣本矩代替,即

上面的方程,若,則有多個解,若且非奇異,則有唯一解,若,無解。在經濟學理論中,往往會出現的情形,此時儘管方程無解,但我們依舊可以尋找,使盡可能接近。

我們可以定義乙個和之間的二次距離:

其中是乙個的正定範數矩陣(positive definite norming matrix),它可以是隨機矩陣。這裡之所以選擇二次距離,是因為這樣在求解最優化問題時比較方便,可以直接寫出一階條件:

假設非奇異,就可以得到IV估計量

只要選擇和,就可以得到各種計量經濟學中的估計量。比如選擇和,那麼就變成了OLS估計量。而選擇,就得到了2SLS(two-stage least squares)估計量。

IV估計量是無偏的嗎?在資料生成過程下,有

事實上,上式的第二項我們沒有理由保證它為,哪怕有也無法保證。但在假設、(為有限滿列秩矩陣)以及(為有限正定矩陣)之後,可以得到比無偏性更弱的一致性:。

3樓:Harry

考慮回歸:

Y = a + bX + e

如果X與e(epsilon)存在相關關係,即Corr(X , e) != 0,在這種情況下OLS的估計是有偏的。

為了解決這個問題,我們需要找到乙個IV(Z),它需要滿足兩個條件:

a) 相關性條件(Relevance Condition): Corr(Z , X) != 0

b) 排除性限制(Exclusion Restriction): Corr(Z , e) = 0

換句話說:

a) IV 必須與X相關

b) IV只能通過與X的相關性來與Y相關(即,Z只能通過引起X的變化來引起Y的變化)

最後,舉個例子:如果你想知道吸菸(X)與高血壓(Y)的關係,是不方便直接將吸菸與血壓進行回歸的,因為壓力(e)這種不可觀測的因素既導致吸菸又導致高血壓,即(Corr(X , e) != 0)。

那麼該怎樣得到吸菸與高血壓之間的無偏估計呢?

可以考慮使用菸草稅(Z)作為工具變數,因為:

Corr(Z , X) != 0 (菸草稅會影響吸菸成本,進而影響人們的吸菸行為)

Corr(Z , e) = 0 (菸草稅(基本上)與血壓無關 - 除非有人辯駁稱經濟形勢與菸草稅的徵收有關,而經濟形勢同時也會影響人的血壓)

所以,菸草稅(基本上)只能通過對影響吸菸行為來影響血壓,因而是吸菸行為的好的工具變數。

(再次說明:IV不是與Y無關,而是IV只能通過影響X來(間接)影響Y。或者說,IV不能通過影響e來同時影響X和Y。

反例:父親的吸菸行為(Z')可以作為這裡的IV嗎?

個人認為不是很好,因為儘管:

Corr(Z' , X) != 0 (父親吸菸,孩子更有可能吸(更多)煙)

但是:

Corr(Z', e) != 0 (吸菸的父親可能也揹負了更大的生活壓力,或更缺乏自制力,從而對孩子的身心健康產生不利而且長遠的影響,最終導致孩子罹患高血壓)

所以,父親的吸菸行為(Z')不如菸草稅的徵收(Z)更適合做吸菸行為(X)的工具變數。以上。

4樓:cici crystal

排第一的回答已經很足夠了補充一下

主要因為 x 和誤差項相關所以結果有偏差因此需要其他變數來代替x 做回歸其他變數一定不能和誤差項相關於是解決上述問題回歸可以變不偏

然後你可以發想有弱工具有強工具取決於工具與x的相關性我講的比較抽象不知你是否可以理解

5樓:Boxi

用工具變數是為了解決由於內生性導致的 inconsistent parameter estimation問題。

IV和X是correlated,和y是uncorrelated。

請參考Greene教材的詳細解釋。

6樓:慧航

謝 @苗苗 邀。

你的理解有問題。舉個例子來說明一下。

比如在教育的回報問題上,我們會估計如下方程:

然而乙個人的能力ability是不能觀測的,所以我們實際上能做的估計方程是:

然而一般情況下,教育edu跟乙個人的能力是有正的相關性的,比如研究生的能力一般比本科生強,所以導致了0" eeimg="1"/>

即解釋變數跟誤差項相關了。這個時候使用OLS估計,係數不是一致的,一般來說被高估了。注意這個情況下,即使只有是內生的,由於跟也可能相關,因而也是不一致的。

怎麼處理呢?用工具變數。假設現在存在乙個跟內生變數高度相關,然而跟不相關,或者說跟不相關的變數,我們稱其為工具變數

有了這個工具變數,就可以使用矩條件:來一致地估計。比如我們可以使用距離學校的距離,這個變數會導致教育年限的差別,但是跟個人的能力應該是無關的,這就是乙個潛在的工具變數。

所以總結一下,內生性是說,某個解釋變數跟誤差項相關了,常見的可能導致內生性的情況比如:遺漏變數(比如我們舉的例子)、度量誤差、互為因果、樣本選擇等等。

而工具變數,就是要找到乙個跟誤差項不相關,但是跟內生變數高度相關的變數,從而得到一致估計。

弱工具變數的判定指標都有什麼?

gnak 首先的首先的首先,在教科書上最簡單的法則就是用第一階段回歸中的F統計量 原假設為所有工具變數都為0 若F 10則可以認為不是弱工具變數 Stock Watson,introduction to econometrics,p444 如果你用stata的ivreg2或者ivreghdfe跑回歸...

我這樣使用工具變數正確嗎?

連玉君 首先,內生變數的平方也是內生變數,也就是說本文存在兩個內生變數。其次,至於能不能用同乙個工具變數 工具變數的平方作為兩個內生變數的IV,統計上是可以做。但是存在兩個問題,第一,工具變數平方沒有增加新的額外資訊 第二,x1 和x1平方是高度共線,估計出來的係數顯著性一般會比較低。建議,如果想考...

對於單方程模型,使用工具變數進行識別是不是多此一舉?

Huang Zibin 實際上對於非自然實驗,沒有RDD的變數來說,個人感覺要找到X明顯外生的證據真的很難。所以樓主的想法本身沒有錯,但卻是沒有太大實踐意義的。我們來舉乙個LZ說的比較有名的 聰明的IV 的例子。Angrist 1990 Lifetime Earnings and the Vietn...