斷點回歸設計(RD Design)與新增虛擬變數有什麼區別?

時間 2021-05-10 05:45:33

1樓:Dr.X

RD design是為了測量乙個treatment的作用,而dummy是為了解決乙個解釋變數和另外乙個解釋變數存在相關性的問題。

2樓:

基本同意之前各位的回答,RD其實就是一種計算treatment effect的方法,但是你在estimate的時候只加乙個treated/controlled 的dummy variable還有些互動項(interaction terms)就說你做了RD是有問題的。

RD的使用很麻煩,更restrict,乙個很大的assumption就是你起碼要確保你的running variable在cutoff的兩側是as good as a randomized experiment,意思就是這個treated/controlled 的dummy variable不能輕易就被人操控 (當然這也需要跑大量的測試)。

建議看這篇文章: Regression Discontinuity Designs in Economics

文章第55頁有個checklist可以最後檢查一下結果,這些都是必須要考慮的robustness check。

3樓:JoeyM

剛學到這個方法,按我的理解說一下,還請指正

還是用錄取學校這個例子來說

假設要研究錄取到一本學校對學生未來工資的影響

首先,沒法做隨機試驗是肯定的

現在如果我們用OLS的方法,為了排除「錄取到一本學校」這個treatment的內生性

我們就要往加入足夠多的解釋變數,比如說家庭教育,個人能力,經濟能力等等等,變數越多估計結果越準確。以及和這個treatment的虛擬變數

但如果我們只加入乙個虛擬變數,說明我們預設了是否被錄取一本學校對不用能力、不同家庭背景的學生的影響都是一樣的,這顯然讓人難以信服

為了更好地識別錄取到一本學校的影響,我們再往方程裡加入它與各個變數的互動項,這個回歸跑出來,理論上我們就可以得出,對於任意一類學生,是否錄取到一本學校對他的影響有多大。。

。想想都知道一旦變數多起來這個回歸有多不靠譜

但是如果用斷點回歸的方法,我們起碼可以在有限的資料集中估計出乙個相對準確的結果

在「連續性」的假設下,我們並不需要控制住那麼多變數,因為我們認為以running variable為參考的某個點附近,比如高考分500分附近的人,他們的學習成績,乃至智商、情商、abcdQ等其他因素都是差不多的(這個說法可能要斟酌一下),而在這個499分和500分這群人差不多的人以後工資的差異,就可以被看做是錄取到一本學校的純的影響。但顯然,這個影響顯然是針對那群差不多的人而言的,對另一群學生來說,這個影響就毫無說服力了,因為你認為錄取到一本學校的影響對於不同群體而言是不一樣的。這句話是不是和上面下劃線那句話很像(其實就是乙個意思嘛)。

所以我認為兩者的關係是,RD(上面其實是個Sharp RD的例子)估計出來的影響,相當於在回歸方程中加入足夠多的虛擬變數互動項,再估計出treatment在某個點的偏效應。多元回歸做不好這件事,而RD能做好。

4樓:

題主,RD和新增虛擬變數關係不是太大呢,問RD和IV(工具變數)的關係更確切。

如樓上所言,RD分為Sharp型(running variable超過門檻值個體就一定會get treated,低於這個值就不會。)和Fuzzy型(get treated只是部分地與running variable超過門檻值相關,也就是說,存在某些超過門檻值的個體沒有treated,也有些低於門檻值的個體get treated)。

在Fuzzy RD中,我們就把這個running variable 作為treatment的IV啦,然後就可以用2SLS求解,流程和IV的2SLS估計差不多。

5樓:慧航

如果問這個問題,說明你根本沒有理解什麼是RD。

建議先讀一下關於treatment effect的基礎知識。

(sharp)RD的意思是,個體接受某種treatment是根據某個連續的變數(z)來外生決定的。比如某次考試大於90分的可以參加某項競賽輔導,小於90分的不可以。這裡的treatment是參加競賽輔導,1(z>90)是個虛擬變數,指示的是個體有沒有參加競賽輔導,而參不參加競賽輔導是由某次考試分數決定的。

所以關鍵的區別是,這裡的虛擬變數是指示的「treatment」,而非一般的「男女」、「種族」等的dummy variables,性別、種族不是treatment。

6樓:FlyRideR

瀉藥確定形的斷點回歸和新增虛擬變數很像

不過還有一種模糊型的斷點回歸(Fuzzy Regression Discontinuity),即個體接受處置效應的概率均大於0小於1,個體在臨界值一邊接受處置的概率大於在臨界值另一邊接受處置的概率。

斷點回歸估計中是否需要新增控制變數?

連玉君 在斷點回歸中,若使用最小二乘法估計,研究者通常會加入不受政策影響的協變數,如人口統計特徵 而使用非引數區域性多項式法,研究者大都不考慮協變數,這使得估計量並不總是引數的一致估計。為此,Calonico 等 2019 將協變數納入非引數多項式回歸中,以估計區域性政策效應,並對相應的統計推斷進行...

設計專業用聯想拯救者r7000r5可嗎?

hong100700 工作的話,建議上Y7000,畢竟現在的軟體是在英特爾的硬體基礎上構建的,標準都是英特爾的,雖然amd桌面級的cpu多核效能比intel強,但是實際應用中差別基本感覺不到,萬一你幹活的過程 中給你卡了,你只能白瞪眼。等到別人當小白鼠,證明amd的cpu在工作中沒問題再上。 che...

如何評價 iPhone 12 系列設計風格回歸方正硬朗設計,設計與工藝上有哪些亮點?

有些人又開舔了 什麼都能找出點理由來舔 估計連卡死閃退都能舔,ios永不卡頓,只會卡死閃退用圓角,說使用者手感至上 用直角,說 黑石 使用者視覺效果至上 舔pg的人 蘋果真偉大 部分使用者 我不想要劉海 蘋果 閉嘴 Jonah 首先非常感謝 蘇志斌 的回答,讓我拓寬了對產品設計的視野 面向大眾消費,...