傾向值匹配及因果推論

傾向值匹配及因果推論

ID:36480523

大小:740.80 KB

頁(yè)數(shù):23頁(yè)

時(shí)間:2019-05-11

傾向值匹配及因果推論_第1頁(yè)
傾向值匹配及因果推論_第2頁(yè)
傾向值匹配及因果推論_第3頁(yè)
傾向值匹配及因果推論_第4頁(yè)
傾向值匹配及因果推論_第5頁(yè)
資源描述:

《傾向值匹配及因果推論》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)

1、傾向值匹配與因果推論:*方法論述評(píng)胡安寧提要:社會(huì)科學(xué)對(duì)于因果關(guān)系的關(guān)注使得傾向值匹配(propensityscorematching)的方法受到越來(lái)越多的重視。本文從以下幾個(gè)方面對(duì)這一方法進(jìn)行述評(píng)。首先,本文系統(tǒng)梳理了傾向值匹配方法的歷史、發(fā)展及其對(duì)于社會(huì)學(xué)調(diào)查研究的意義。其次,通過(guò)一個(gè)具體實(shí)例,本文展示了傾向值匹配的具體實(shí)施過(guò)程。第三,從密爾對(duì)因果關(guān)系的論述以及統(tǒng)計(jì)學(xué)的反事實(shí)框架(counterfactualframework)出發(fā),本文闡釋了傾向值匹配如何通過(guò)“控制”混淆變量從而滿足非混淆假設(shè)(unconfoundedness)來(lái)幫助研究者提出因果性結(jié)論。第四,本文將傾向值匹配與

2、回歸中斷設(shè)計(jì)和工具變量進(jìn)行了比較。最后,在簡(jiǎn)要分析傾向值匹配的局限性之后,本文討論了傾向值匹配的最新發(fā)展趨勢(shì)。關(guān)鍵詞:因果推論傾向值匹配控制思想反事實(shí)框架在過(guò)去十幾年中,社會(huì)科學(xué)領(lǐng)域中一個(gè)重要的方法論突破在于開(kāi)始關(guān)注如何通過(guò)嚴(yán)格的統(tǒng)計(jì)技術(shù)進(jìn)行因果推論(Sobel,1995,1996,2000;Morgan&Winship,2007;Winship&Morgan,1999;Winship&So-bel,2004)。在各種統(tǒng)計(jì)學(xué)方法中,傾向值匹配(propensityscorematc-hing)受到越來(lái)越多的重視,并在教育學(xué)、傳染病學(xué)以及社會(huì)學(xué)等領(lǐng)域得到了廣泛的應(yīng)用(Harding,20

3、03;Morgan,2001;Morgan&Harding,2006;Normandetal.,2001;Smith,1997)。相對(duì)于經(jīng)濟(jì)學(xué)的工具變量方法,傾向值匹配在社會(huì)科學(xué)研究中還是一個(gè)新興的統(tǒng)計(jì)技術(shù)。然而,隨著越來(lái)越多的經(jīng)驗(yàn)研究開(kāi)始關(guān)注并且應(yīng)用傾向值匹配,其獨(dú)特的優(yōu)勢(shì)也逐漸展現(xiàn)出來(lái),因此有著極為廣闊的應(yīng)用前景。本文將從六個(gè)方面系統(tǒng)介紹這一方法。在第一部分,筆者將討論傾向值匹配的歷史、發(fā)展以及它對(duì)社會(huì)學(xué)調(diào)查研究的意義。*作者感謝復(fù)旦大學(xué)社會(huì)學(xué)系周怡教授和北京大學(xué)社會(huì)學(xué)系方文教授的建議和幫助,并感謝匿名審稿人所提出的修改意見(jiàn)。文責(zé)自負(fù)。221社會(huì)學(xué)研究2012.1第二部分將通過(guò)一個(gè)

4、具體實(shí)例來(lái)展示傾向值匹配的具體實(shí)施過(guò)程。在第三部分,筆者將從科技哲學(xué)和統(tǒng)計(jì)學(xué)兩個(gè)方面討論為什么傾向值匹配的結(jié)果可以進(jìn)行因果性解讀。第四部分將把傾向值匹配與其他比較常用的因果推論方法進(jìn)行簡(jiǎn)要對(duì)比并由此展示傾向值匹配相對(duì)于其他方法所特有的優(yōu)勢(shì)。在第五部分,筆者將探討傾向值匹配所存在的一些局限性。最后,簡(jiǎn)要總結(jié)本文內(nèi)容并探討傾向值匹配的最新發(fā)展趨勢(shì)。一、傾向值匹配:歷史、發(fā)展及其對(duì)調(diào)查研究的意義傾向值(propensityscore)這一概念最早出現(xiàn)在1983年羅森鮑姆和魯賓合寫(xiě)的一篇名為《傾向值對(duì)于觀察研究中因果效應(yīng)的中心作用》的論文中(Rosenbaum&Rubin,1983)。傾向值指

5、被研究的個(gè)體在控制可觀測(cè)到的混淆變量(confoundingvariables)的情況下受到某種自變量影響的條件概率。在一般的實(shí)證研究中,由于存在很多其他變量混淆自變量和因變量之間的關(guān)系,研究者很難直接探索二者之間的“凈效果”(neteffects)。例如,大學(xué)教育的收入回報(bào)可能受到年齡、性別以及地區(qū)差異這些混淆變量的影響。因此,上大學(xué)的人的平均收入與沒(méi)有上大學(xué)的人的平均收入的差異有可能也反映了混淆變量的作用。這些混淆變量的影響通常被稱為選擇性誤差(selectionbias),而通過(guò)傾向值匹配的方式來(lái)控制和消除選擇性誤差則是羅森鮑姆和魯賓論文的題中之義。羅森鮑姆和魯賓用數(shù)理方法證明:

6、通過(guò)將這些混淆變量納入Logistic回歸模型來(lái)產(chǎn)生一個(gè)預(yù)測(cè)個(gè)體受到自變量影響的概率(傾向值),研究者可以通過(guò)控制傾向值來(lái)遏制選擇性誤差對(duì)研究結(jié)論的影響從而保證因果結(jié)論的可靠性。在各種控制傾向值的方法中,匹配(matching)比較簡(jiǎn)便易行。其基本邏輯是將受到自變量影響的個(gè)體與沒(méi)有受到影響的個(gè)體進(jìn)行配對(duì)。而傾向值匹配就是保證匹配起來(lái)的個(gè)體的傾向值相等或者近似。再次回到大學(xué)教育的例子,傾向值匹配就是將沒(méi)有受過(guò)大學(xué)教育的人和受過(guò)大學(xué)教育的人配對(duì)并保證他們的傾向值(即上大學(xué)的概率)相同或近似,這樣我們就得到了上過(guò)大學(xué)和沒(méi)上過(guò)大學(xué)兩組個(gè)體。因?yàn)橐延械幕煜兞恳呀?jīng)在基于傾向值的配對(duì)過(guò)程中被控制起

7、來(lái)了,兩組222研究述評(píng)傾向值匹配與因果推論:方法論述評(píng)個(gè)體收入上的差異就只能歸因于大學(xué)教育的有無(wú),而不是其他混淆變量,由此遏制了選擇性誤差。羅森鮑姆和魯賓的思想與計(jì)量經(jīng)濟(jì)學(xué)家赫克曼的想法不謀而合。從樣本選擇的角度出發(fā),赫克曼認(rèn)為社會(huì)科學(xué)家在研究某個(gè)自變量效果的時(shí)候會(huì)不自覺(jué)地選擇一些樣本而忽視另外一些。例如,針對(duì)某個(gè)研究項(xiàng)目,不同的個(gè)體有不同的參與意愿,或者研究者對(duì)于研究個(gè)體的選擇有特定的傾向。這些選擇效應(yīng)(selectioneffect)使得

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。