傾向值匹配及因果推論

ID：36480523

大小：740.80 KB

頁(yè)數(shù)：23頁(yè)

時(shí)間：2019-05-11

資源描述：

《傾向值匹配及因果推論》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、傾向值匹配與因果推論:*方法論述評(píng)胡安寧提要:社會(huì)科學(xué)對(duì)于因果關(guān)系的關(guān)注使得傾向值匹配(propensityscorematching)的方法受到越來(lái)越多的重視。本文從以下幾個(gè)方面對(duì)這一方法進(jìn)行述評(píng)。首先，本文系統(tǒng)梳理了傾向值匹配方法的歷史、發(fā)展及其對(duì)于社會(huì)學(xué)調(diào)查研究的意義。其次，通過(guò)一個(gè)具體實(shí)例，本文展示了傾向值匹配的具體實(shí)施過(guò)程。第三，從密爾對(duì)因果關(guān)系的論述以及統(tǒng)計(jì)學(xué)的反事實(shí)框架(counterfactualframework)出發(fā)，本文闡釋了傾向值匹配如何通過(guò)“控制”混淆變量從而滿足非混淆假設(shè)(unconfoundedness)來(lái)幫助研究者提出因果性結(jié)論。第四，本文將傾向值匹配與

2、回歸中斷設(shè)計(jì)和工具變量進(jìn)行了比較。最后，在簡(jiǎn)要分析傾向值匹配的局限性之后，本文討論了傾向值匹配的最新發(fā)展趨勢(shì)。關(guān)鍵詞:因果推論傾向值匹配控制思想反事實(shí)框架在過(guò)去十幾年中，社會(huì)科學(xué)領(lǐng)域中一個(gè)重要的方法論突破在于開(kāi)始關(guān)注如何通過(guò)嚴(yán)格的統(tǒng)計(jì)技術(shù)進(jìn)行因果推論(Sobel，1995，1996，2000;Morgan＆Winship，2007;Winship＆Morgan，1999;Winship＆So-bel，2004)。在各種統(tǒng)計(jì)學(xué)方法中，傾向值匹配(propensityscorematc-hing)受到越來(lái)越多的重視，并在教育學(xué)、傳染病學(xué)以及社會(huì)學(xué)等領(lǐng)域得到了廣泛的應(yīng)用(Harding，20

3、03;Morgan，2001;Morgan＆Harding，2006;Normandetal．，2001;Smith，1997)。相對(duì)于經(jīng)濟(jì)學(xué)的工具變量方法，傾向值匹配在社會(huì)科學(xué)研究中還是一個(gè)新興的統(tǒng)計(jì)技術(shù)。然而，隨著越來(lái)越多的經(jīng)驗(yàn)研究開(kāi)始關(guān)注并且應(yīng)用傾向值匹配，其獨(dú)特的優(yōu)勢(shì)也逐漸展現(xiàn)出來(lái)，因此有著極為廣闊的應(yīng)用前景。本文將從六個(gè)方面系統(tǒng)介紹這一方法。在第一部分，筆者將討論傾向值匹配的歷史、發(fā)展以及它對(duì)社會(huì)學(xué)調(diào)查研究的意義。*作者感謝復(fù)旦大學(xué)社會(huì)學(xué)系周怡教授和北京大學(xué)社會(huì)學(xué)系方文教授的建議和幫助，并感謝匿名審稿人所提出的修改意見(jiàn)。文責(zé)自負(fù)。221社會(huì)學(xué)研究2012．1第二部分將通過(guò)一個(gè)

4、具體實(shí)例來(lái)展示傾向值匹配的具體實(shí)施過(guò)程。在第三部分，筆者將從科技哲學(xué)和統(tǒng)計(jì)學(xué)兩個(gè)方面討論為什么傾向值匹配的結(jié)果可以進(jìn)行因果性解讀。第四部分將把傾向值匹配與其他比較常用的因果推論方法進(jìn)行簡(jiǎn)要對(duì)比并由此展示傾向值匹配相對(duì)于其他方法所特有的優(yōu)勢(shì)。在第五部分，筆者將探討傾向值匹配所存在的一些局限性。最后，簡(jiǎn)要總結(jié)本文內(nèi)容并探討傾向值匹配的最新發(fā)展趨勢(shì)。一、傾向值匹配:歷史、發(fā)展及其對(duì)調(diào)查研究的意義傾向值(propensityscore)這一概念最早出現(xiàn)在1983年羅森鮑姆和魯賓合寫(xiě)的一篇名為《傾向值對(duì)于觀察研究中因果效應(yīng)的中心作用》的論文中(Rosenbaum＆Rubin，1983)。傾向值指

5、被研究的個(gè)體在控制可觀測(cè)到的混淆變量(confoundingvariables)的情況下受到某種自變量影響的條件概率。在一般的實(shí)證研究中，由于存在很多其他變量混淆自變量和因變量之間的關(guān)系，研究者很難直接探索二者之間的“凈效果”(neteffects)。例如，大學(xué)教育的收入回報(bào)可能受到年齡、性別以及地區(qū)差異這些混淆變量的影響。因此，上大學(xué)的人的平均收入與沒(méi)有上大學(xué)的人的平均收入的差異有可能也反映了混淆變量的作用。這些混淆變量的影響通常被稱為選擇性誤差(selectionbias)，而通過(guò)傾向值匹配的方式來(lái)控制和消除選擇性誤差則是羅森鮑姆和魯賓論文的題中之義。羅森鮑姆和魯賓用數(shù)理方法證明:

6、通過(guò)將這些混淆變量納入Logistic回歸模型來(lái)產(chǎn)生一個(gè)預(yù)測(cè)個(gè)體受到自變量影響的概率(傾向值)，研究者可以通過(guò)控制傾向值來(lái)遏制選擇性誤差對(duì)研究結(jié)論的影響從而保證因果結(jié)論的可靠性。在各種控制傾向值的方法中，匹配(matching)比較簡(jiǎn)便易行。其基本邏輯是將受到自變量影響的個(gè)體與沒(méi)有受到影響的個(gè)體進(jìn)行配對(duì)。而傾向值匹配就是保證匹配起來(lái)的個(gè)體的傾向值相等或者近似。再次回到大學(xué)教育的例子，傾向值匹配就是將沒(méi)有受過(guò)大學(xué)教育的人和受過(guò)大學(xué)教育的人配對(duì)并保證他們的傾向值(即上大學(xué)的概率)相同或近似，這樣我們就得到了上過(guò)大學(xué)和沒(méi)上過(guò)大學(xué)兩組個(gè)體。因?yàn)橐延械幕煜兞恳呀?jīng)在基于傾向值的配對(duì)過(guò)程中被控制起

7、來(lái)了，兩組222研究述評(píng)傾向值匹配與因果推論:方法論述評(píng)個(gè)體收入上的差異就只能歸因于大學(xué)教育的有無(wú)，而不是其他混淆變量，由此遏制了選擇性誤差。羅森鮑姆和魯賓的思想與計(jì)量經(jīng)濟(jì)學(xué)家赫克曼的想法不謀而合。從樣本選擇的角度出發(fā)，赫克曼認(rèn)為社會(huì)科學(xué)家在研究某個(gè)自變量效果的時(shí)候會(huì)不自覺(jué)地選擇一些樣本而忽視另外一些。例如，針對(duì)某個(gè)研究項(xiàng)目，不同的個(gè)體有不同的參與意愿，或者研究者對(duì)于研究個(gè)體的選擇有特定的傾向。這些選擇效應(yīng)(selectioneffect)使得

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 23



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無(wú)此問(wèn)題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

傾向值匹配及因果推論

傾向值匹配及因果推論

相關(guān)文章

相關(guān)標(biāo)簽