資源描述:
《放寬條件的回歸模型異方差性.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第六章放寬條件的回歸模型(2)異方差性教師:盧時光在前面的學(xué)習(xí)中,我們詳盡的考察了經(jīng)典正態(tài)線性回歸模型,我們用它來進行估計和假設(shè)檢驗和預(yù)測問題。但是,這個模型是建立在一些簡化了的假定基礎(chǔ)之上的。這些假定包括:1.回歸模型對于參數(shù)而言是線性的。2.各回歸元X的值在重復(fù)抽樣中是固定的。3.給定的X,干擾ui的均值為零。4.對于給定的X,ui的方差不變或稱之為同方差性。5.對于給定的X,干擾無自相關(guān)。6.如果X是隨機的,則干擾項與各個X是獨立的至少是不相關(guān)的。7.觀測的次數(shù)大于回歸元的個數(shù)。8.回歸元的取值必須有足夠的變異性。9.回歸模型被正確的設(shè)定。10.回歸元之
2、間無多重共線性。11.隨機干擾項ui是正態(tài)分布的。遺憾的是,我們尚無法對所有的問題都給出令人滿意的答案。接下來的工作中,我們對某些假定給予更多的注意,當(dāng)然有些假定我們并不過分的深究,特別是假定1、2、3、6和11中的問題。威瑟里爾(Wetherill)指出,實際上在應(yīng)用經(jīng)典線性回歸模型時,有兩類問題需要注意:(1)關(guān)于模型設(shè)定及對干擾項ui的假定問題,諸如假定1、2、3、4、5、9和11;(2)關(guān)于對數(shù)據(jù)的假定問題,諸如6、7、8和10。關(guān)于對來自干擾和模型設(shè)定的假定問題主要有三:1.要偏離一個具體的假定多遠才會產(chǎn)生不可忽視的差別?如ui不是正態(tài)分布,那么我們能
3、夠容忍多大程度上的正態(tài)性偏離?2.在一個具體問題中,我們怎樣發(fā)現(xiàn)某一個假定被破壞?比方說我們介紹過利用雅克-貝拉檢驗來檢驗ui的正態(tài)性。3.如果一個或者多個假定被破壞,我們能夠采用什么樣的補救措施?在剩下的問題中,假定7、8和10是緊密相關(guān)的,我們在多重共線性問題中探討;假定4在異方差問題中探討;假定5在自相關(guān)問題中探討。我們在探討這些問題的時候,遵循下列范式:1.明確問題的性質(zhì);2.分析它的影響;3.提出偵測它的方法;4.考慮補救的措施。2異方差性經(jīng)典線性回歸模型假定:假定4:對于給定的X,ui的方差不變或稱之為同方差性。1.異方差的性質(zhì)以解釋變量的給定值為條
4、件的每一個干擾ui的方差是一個等于的常數(shù),即同方差性。同方差性意味等同的分散程度。用符號來表示:從圖形上來看,以給定Xi為條件的Yi的條件方差(等于ui的條件方差),不管變量X取什么值,都保持不變。如果隨著Xi的取值的變化,方差不再是一個常數(shù),則稱存在異方差性。用符號來表示:下圖表明,Yi的條件方差隨著X增加而增加:ui方差變化的理由(1)邊錯邊改學(xué)習(xí)模型。人們在學(xué)習(xí)的過程中,其行為誤差隨時間而減少。這時,預(yù)測會減小。例如,在給定的時間里,隨著打字練習(xí)時間的增加,不僅打字出錯的個數(shù)而且打錯個數(shù)的方差都有所下降。很多人類的行為,包括經(jīng)濟行為也遵循著學(xué)習(xí)模型。例如生
5、產(chǎn)。(2)隨著收入的增長,人們有更多的備用收入,從而如何支配它們的收入有了更大的選擇范圍。例如,做儲蓄對收入的回歸時,很可能發(fā)現(xiàn)與收入具增。同理利潤豐厚的公司比利潤微薄的公司在紅利分配政策上,可以預(yù)料有更大的變化。(3)隨著數(shù)據(jù)采集技術(shù)的改進,可能減小。(4)異常值出現(xiàn),往往產(chǎn)生異方差。例如,下圖描繪了二次世界大戰(zhàn)之后到1969年20個國家的股票價格波動于消費價格波動的關(guān)系。圖中,智利的觀測值遠大于其他國家,可看做一個異常值。類似這種情況,同方差性就無法保證了。剔除異常值是通常維持同方差性的方法之一。(5)回歸模型設(shè)定是不正確的。例如在一個對商品的需求函數(shù)中,忽
6、略了互補或替代商品的價格,則回歸殘差可能會給人以異方差的表象;而將所忽略的變量包含在內(nèi)時,這種印象也許就消失了。注意,異方差問題在橫截面數(shù)據(jù)中比時間序列數(shù)據(jù)中更常見??紤]下面一個例子。平均地來看,大的廠商比小的廠商平均支付更多的工資。但是在不同的行業(yè)工資有較大的變異性。這一點還可以從職工人數(shù)組組內(nèi)的工資極差(最高與最低值的差)看出來。從一組到另一組,極差說明了各職工人數(shù)組的工資收入的異方差性。2.出現(xiàn)異方差時的OLS估計現(xiàn)在引入異方差性,保留經(jīng)典模型的其他所有假定,雙變量模型的OLS估計是:此時,方差的表達式不同于同方差假定下的方差公式:當(dāng)然如果對于每一個i都有
7、,這兩個公式是相同的。如果經(jīng)典模型的所有假定,包括同方差性在內(nèi),全部成立,則是最優(yōu)線性無偏估計量(BLUE)。現(xiàn)在我們?nèi)∠讲钚缘募僭O(shè),容易證明仍然是線性的和無偏的。但是它不是最優(yōu)的。為什么雖然是無偏的但不是最優(yōu)的?直觀的理由是:好比在一個袋子中隨機摸兩種顏色的彩球,如果紅球的數(shù)量是黑球的兩倍,那么隨機摸出紅球的數(shù)量也是黑球的兩倍,公平起見,我們規(guī)定摸一次黑球等于兩個紅球,這樣摸出紅球和黑球的幾率才會相等。那么我們?nèi)绾卧诨貧w中利用這種組間的變異呢?如圖所示,個就業(yè)組之間的工薪收入有相當(dāng)大的變異。如果我們做工薪收入對就業(yè)人數(shù)回歸,不同就業(yè)人數(shù)的工薪收入變化是不同
8、的,雇傭人數(shù)少的和雇傭人