廣義可加模型和經(jīng)典線性回歸模型比較探究

廣義可加模型和經(jīng)典線性回歸模型比較探究

ID:44086023

大?。?5.50 KB

頁數(shù):3頁

時間:2019-10-18

廣義可加模型和經(jīng)典線性回歸模型比較探究_第1頁
廣義可加模型和經(jīng)典線性回歸模型比較探究_第2頁
廣義可加模型和經(jīng)典線性回歸模型比較探究_第3頁
資源描述:

《廣義可加模型和經(jīng)典線性回歸模型比較探究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、廣義可加模型和經(jīng)典線性回歸模型比較探【摘要】本文首先從模型設(shè)定上比較了廣義可加模型和經(jīng)典線性回歸模型的差異。然后,運(yùn)用這兩種模型進(jìn)行實(shí)證分析,研究教育水平、工作年限、每天工作時間這三個變量對總收入的影響,比較這兩種模型回歸結(jié)果的不同。最后,進(jìn)行總結(jié)。【關(guān)鍵詞】廣義可加模型,經(jīng)典線性回歸模型一、經(jīng)典線性回歸模型和廣義可加模型的模型設(shè)定比較設(shè)Y為響應(yīng)變量,XI,X2,X3,……,Xp為解釋變量,經(jīng)典線性回歸模型一般可表示為如下形式:E(Y/Xl,X2,X3,,Xp)=?茁0+?茁1X1+?茁2x2++?茁pXp其中,?茁0,?茁1,?茁2,……,?茁p的參數(shù)估計(jì)一般通過最小二

2、乘來獲得。上述的經(jīng)典線性回歸模型是參數(shù)模型。當(dāng)模型中函數(shù)的具體形式未知,我們擬合參數(shù)模型時就會遇到困難。Stone(1985)第一次提出了可加模型,其形式為:E(Y/Xl,X2,X3,,Xp)=?琢+fl(XI)+f2(x2)+……+fp(Xp)其中,?琢為截距,fi(xi),1=1,2,……為光滑函數(shù),是針對于每個解釋變量的任意單變量函數(shù),滿足Esi(Xi)oHastie和Tibshirani(1990)年將可加模型應(yīng)用到廣義線性模型中,由此提出了廣義可加模型:g(?滋)=?琢+fl(XI)+f2(x2)+……+fp(Xp)其中,?滋二E(Y/Xl,X2,X3,……,X

3、p),g(?滋)是連接函數(shù)。在該模型中,響應(yīng)變量的分布不僅可以是正態(tài)分布,也可以是二項(xiàng)分布、卡方分布等。廣義可加模型對樣本的要求較少,適用范圍非常廣泛。比較經(jīng)典線性回歸模型與廣義可加模型的形式,我們可以明顯地看出其中的不同,廣義可加模型中,各項(xiàng)沒有具體的參數(shù)形式,該模型允許解釋變量以非參數(shù)光滑的形式進(jìn)入模型。廣義可加模型的估計(jì)與經(jīng)典線性回歸模型相似,都是借助最小二乘法使期望值與觀測值間的差距達(dá)到最小,但廣義可加模型大大降低了線性設(shè)定帶來的模型設(shè)定風(fēng)險(xiǎn)。二、實(shí)證分析(一)數(shù)據(jù)來源和解釋變量的選取我們從2002年ChineseHouseholdIncomeProject(簡稱

4、CHIPS)的調(diào)查數(shù)據(jù)中選擇了總收入作為被解釋變量y,教育水平xl、工作年限x2、每日工作時間x3這三個變量作為解釋變量,研究個人的教育水平、工作年限、每日工作時間對其總收入有什么樣的影響。本文一共選取了10200個樣本,運(yùn)用R軟件,分別用廣義可加模型和經(jīng)典線性回歸模型進(jìn)行估計(jì)。(二)經(jīng)典線性回歸模型和廣義可加模型的估計(jì)結(jié)果比較經(jīng)典線性回歸模型估計(jì)結(jié)果顯示,解釋變量教育水平X1和工作年限x2的P值均小于2e-16,這兩個變量顯著。然而,每日工作時間x3的P值遠(yuǎn)大于0.1,該變量不顯著。這些參數(shù)結(jié)果表明,用經(jīng)典線性回歸模型進(jìn)行分析,教育水平、工作年限對總收入有著顯著的正向影

5、響,而每日工作時間對總收入沒有顯著影響。而在廣義可加模型的回歸結(jié)果中,教育水平、工作年限和每日工作時間對總收入均存在顯著影響。顯然,從上述結(jié)果中我們可以看出,兩種模型下,解釋變量x3每天工作時間對總收入的影響結(jié)果不同。對這三個解釋變量與響應(yīng)變量之間的效應(yīng)進(jìn)行分析,我們發(fā)現(xiàn)教育水平、工作年限與總收入存在著正相關(guān)關(guān)系,雖然用線性估計(jì)誤差會較大,但不會出現(xiàn)嚴(yán)重的錯誤,因此這兩個解釋變量通過檢驗(yàn)。但是每天工作時間與總收入間的關(guān)系比較復(fù)雜,用線性模型進(jìn)行估計(jì)就會存在較大的誤差,甚至得出錯誤的結(jié)論。因此,如表1顯示的那樣,經(jīng)典線性回歸模型中每天工作時間的參數(shù)估計(jì)沒有通過檢驗(yàn),而廣義可

6、加模型中,該解釋變量在5%顯著性水平下通過了檢驗(yàn)。我們再對這個兩個模型進(jìn)行ANOVA檢驗(yàn),經(jīng)典線性回歸模型的回歸殘差為7.07E+11,大于可加模型的回歸殘差6.99E+llo而且兩者間的差異較大,P

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。