資源描述:
《廣義可加模型和經(jīng)典線性回歸模型比較探究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、廣義可加模型和經(jīng)典線性回歸模型比較探【摘要】本文首先從模型設(shè)定上比較了廣義可加模型和經(jīng)典線性回歸模型的差異。然后,運用這兩種模型進(jìn)行實證分析,研究教育水平、工作年限、每天工作時間這三個變量對總收入的影響,比較這兩種模型回歸結(jié)果的不同。最后,進(jìn)行總結(jié)。【關(guān)鍵詞】廣義可加模型,經(jīng)典線性回歸模型一、經(jīng)典線性回歸模型和廣義可加模型的模型設(shè)定比較設(shè)Y為響應(yīng)變量,XI,X2,X3,……,Xp為解釋變量,經(jīng)典線性回歸模型一般可表示為如下形式:E(Y/Xl,X2,X3,,Xp)=?茁0+?茁1X1+?茁2x2++?茁pXp其中,?茁0,?茁1,?茁2,……,?茁p的參數(shù)估計一般通過最小二
2、乘來獲得。上述的經(jīng)典線性回歸模型是參數(shù)模型。當(dāng)模型中函數(shù)的具體形式未知,我們擬合參數(shù)模型時就會遇到困難。Stone(1985)第一次提出了可加模型,其形式為:E(Y/Xl,X2,X3,,Xp)=?琢+fl(XI)+f2(x2)+……+fp(Xp)其中,?琢為截距,fi(xi),1=1,2,……為光滑函數(shù),是針對于每個解釋變量的任意單變量函數(shù),滿足Esi(Xi)oHastie和Tibshirani(1990)年將可加模型應(yīng)用到廣義線性模型中,由此提出了廣義可加模型:g(?滋)=?琢+fl(XI)+f2(x2)+……+fp(Xp)其中,?滋二E(Y/Xl,X2,X3,……,X
3、p),g(?滋)是連接函數(shù)。在該模型中,響應(yīng)變量的分布不僅可以是正態(tài)分布,也可以是二項分布、卡方分布等。廣義可加模型對樣本的要求較少,適用范圍非常廣泛。比較經(jīng)典線性回歸模型與廣義可加模型的形式,我們可以明顯地看出其中的不同,廣義可加模型中,各項沒有具體的參數(shù)形式,該模型允許解釋變量以非參數(shù)光滑的形式進(jìn)入模型。廣義可加模型的估計與經(jīng)典線性回歸模型相似,都是借助最小二乘法使期望值與觀測值間的差距達(dá)到最小,但廣義可加模型大大降低了線性設(shè)定帶來的模型設(shè)定風(fēng)險。二、實證分析(一)數(shù)據(jù)來源和解釋變量的選取我們從2002年ChineseHouseholdIncomeProject(簡稱
4、CHIPS)的調(diào)查數(shù)據(jù)中選擇了總收入作為被解釋變量y,教育水平xl、工作年限x2、每日工作時間x3這三個變量作為解釋變量,研究個人的教育水平、工作年限、每日工作時間對其總收入有什么樣的影響。本文一共選取了10200個樣本,運用R軟件,分別用廣義可加模型和經(jīng)典線性回歸模型進(jìn)行估計。(二)經(jīng)典線性回歸模型和廣義可加模型的估計結(jié)果比較經(jīng)典線性回歸模型估計結(jié)果顯示,解釋變量教育水平X1和工作年限x2的P值均小于2e-16,這兩個變量顯著。然而,每日工作時間x3的P值遠(yuǎn)大于0.1,該變量不顯著。這些參數(shù)結(jié)果表明,用經(jīng)典線性回歸模型進(jìn)行分析,教育水平、工作年限對總收入有著顯著的正向影
5、響,而每日工作時間對總收入沒有顯著影響。而在廣義可加模型的回歸結(jié)果中,教育水平、工作年限和每日工作時間對總收入均存在顯著影響。顯然,從上述結(jié)果中我們可以看出,兩種模型下,解釋變量x3每天工作時間對總收入的影響結(jié)果不同。對這三個解釋變量與響應(yīng)變量之間的效應(yīng)進(jìn)行分析,我們發(fā)現(xiàn)教育水平、工作年限與總收入存在著正相關(guān)關(guān)系,雖然用線性估計誤差會較大,但不會出現(xiàn)嚴(yán)重的錯誤,因此這兩個解釋變量通過檢驗。但是每天工作時間與總收入間的關(guān)系比較復(fù)雜,用線性模型進(jìn)行估計就會存在較大的誤差,甚至得出錯誤的結(jié)論。因此,如表1顯示的那樣,經(jīng)典線性回歸模型中每天工作時間的參數(shù)估計沒有通過檢驗,而廣義可
6、加模型中,該解釋變量在5%顯著性水平下通過了檢驗。我們再對這個兩個模型進(jìn)行ANOVA檢驗,經(jīng)典線性回歸模型的回歸殘差為7.07E+11,大于可加模型的回歸殘差6.99E+llo而且兩者間的差異較大,P