資源描述:
《利用MATLAB進(jìn)行多元線性回歸課件.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、2.線性回歸b=regress(y,X)[b,bint,r,rint,s]=regress(y,X,alpha)輸入:y~因變量(列向量),X~1與自變量組成的矩陣,Alpha~顯著性水平?(缺省時(shí)設(shè)定為0.05)s:3個(gè)統(tǒng)計(jì)量:決定系數(shù)R2,F(xiàn)值,F(1,n-2)分布大于F值的概率p,p
2、154731.11221425026.2131384522.60231203923.50??????????101545619.30301756927.41體重指數(shù)=體重(kg)/身高(m)的平方吸煙習(xí)慣:0表示不吸煙,1表示吸煙建立血壓與年齡、體重指數(shù)、吸煙習(xí)慣之間的回歸模型模型建立血壓y,年齡x1,體重指數(shù)x2,吸煙習(xí)慣x3y與x1的散點(diǎn)圖y與x2的散點(diǎn)圖線性回歸模型回歸系數(shù)?0,?1,?2,?3由數(shù)據(jù)估計(jì),?是隨機(jī)誤差n=30;m=3;y=[144215138145162142170124158154162150140110128130135114116124136142120
3、120160158144130125175];x1=[394745476546674267566456593442484518201936503921445363292569];x2=[24.231.122.624.025.925.129.519.727.219.328.025.827.320.121.722.227.418.822.621.525.026.223.520.327.128.628.322.025.327.4];x3=[0101101010100001000...00100110101];X=[ones(n,1),x1',x2',x3'];[b,bint,r,rint,
4、s]=regress(y',X);s2=sum(r.^2)/(n-m-1);b,bint,s,s2rcoplot(r,rint)回歸系數(shù)回歸系數(shù)估計(jì)值回歸系數(shù)置信區(qū)間?045.3636[3.553787.1736]?10.3604[-0.07580.7965]?23.0906[1.05305.1281]?311.8246[-0.148223.7973]R2=0.6855F=18.8906p<0.0001s2=169.7917模型求解回歸系數(shù)回歸系數(shù)估計(jì)值回歸系數(shù)置信區(qū)間?058.5101[29.906487.1138]?10.4303[0.12730.7332]?22.3449[0.
5、85093.8389]?310.3065[3.387817.2253]R2=0.8462F=44.0087p<0.0001s2=53.6604剔除異常點(diǎn)(第2點(diǎn)和第10點(diǎn))后xueya01.m此時(shí)可見(jiàn)第二與第十二個(gè)點(diǎn)是異常點(diǎn),于是刪除上述兩點(diǎn),再次進(jìn)行回歸得到改進(jìn)后的回歸模型的系數(shù)、系數(shù)置信區(qū)間與統(tǒng)計(jì)量回歸系數(shù)回歸系數(shù)估計(jì)值回歸系數(shù)置信區(qū)間?058.5101[29.906487.1138]?10.4303[0.12730.7332]?22.3449[0.85093.8389]?310.3065[3.387817.2253]R2=0.8462F=44.0087p<0.0001s2=53
6、.6604這時(shí)置信區(qū)間不包含零點(diǎn),F(xiàn)統(tǒng)計(jì)量增大,可決系數(shù)從0.6855增大到0.8462,我們得到回歸模型為:通常,進(jìn)行多元線性回歸的步驟如下:(1)做自變量與因變量的散點(diǎn)圖,根據(jù)散點(diǎn)圖的形狀決定是否可以進(jìn)行線性回歸;(2)輸入自變量與因變量;(3)利用命令:[b,bint,r,rint,s]=regress(y,X,alpha),rcoplot(r,rint)得到回歸模型的系數(shù)以及異常點(diǎn)的情況;(4)對(duì)回歸模型進(jìn)行檢驗(yàn)首先進(jìn)行殘差的正態(tài)性檢驗(yàn):jbtest,ttest其次進(jìn)行殘差的異方差檢驗(yàn):戈德菲爾德一匡特(Goldfeld—Quandt)檢驗(yàn)戈德菲爾德檢驗(yàn),簡(jiǎn)稱為G—Q檢驗(yàn).為
7、了檢驗(yàn)異方差性,將樣本按解釋變量排序后分成兩部分,再利用樣本1和樣本2分別建立回歸模型,并求出各自的殘差平方和RSSl和RSS2。如果誤差項(xiàng)的離散程度相同(即為同方差的),則RSSl和RSS2的值應(yīng)該大致相同;若兩者之間存在顯著差異,則表明存在異方差.檢驗(yàn)過(guò)程中為了“夸大”殘差的差異性,一般先在樣本中部去掉C個(gè)數(shù)據(jù)(通常取c=n/4),再利用F統(tǒng)計(jì)量判斷差異的顯著性:其中,n為樣本容量,k為自變量個(gè)數(shù).然后對(duì)殘差進(jìn)行自相關(guān)性的檢驗(yàn),通常我們利用DW檢驗(yàn)進(jìn)行