資源描述:
《利用MATLAB進行多元線性回歸.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應用文檔-天天文庫。
1、2.線性回歸b=regress(y,X)[b,bint,r,rint,s]=regress(y,X,alpha)輸入:y~因變量(列向量),X~1與自變量組成的矩陣,Alpha~顯著性水平?(缺省時設定為0.05)s:3個統(tǒng)計量:決定系數(shù)R2,F(xiàn)值,F(1,n-2)分布大于F值的概率p,p
2、重指數(shù)吸煙習慣11443924.20211363625.0022154731.11221425026.2131384522.60231203923.50??????????101545619.30301756927.41體重指數(shù)=體重(kg)/身高(m)的平方吸煙習慣:0表示不吸煙,1表示吸煙建立血壓與年齡、體重指數(shù)、吸煙習慣之間的回歸模型模型建立血壓y,年齡x1,體重指數(shù)x2,吸煙習慣x3y與x1的散點圖y與x2的散點圖線性回歸模型回歸系數(shù)?0,?1,?2,?3由數(shù)據(jù)估計,?是隨機誤差n=30;m=3;y=[14421
3、5138145162142170124158154162150140110128130135114116124136142120120160158144130125175];x1=[394745476546674267566456593442484518201936503921445363292569];x2=[24.231.122.624.025.925.129.519.727.219.328.025.827.320.121.722.227.418.822.621.525.026.223.520.327.128.628
4、.322.025.327.4];x3=[0101101010100001000...00100110101];X=[ones(n,1),x1',x2',x3'];[b,bint,r,rint,s]=regress(y',X);s2=sum(r.^2)/(n-m-1);b,bint,s,s2rcoplot(r,rint)回歸系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間?045.3636[3.553787.1736]?10.3604[-0.07580.7965]?23.0906[1.05305.1281]?311.8246[-0.14
5、8223.7973]R2=0.6855F=18.8906p<0.0001s2=169.7917模型求解回歸系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間?058.5101[29.906487.1138]?10.4303[0.12730.7332]?22.3449[0.85093.8389]?310.3065[3.387817.2253]R2=0.8462F=44.0087p<0.0001s2=53.6604剔除異常點(第2點和第10點)后xueya01.m此時可見第二與第十二個點是異常點,于是刪除上述兩點,再次進行回歸得到改進后的回
6、歸模型的系數(shù)、系數(shù)置信區(qū)間與統(tǒng)計量回歸系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間?058.5101[29.906487.1138]?10.4303[0.12730.7332]?22.3449[0.85093.8389]?310.3065[3.387817.2253]R2=0.8462F=44.0087p<0.0001s2=53.6604這時置信區(qū)間不包含零點,F(xiàn)統(tǒng)計量增大,可決系數(shù)從0.6855增大到0.8462,我們得到回歸模型為:通常,進行多元線性回歸的步驟如下:(1)做自變量與因變量的散點圖,根據(jù)散點圖的形狀決定是否可以進
7、行線性回歸;(2)輸入自變量與因變量;(3)利用命令:[b,bint,r,rint,s]=regress(y,X,alpha),rcoplot(r,rint)得到回歸模型的系數(shù)以及異常點的情況;(4)對回歸模型進行檢驗首先進行殘差的正態(tài)性檢驗:jbtest,ttest其次進行殘差的異方差檢驗:戈德菲爾德一匡特(Goldfeld—Quandt)檢驗戈德菲爾德檢驗,簡稱為G—Q檢驗.為了檢驗異方差性,將樣本按解釋變量排序后分成兩部分,再利用樣本1和樣本2分別建立回歸模型,并求出各自的殘差平方和RSSl和RSS2。如果誤差項的
8、離散程度相同(即為同方差的),則RSSl和RSS2的值應該大致相同;若兩者之間存在顯著差異,則表明存在異方差.檢驗過程中為了“夸大”殘差的差異性,一般先在樣本中部去掉C個數(shù)據(jù)(通常取c=n/4),再利用F統(tǒng)計量判斷差異的顯著性:其中,n為樣本容量,k為自變量個數(shù).然后對殘差進行自相關(guān)性的檢驗,通常我們利用DW檢驗進行