資源描述:
《一元線性回歸.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、§3一元線性回歸返回目錄變量之間的關(guān)系大致有兩種:1.函數(shù)關(guān)系:確定性關(guān)系2.相關(guān)關(guān)系:非確定性關(guān)系社會(huì)經(jīng)濟(jì)領(lǐng)域中,投入與產(chǎn)出;價(jià)格與需求的關(guān)系等.例如:人的身高與體重;人的年齡與血壓;(一)一元線性回歸x:普通變量,Y:隨機(jī)變量,對(duì)Y獨(dú)立觀察得到當(dāng)x取定一組不完全相同的值對(duì)應(yīng)的樣本值用樣本來(lái)估計(jì)Y關(guān)于x的回歸函數(shù)μ(x).例1為研究某化學(xué)反應(yīng)過(guò)程中,溫度x(℃)對(duì)產(chǎn)品得率Y(%)的影響,測(cè)得數(shù)據(jù)如下:x(℃)100110120130140150160170180190Y(%)45515461667074788589散點(diǎn)圖稱為一元線性回歸模型,b稱為回歸
2、系數(shù).其中未知參數(shù)a,b和都不依賴于x,一元線性回歸假設(shè)對(duì)x的每一個(gè)值有Y有兩部分組成:x的線性函數(shù)隨機(jī)誤差記(二)a,b的估計(jì)作獨(dú)立試驗(yàn),得到樣本當(dāng)x取一組不全相同的值相互獨(dú)立,相互獨(dú)立,它們的聯(lián)合密度是用最大似然估計(jì)法估計(jì)a,b.L最大,只需下式最小,正規(guī)方程組:系數(shù)行列式∴有唯一解,回歸函數(shù)的估計(jì)稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,簡(jiǎn)稱回歸方程,其圖形稱為回歸直線.例2例1中為研究某化學(xué)反應(yīng)過(guò)程中,溫度x(℃)對(duì)產(chǎn)品得率Y(%)的影響,測(cè)得數(shù)據(jù)如下:x(℃)100110120130140150160170180190Y(%)4551546166707478
3、8589計(jì)算回歸直線方程:或(三)σ2的估計(jì)記稱為處的殘差.殘差平方和是與處的觀察值的偏差的平方和.Qe的分解:Qe的一個(gè)分解式:σ2的無(wú)偏估計(jì)量:記可證明:例3求例2中σ2的無(wú)偏估計(jì).(四)線性假設(shè)的顯著性檢驗(yàn)提出假設(shè)可以證明,與Qe獨(dú)立,當(dāng)H0為真時(shí),拒絕域:例4檢驗(yàn)例2中的回歸效果是否顯著,α=0.05拒絕認(rèn)為回歸效果是顯著的.*(五)系數(shù)b的置信區(qū)間b的置信水平為1-α的置信區(qū)間為=(0.45894,0.50712)例2中b的置信水平為0.95的置信區(qū)間為*(六)回歸函數(shù)μ(x)=a+bx函數(shù)值的點(diǎn)估計(jì)和置信區(qū)間點(diǎn)估計(jì):相應(yīng)的估計(jì)量:可以證明,與
4、獨(dú)立,置信水平為1-α的置信區(qū)間或(七)Y的觀察值的點(diǎn)預(yù)測(cè)和預(yù)測(cè)區(qū)間點(diǎn)預(yù)測(cè):相互獨(dú)立,Y0的置信水平為1-α的預(yù)測(cè)區(qū)間1*該區(qū)間以為中心,長(zhǎng)度為是x0的函數(shù);或2*在處區(qū)間長(zhǎng)度最短,x0越遠(yuǎn)離,則長(zhǎng)度就越長(zhǎng),隨n的增加,長(zhǎng)度縮短;3*置信區(qū)間的上限與下限的曲線對(duì)稱地落在回歸直線的兩側(cè),成喇叭型.例5例2中(1)*求回歸函數(shù)μ(x)在x=125處的值μ(125)的置信水平為0.95的置信區(qū)間,求在x=125處Y的新觀察值Y0置信水平為0.95的預(yù)測(cè)區(qū)間;(2)求在x=x0處Y的新觀察值Y0置信水平為0.95的預(yù)測(cè)區(qū)間;=57.64=0.84回歸函數(shù)μ(x)
5、在x=125處的值μ(125)的置信水平為0.95的置信區(qū)間為(57.64±0.84)=(56.80,58.48)在x=125處得率Y0的置信水平為0.95的預(yù)測(cè)區(qū)間(57.64±2.34)=(55.3059.98)(2)求在x=x0處得率Y0的置信水平為0.95的預(yù)測(cè)區(qū)間:=2.34(八)可化為一元線性回歸的例子變量之間的相關(guān)關(guān)系在實(shí)際中往往不一定是線性的,直接求解回歸曲線往往比較困難,對(duì)一些特殊類型,可通過(guò)適當(dāng)?shù)淖兞刻鎿Q化為線性回歸問(wèn)題來(lái)處理.通常需要用回歸曲線來(lái)描述.常見(jiàn)的曲線方程及其圖形如下:1.雙曲線型原方程:變換方法:變換后方程:2.指數(shù)曲線
6、型(之一)原方程:變換方法:變換后方程:原方程:變換方法:變換后方程:(之二)3.冪函數(shù)型原方程:變換方法:變換后方程:4.對(duì)數(shù)曲線型原方程:變換方法:變換后方程:5.S曲線型原方程:變換方法:變換后方程:例6:為了解百貨商店銷售額x與流通費(fèi)率(這是反映商業(yè)活動(dòng)的一個(gè)質(zhì)量指標(biāo),指每元商品流轉(zhuǎn)額所分?jǐn)偟牧魍ㄙM(fèi)用)y之間的關(guān)系,收集了九個(gè)商店的有關(guān)數(shù)據(jù)見(jiàn)下表:i銷售額(x:萬(wàn)元)流通費(fèi)率(y:%)11.57.124.54.837.53.6410.53.1513.52.7616.52.5719.52.4822.52.3925.52.2解:(1)x與y的散點(diǎn)圖:
7、觀察上述散點(diǎn)圖可以發(fā)現(xiàn),這九個(gè)點(diǎn)大致在一條曲線附近,因而宜用曲線去擬合這批數(shù)據(jù),即建立回歸曲線方程.回歸曲線的形式確定,應(yīng)盡可能地采用專業(yè)知識(shí),此外也可以與典型的函數(shù)圖象對(duì)照使用.此時(shí)可能有多種選擇方案,對(duì)本例來(lái)講可選用(2)確定回歸曲線類型(3)對(duì)原始數(shù)據(jù)作相應(yīng)的變量替換,變換后的數(shù)據(jù)列表11.57.00.40551.94597.16650.166524.54.81.50411.56864.48850.311537.53.62.01491.28093.61090.0109410.53.12.35141.13143.12880.0228513.52.72
8、.60270.99332.81120.1112616.52.52.80340.9