資源描述:
《線性回歸分析課件.ppt》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第十二章線性回歸分析授課教師:楊衛(wèi)華博士主要內(nèi)容★1一元線性回歸的基本思路和步驟2多元線性回歸3SPSS的線性回歸操作第一節(jié)一元線性回歸什么是回歸分析?(Regression)從樣本數(shù)據(jù)出發(fā),確定變量的數(shù)學(xué)關(guān)系式;對關(guān)系式的可信程度進(jìn)行統(tǒng)計(jì)檢驗(yàn),找到影響某一特定變量顯著因素;根據(jù)變量的取值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確程度;回歸分析的一般步驟重點(diǎn)內(nèi)容一元線性回歸涉及一個(gè)自變量的回歸;因變量y與自變量x之間為線性關(guān)系;因變量(dependentvariable):被預(yù)測或被解釋的變量,用y表示。自變量(indep
2、endentvariable):預(yù)測或解釋因變量的一個(gè)或多個(gè)變量,用x表示。因變量與自變量之間的關(guān)系用一條線性方程來表示;一元回歸的例子人均收入是否會顯著影響人均食品消費(fèi)支出;貸款余額是否會影響到不良貸款;航班正點(diǎn)率是否對顧客投訴次數(shù)有顯著影響;廣告費(fèi)用支出是否對銷售額有顯著影響;一元線性回歸模型描述因變量y如何依賴于自變量x和誤差項(xiàng)?的方程稱為回歸模型一元線性回歸模型:y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化引起的y的變化誤差項(xiàng)?是隨機(jī)變量反映了除x和y之間線性關(guān)系之外的隨機(jī)因素對y的影響是不能由x和y
3、之間的線性關(guān)系所解釋的變異性?0和?1稱為模型的參數(shù)一元線性回歸模型(基本假定)誤差項(xiàng)ε是期望值為0的隨機(jī)變量,即E(ε)=0。對于一個(gè)給定的x值,y的期望值為E(y)=?0+?1x對于所有的x值,ε的方差σ2都相同誤差項(xiàng)協(xié)方差等于零,即εi和εj相互獨(dú)立(i≠j);誤差項(xiàng)ε是服從正態(tài)分布的隨機(jī)變量。即ε~N(0,σ2)回歸方程(regressionequation)描述y的平均值或期望值如何依賴于x的方程稱為回歸方程;一元線性回歸方程的形式如下:E(y)=?0+?1x方程表示一條直線,也稱為直線回歸方程;?0是回歸直線在y軸上的截距,是當(dāng)x=
4、0時(shí)y的期望值;?1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值;估計(jì)的回歸方程(estimatedregressionequation)一元線性回歸中估計(jì)的回歸方程為:用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程;總體回歸參數(shù)和是未知的,必須利用樣本數(shù)據(jù)去估計(jì);其中:是估計(jì)的回歸直線在y軸上的截距,是直線的斜率,它表示對于一個(gè)給定的x的值,是y的估計(jì)值,也表示x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值。普通最小二乘法估計(jì)(OLS:OrdinaryLeastSquare)使因變量的觀察值與估計(jì)值之間的離差平方
5、和達(dá)到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小最小二乘估計(jì)(圖示)xy(xn,yn)(x1,y1)?????????(x2,y2)(xi,yi)}ei=yi-yi^最小二乘法(和的計(jì)算公式)?根據(jù)最小二乘法的要求,可得求解和的公式如下一元回歸方程統(tǒng)計(jì)檢驗(yàn)的主要內(nèi)容變差因變量y取值的波動(dòng)稱為變差變差來源于兩個(gè)方面:由于自變量x的取值不同造成;除x以外的其他因素(如測量誤差等)的影響;對一個(gè)具體的觀測值來說,變差的大小可以通過該實(shí)際觀測值與其均值之差來表示。變差的分解(圖示)xyy{}}
6、?離差平方和的分解(三個(gè)平方和的意義)總平方和(SST)反映因變量的n個(gè)觀察值與其均值的總離差;回歸平方和(SSR)反映自變量x的變化對因變量y取值變化的影響,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和;殘差平方和(SSE)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和;離差平方和的分解(三個(gè)平方和的關(guān)系)SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{判定系數(shù)R2(coefficientofdetermination)回歸平方和占總離差平方和的比例反映回歸
7、方程的擬合程度;取值范圍在[0,1]之間;R2?1,說明回歸方程擬合的越好;R2?0,說明回歸方程擬合的越差;一元線性回歸中,判定系數(shù)等于y和x相關(guān)系數(shù)的平方,即R2=(r)2;線性關(guān)系的檢驗(yàn)檢驗(yàn)所有自變量與因變量之間的線性關(guān)系是否顯著;將均方回歸(MSR)同均方殘差(MSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著;均方回歸:回歸平方和SSR除以相應(yīng)的自由度(自變量的個(gè)數(shù)K);均方殘差:殘差平方和SSE除以相應(yīng)的自由度(n-k-1)。線性關(guān)系的檢驗(yàn)(檢驗(yàn)的步驟)提出假設(shè)H0:?1=0所有回歸系數(shù)與零無顯著差異,y與全體x的線性關(guān)系不顯
8、著計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平?,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F?作出決策:若F>F?,拒絕H0;若F