應(yīng)用數(shù)理統(tǒng)計(jì)第5章new

應(yīng)用數(shù)理統(tǒng)計(jì)第5章new

ID:34373445

大?。?00.40 KB

頁(yè)數(shù):67頁(yè)

時(shí)間:2019-03-05

應(yīng)用數(shù)理統(tǒng)計(jì)第5章new_第1頁(yè)
應(yīng)用數(shù)理統(tǒng)計(jì)第5章new_第2頁(yè)
應(yīng)用數(shù)理統(tǒng)計(jì)第5章new_第3頁(yè)
應(yīng)用數(shù)理統(tǒng)計(jì)第5章new_第4頁(yè)
應(yīng)用數(shù)理統(tǒng)計(jì)第5章new_第5頁(yè)
資源描述:

《應(yīng)用數(shù)理統(tǒng)計(jì)第5章new》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、第5章線性回歸模型第5.1節(jié)線性模型理論第5.2節(jié)一元回歸與相關(guān)分析第5.3節(jié)多元回歸分析東北大學(xué)數(shù)學(xué)系第5.1節(jié)線性模型理論5.1.1線性模型的定義定義5.1.1y是可觀察的隨機(jī)變量,x1,…,xm是可觀察的分類(lèi)或數(shù)值變量,β0,…,βk是未知參數(shù),2ε是不可觀察隨機(jī)誤差(ε~N(0,σ))。kyf=β01++∑im(,,)x?xβεii=1稱(chēng)為是線性模型。Remark①線性模型中“線性”是針對(duì)未知參數(shù)β而言,許多表面上的非線性模型本質(zhì)也是線性的:βx×β2y=αeε,y=αx×ε,lnε~N(0,σ)

2、;而有些模型是實(shí)質(zhì)上的非線性模型:βx+2y=αeε,ε~N(0,σ);以及Logistic模型:exp(αβ+x)y=+ε1exp(++αβx)②一些統(tǒng)計(jì)學(xué)家喜歡把線性模型表示成:Ey=β0+x1β1+…+xkβk含義是:線性模型就是一個(gè)隨機(jī)變量的數(shù)學(xué)期望具有未知參數(shù)線性結(jié)構(gòu)的統(tǒng)計(jì)模型。在這種意義下x1,…,xk很自然就被稱(chēng)為“自變量”,y也就被稱(chēng)作“因變量”。自變量與因變量關(guān)系是一種統(tǒng)計(jì)上的關(guān)系,即因變量的均值是自變量的函數(shù),而決不能認(rèn)為因變量是自變量的函數(shù)。③把模型Ey=β0+x1β1+…+xkβk

3、改寫(xiě)成:y=β0+x1β1+…+xkβk+ε,Eε=0為方便處理,進(jìn)一步假定ε~N(0,σ2)。要處理這k+1個(gè)未知參數(shù)β0,…,βk,需要至少做n次獨(dú)立試驗(yàn)(n>k+1);這些試驗(yàn)都在不同自變量取值下進(jìn)行,其它條件都保持不變,最后寫(xiě)成矩陣的表達(dá)式,就是:Y=Xβ+ε,Eε=0Y=Xβ+ε,Eε=0這里Y=(y1,…,yn)T表示??1.xx..111k可觀察的因變量;??1.xx..TX=??212kβ=(β0,…,βk)表示??......待估計(jì)或檢驗(yàn)的未知參數(shù);????1.xx..,…,T??nn1

4、kε=(ε1εn)是隨機(jī)誤差,一般假定2εi~N(0,σ)。表示自變量,n>k+15.1.2線性模型參數(shù)的估計(jì)Y=Xβ+ε1.未知參數(shù)β的估計(jì)采用最小二乘的標(biāo)準(zhǔn),即尋找β?,使得:

5、

6、Y-X

7、

8、β?2=inf

9、

10、Y-Xβ

11、

12、2對(duì)所有β∈Rk+1這樣得到的β的估計(jì)稱(chēng)為是最小二乘估計(jì)(LSE)LSE的求解思路:平方和分解

13、

14、Y–Xβ

15、

16、2=

17、

18、Y–X+X(–β?β?β)

19、

20、2=

21、

22、Y–X

23、

24、β?2+

25、

26、X(–β?β)

27、

28、2+2(–β?β)TXT(Y–X)β?因此要使得對(duì)一切β∈Rk+1都有

29、

30、Y–Xβ

31、

32、2≥

33、

34、

35、Y–X

36、

37、β?2,充分必要條件是:(–β?β)TXT(Y–X)=0β?對(duì)一切β∈Rk+1都成立由于β是Rk+1中任意一個(gè)向量,所以XT(Y–X)β?必須是一個(gè)k+1維零向量,即:(XTX)=Xβ?TY(正規(guī)方程)如果X是滿(mǎn)秩矩陣即rk(X)=k+1時(shí),正規(guī)方程的解:β?=(XTX)-1XTY≡S-1XTY就稱(chēng)為是線性模型Y=Xβ+ε中參數(shù)向量β的最小二乘估計(jì)(LSE)Xβ?稱(chēng)為是經(jīng)驗(yàn)回歸函數(shù),Y=Xβ?是經(jīng)驗(yàn)回歸方程。2.誤差方差2σ的估計(jì)把線性模型Y=Xβ+ε改寫(xiě)成如下形式:yi=β0+β1xi1+

38、…+βkxik+εi,1≤i≤n定義“殘差”(Residual)ei=yi--β?β?xi1-…-β?xik,1≤i≤n01k作為隨機(jī)誤差εi的“估計(jì)”,則殘差平方和:Q=e2+e2+…+e2e12n=

39、

40、Y-X

41、

42、β?2=YT(I-XS–1XT)Yn可以作為2σ的估計(jì)(注意需要修正!)定理5.1.1線性模型的最小二乘估計(jì)(1)對(duì)于模型Y=Xβ+ε,β的LSE是β?=S-1XTY(2)σ2的LSE是σ?2=————Y1T(I-XS–1XT)Ynn-k-1思考既然n個(gè)觀察數(shù)據(jù)y1,…,yn的方差都是σ2,為

43、什么不使用這組數(shù)據(jù)的樣本方差,而是要用殘差平方和修正以后去估計(jì)2σ?最小二乘估計(jì)的矩陣代數(shù)含義考慮矩陣X的k+1個(gè)n維列向量生成的Rn中的線性子空間μ(X),不難證明μ(X)=μ(XXT)。由于XS–1XT是一個(gè)對(duì)稱(chēng)、冪等的n階方陣,即它是一個(gè)正投影陣,恰好是μ(X)的投影矩陣;而In–XS-1XT是μ(X)的正交子空間μ⊥(X)的投影矩陣,因此Xβ?是Y到子空間μ(X)中的投影,2⊥σ的LSE只和Y在μ(X)的投影向量有關(guān)。μ⊥(X)Yμ(X)3.最小二乘估計(jì)的無(wú)偏性質(zhì)引理5.1.2隨機(jī)向量的期望與方差

44、公式(1)如果Y是n維隨機(jī)向量,A是n階對(duì)稱(chēng)矩陣則E(YTAY)=(EY)TA(EY)+tr{A[Var(Y)]};(2)如果Y是n維隨機(jī)向量,B是m×n階矩陣則Var(BY)=B[Var(Y)]BTRemarkVar(Y)是Y的協(xié)方差矩陣(Cov(yi,yj))n×n;跡(Trace)具有如下性質(zhì):tr(AB)=tr(BA),tr(A-B)=tr(A)-tr(B)注意到線性模型的形式Y(jié)=Xβ+ε,因此EY=Xβ,Var(Y)

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。