資源描述:
《用excel作逐步回歸分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第33卷第5期廣東氣象Vol.33No.52011年10月GuangdongMeteorologyOctober2011doi:10.3969/j.issn.1007-6190.2011.05.015用Excel作逐步回歸分析王飛鳳,劉鑄飄(始興縣氣象局,廣東韶關(guān)512500)摘要:結(jié)合始興站1965~1994年前汛期部分觀測(cè)要素實(shí)況數(shù)據(jù)對(duì)雨量的回歸擬合個(gè)例,通俗說(shuō)明在Excel軟件中進(jìn)行逐步回歸分析的詳細(xì)過(guò)程,為中長(zhǎng)期預(yù)報(bào)中應(yīng)用逐步回歸分析作參考。關(guān)鍵詞:應(yīng)用氣象學(xué);逐步回歸;方法;擬合;Excel軟件中圖分類(lèi)號(hào):P49文獻(xiàn)標(biāo)識(shí)碼:B文章編號(hào):1007-6190(2011)05-004
2、8-04在各科學(xué)試驗(yàn)或管理工作的領(lǐng)域中,常常遇到將科使用最小二乘法計(jì)算對(duì)已知數(shù)據(jù)(m個(gè)自變量)進(jìn)行學(xué)數(shù)據(jù)的逐步回歸分析問(wèn)題,由于其中的一些內(nèi)容計(jì)算最佳線性擬合,并返回描述此線性方程的自變量回歸系復(fù)雜,在計(jì)算過(guò)程中需要查統(tǒng)計(jì)用表,比較后再做出結(jié)數(shù)的數(shù)組。因?yàn)榇撕瘮?shù)返回?cái)?shù)值數(shù)組,故必須以數(shù)組公論,用起來(lái)較麻煩,尤其當(dāng)自變量個(gè)數(shù)較多時(shí),計(jì)算量驚式的形式輸入,所得線性的方程為:人,因此,逐步回歸分析方法的廣泛應(yīng)用受到一定的限y=bm+bm-1xm-1+…+b1x1+b0(1)[1]制。當(dāng)前較為常用的統(tǒng)計(jì)軟件有SPSS和SAS等,但此bj值是與xj相對(duì)應(yīng)的系數(shù),b0是常數(shù),函數(shù)LINEST類(lèi)軟件多
3、為英文版,使用起來(lái)不太方便、易懂。常用辦公返回的數(shù)組是{bm,bm-1,…,b2,b1,b0},函數(shù)LINEST還可[2]軟件Excel為逐步回歸分析方法,為數(shù)據(jù)處理提供了返回附加回歸統(tǒng)計(jì)值。非常有效的工具。本文就基于Excel逐步回歸分析方法(2)語(yǔ)法。加以討論,并舉例說(shuō)明利用Excel軟件進(jìn)行逐步回歸分析LINEST(known_ys,known_xs,const,stats)的詳細(xì)過(guò)程。const為一邏輯值,指明是否強(qiáng)制使常數(shù)b0為0(零)。如果const為T(mén)rue或省略,則b0將被正常計(jì)算;1逐步回歸原理與相關(guān)Excel函數(shù)如果const為False,b0將被設(shè)為0(零),并同時(shí)
4、調(diào)整1.1逐步回歸原理b{bm,bm-1,…,b2,b1,b0}值以使y=bx。實(shí)際問(wèn)題中,如果考慮的回歸方程有10個(gè)影響因素stats為一邏輯值,指明是否返回附加回歸統(tǒng)計(jì)值。10i如果stats為T(mén)rue,函數(shù)LINEST返回附加回歸統(tǒng)計(jì)值;如的話,全部可能得到的回歸方程則有∑C10=i=1果stats為False或省略,則函數(shù)LINEST只返回系數(shù)和常10!10[3]=2-1=1023個(gè)之多,但其中只可能有i!(10-1)!數(shù)項(xiàng)。一個(gè)回歸方程是“最優(yōu)”回歸方程。怎樣去找這個(gè)“最(3)線性回歸輸出。優(yōu)”回歸方程呢?逐步回歸分析方法就是要解決這個(gè)問(wèn)函數(shù)LINEST返回的附加回歸統(tǒng)計(jì)值存放
5、位置的格題。傳統(tǒng)的方法和在一般的教科書(shū)中都是主張從第一個(gè)式如下:-1自變量開(kāi)始,按自變量對(duì)因變量的作用影響程度從大到bmbm…b2b1b0-1小依次引入回歸方程,并且考慮到先引入的變量如果由SmSm…S2S1S0于后面變量的引入而變得不顯著時(shí),則隨時(shí)將其剔除,以R2SE保證每次在引入新的變量之前,回歸方程中只含有顯著Ff的變量,直到?jīng)]有顯著的變量為止,這種方法步驟繁多且UQL計(jì)算量大,比較繁瑣。(4)統(tǒng)計(jì)值說(shuō)明。而采用一種新的方法[4],即先建立所有自變量參加S1,S2,…,Sm為系數(shù)b1,b2,…,bm的標(biāo)準(zhǔn)誤差值,這的回歸方程,然后將對(duì)因變量影響不顯著的自變量即將是很有用的值,用它們
6、可以算出每個(gè)自變量系數(shù)的t檢沒(méi)有通過(guò)統(tǒng)計(jì)量檢驗(yàn)的自變量剔除,最后剩下具有高顯驗(yàn)值:著水平的自變量及其回歸系數(shù)組成的回歸方程即為“最tj=bj/Sj(j=1,2,…,m)(2)優(yōu)”回歸方程,這種方法與傳統(tǒng)的方法的結(jié)果在理論上是t檢驗(yàn)值的自由度為f=n-m-1,由tj可以判斷變一致的。按照這一思路,這種方法可在Excel軟件中輕松量xj的重要性。實(shí)現(xiàn)。S0為常數(shù)項(xiàng)b0的標(biāo)準(zhǔn)誤差值。21.2有關(guān)多元線性回歸的Excel函數(shù)R為相關(guān)系數(shù)的平方,SE為剩余標(biāo)準(zhǔn)差。1.2.1函數(shù)LINESTF值為F統(tǒng)計(jì)值或觀察值,f為自由度。(1)功能。U為回歸平方和,QL為剩余平方和。收稿日期:2010-05-2
7、5作者簡(jiǎn)介:王飛鳳(1978年生),女,助理工程師,主要從事氣象防雷工作。第5期王飛鳳等:用Excel作逐步回歸分析491.2.2函數(shù)TREND明該自變量統(tǒng)計(jì)顯著水平高。函數(shù)FDIST可用于返回獲(1)功能。得意外出現(xiàn)的較高F值的概率,若FDIST函數(shù)的返回值返回一條線性回歸擬合線的一組縱坐標(biāo)值(y值)。低,則說(shuō)明回歸模型的可信度高。即找到適合已知數(shù)組known_y's和known_x's的直線(用2逐步回歸步驟與實(shí)施最小二乘法),