資源描述:
《逐步回歸分析案例》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、逐步回歸分析案例:逐步回歸分析在自變量很多時,其中有的因素可能對應(yīng)變量的影響不是很大,而且x之間可能不完全相互獨立的,可能有種種互作關(guān)系。在這種情況下可用逐步回歸分析,進行x因子的篩選,這樣建立的多元回歸模型預(yù)測效果會更較好。逐步回歸分析,首先要建立因變量y與自變量x之間的總回歸方程,再對總的方程及每—個自變量進行假設(shè)檢驗。當(dāng)總的方程不顯著時,表明該多元回歸方程線性關(guān)系不成立;而當(dāng)某—個自變量對y影響不顯著時,應(yīng)該把它剔除,重新建立不包含該因子的多元回歸方程。篩選出有顯著影響的因子作為自變量,并建
2、立“最優(yōu)”回歸方程?;貧w方程包含的自變量越多,回歸平方和越大,剩余的平方和越小,剩余均方也隨之較小,預(yù)測值的誤差也愈小,模擬的效果愈好。但是方程中的變量過多,預(yù)報工作量就會越大,其中有些相關(guān)性不顯著的預(yù)報因子會影響預(yù)測的效果。因此在多元回歸模型中,選擇適宜的變量數(shù)目尤為重要。逐步回歸在病蟲預(yù)報中的應(yīng)用實例:以陜西省某地區(qū)1984~1995年的煙蚜傳毒病情資料、相關(guān)蟲情和氣象資料為例(數(shù)據(jù)見DATA6.xls),建立蚜傳病毒病情指數(shù)的逐步回歸模型,說明逐步回歸分析的具體步驟。影響蚜傳病毒病情指數(shù)的蟲
3、情因子和氣象因子一共有21個,通過逐步回歸,從中選出對病情指數(shù)影響顯著的因子,從而建立相應(yīng)的模型。對1984~1995年的病情指數(shù)進行回檢,然后對1996~1998年的病情進行預(yù)報,再檢驗預(yù)報的效果。變量說明如下:y:歷年病情指數(shù)x1:前年冬季油菜越冬時的蚜量(頭/株)x2:前年冬季極端氣溫x3:5月份最高氣溫x4:5月份最低氣溫x5:3~5月份降水量x6:4~6月份降水量x7:3~5月份均溫x8:4~6月份均溫x9:4月份降水量x10:4月份均溫x11:5月份均溫x12:5月份降水量x13:6月
4、份均溫x14:6月份降水量x15:第一次蚜遷高峰期百株煙草有翅蚜量x16:5月份油菜百株蚜量x17:7月份降水量x18:8月份降水量x19:7月份均溫x20:8月份均溫x21:元月均溫1)準(zhǔn)備分析數(shù)據(jù)在SPSS數(shù)據(jù)編輯窗口中,用“File→Open→Data”命令,打開“DATA6.xls”數(shù)據(jù)文件。數(shù)據(jù)工作區(qū)如下圖3-1顯示。圖3-12)啟動線性回歸過程單擊SPSS主菜單的“Analyze”下的“Regression”中“Linear”項,將打開如圖3-2所示的線性回歸過程窗口。圖3-2線性回歸
5、對話窗口3)設(shè)置分析變量設(shè)置因變量:將左邊變量列表中的“y”變量,選入到“Dependent”因變量顯示欄里。設(shè)置自變量:將左邊變量列表中的“x1”~“x21”變量,全部選移到“Independent(S)”自變量欄里。????設(shè)置控制變量:本例子中不使用控制變量,所以不選擇任何變量。選擇標(biāo)簽變量:選擇“年份”為標(biāo)簽變量。選擇加權(quán)變量:本例子沒有加權(quán)變量,因此不作任何設(shè)置。4)回歸方式在“Method”分析方法框中選中“Stepwise”逐步分析方法。該方法是根據(jù)“Options”選擇對話框中顯著
6、性檢驗(F)的設(shè)置,在方程中進入或剔除單個變量,直到所建立的方程中不再含有可加入或可剔除的變量為止。設(shè)置后的對話窗口如圖3-3。圖3-35)設(shè)置變量檢驗水平在圖6-15主對話框里單擊“Options”按鈕,將打開如圖3-4所示的對話框。圖3-4“SteppingMethodCriteria”框里的設(shè)置用于逐步回歸分析的選擇標(biāo)準(zhǔn)。其中“UseprobabilityofF”選項,提供設(shè)置顯著性F檢驗的概率。如果一個變量的F檢驗概率小于或等于進入“Entry”欄里設(shè)置的值,那么這個變量將被選入回歸方程中
7、;當(dāng)回歸方程中變量的F值檢驗概率大于剔除“Removal”欄里設(shè)置的值,則該變量將從回歸方程中被剔除。由此可見,設(shè)置F檢驗概率時,應(yīng)使進入值小于剔除值?!癠esFvalue”選項,提供設(shè)置顯著性F檢驗的分布值。如果一個變量的F值大于所設(shè)置的進入值(Entry),那么這個變量將被選入回歸方程中;當(dāng)回歸方程中變量的F值小于設(shè)置的剔除值(Removal),則該變量將從回歸方程中被剔除。同時,設(shè)置F分布值時,應(yīng)該使進入值大于剔除值。本例子使用顯著性F檢驗的概率,在進入“Entry”欄里設(shè)置為“0.15”,
8、在剔除“Removal”欄里設(shè)置為“0.20”(剔除的概率值應(yīng)比進入的值大),如圖6-17所示。圖6-17窗口中的其它設(shè)置參照一元回歸設(shè)置。6)設(shè)置輸出統(tǒng)計量在主對話圖3-2窗口中,單擊“Statistics”按鈕,將打開如圖6-18所示的對話框。該對話框用于設(shè)置相關(guān)參數(shù)。其中各項的意義分別為:圖3-5“Statistics”對話框①“RegressionCoefficients”回歸系數(shù)選項:“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計量。????“Confidenceinter