資源描述:
《R語(yǔ)言基于多元回歸分析的大豆植株性狀與產(chǎn)量的回歸分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、《統(tǒng)計(jì)計(jì)算》課程論文論文題目:大豆植株性狀與產(chǎn)量的回歸分析姓名:李涵宇學(xué)號(hào):1109020135班級(jí):統(tǒng)計(jì)1101年級(jí):11級(jí)專業(yè):統(tǒng)計(jì)學(xué)學(xué)院:統(tǒng)計(jì)與數(shù)學(xué)學(xué)院授課教師:楊青龍完成時(shí)間:2014年5月摘 要選育高產(chǎn)優(yōu)質(zhì)的作物品種、采用高效的栽培技術(shù),一直是農(nóng)業(yè)科研工作者研究的主題。多年以來(lái),人們?yōu)榱私庾魑镏仓晷誀钆c產(chǎn)量的關(guān)系,以便做到更有效的性狀選擇和采取相應(yīng)的栽培措施,進(jìn)行了一系列的研究,關(guān)于作物產(chǎn)量與施肥、土壤條件、氣候因子等的關(guān)系研究報(bào)道也較多。但影響大豆產(chǎn)量的植株自身因素還有許多種,有待于繼續(xù)
2、探究。關(guān)鍵詞:大豆產(chǎn)量;影響因素;植株性狀與產(chǎn)量關(guān)系A(chǔ)bstractBreedingofhighyieldandgoodqualityofcropvarieties,adoptefficientcultivationtechniques,hasbeenthesubjectofagriculturalscientificresearchworkersstudy.Overtheyears,thepeopletounderstandtherelationshipbetweenthecropplanttrai
3、tsandyield,inordertoachievemoreeffectiveselectionandthecorrespondingcultivationmeasures,conductedaseriesofresearch,oncropyieldandfertilizerapplication,soilconditions,studiesontherelationshipbetweenclimatefactorandmore.Buttherearestillmanyfactorsinfluenc
4、ingthesoybeanproductionplants,subjecttocontinuetoexplore.Keywords:Soybeanproduction;Influencingfactors;Planttraitsandyield引言本文主要研究在作物植株諸多性狀如生育日數(shù)x1、株高x2、有效分枝數(shù)x3、主莖節(jié)數(shù)x4、單株莢數(shù)x5、單株粒數(shù)x6、每莢粒數(shù)x7、百粒重x8、單株粒重x9,九種大豆植株性狀與小區(qū)產(chǎn)量y之間的關(guān)系,從中找出產(chǎn)量的主導(dǎo)性狀因子,為大豆高產(chǎn)育種中各農(nóng)藝性狀的選擇和高
5、產(chǎn)栽培技術(shù)提供理論依據(jù)一、多元回歸分析方法(一)多元線性回歸模型的建立多元線性回歸分析是研究一個(gè)響應(yīng)變量與多個(gè)自變量間呈線性相關(guān)關(guān)系的問(wèn)題,這種關(guān)系可以用多元線性回歸方程來(lái)描述:式中為回歸常數(shù)項(xiàng),(i=1,2,……k)稱為偏回歸系數(shù),其意義為當(dāng)其它自變量對(duì)響應(yīng)變量的影響固定時(shí),對(duì)應(yīng)的第i個(gè)自變量對(duì)的線性影響程度。(二)殘差分析殘差是指由回歸方程計(jì)算所得的預(yù)測(cè)值與實(shí)際樣本值之間的差距,定義為,它是回歸模型的估計(jì)值,由多個(gè)形成的序列稱為殘差序列,如果回歸方程能夠很好的反映被解釋變量的特征和變化規(guī)律,那么殘
6、差序列中不應(yīng)包含明顯的規(guī)律性和趨勢(shì)性。(三)多重共線性檢驗(yàn)與修正——逐步回歸法逐步回歸的基本思想是:對(duì)全部因子按其對(duì)影響程度大?。ㄆ貧w平方的大?。?,從大到小地依次逐個(gè)地引入回歸方程,并隨時(shí)對(duì)回歸方程當(dāng)時(shí)所含的全部變量進(jìn)行檢驗(yàn),看其是否仍然顯著,如不顯著就將其剔除,知道回歸方程中所含的所有變量對(duì)的作用都顯著是,才考慮引入新的變量。再在剩下的未選因子中,選出對(duì)作用最大者,檢驗(yàn)其顯著性,顯著著,引入方程,不顯著,則不引入。直到最后再?zèng)]有顯著因子可以引入,也沒(méi)有不顯著的變量需要剔除為止。逐步回歸分析時(shí)在考慮
7、的全部自變量中按其對(duì)的貢獻(xiàn)程度大小,由大到小地逐個(gè)引入回歸方程,而對(duì)那些對(duì)作用不顯著的變量可能是中不被引入回歸方程。另外,已被引入回歸方程的變量在引入新變量進(jìn)行檢驗(yàn)后失去重要性時(shí),需要從回歸方程中剔除出去。Step1計(jì)算變量均值和差平方和記各自的標(biāo)準(zhǔn)化變量為Step2計(jì)算的相關(guān)系數(shù)矩陣。Step3設(shè)已經(jīng)選上了個(gè)變量:且互不相同,經(jīng)過(guò)變換后為對(duì)逐一計(jì)算標(biāo)準(zhǔn)化變量的偏回歸平方和,記,作檢驗(yàn),,對(duì)給定的顯著性水平,拒絕域?yàn)?。Step4最Step3循環(huán),直至最終選上了個(gè)變量,且互不相同,經(jīng)過(guò)變換后為,則對(duì)應(yīng)的
8、回歸方程為:,通過(guò)代數(shù)運(yùn)算可得。二、數(shù)據(jù)來(lái)源及分析(一)數(shù)據(jù)來(lái)源本文數(shù)據(jù)采用2010年吉林省大豆種植研究數(shù)據(jù)中的274個(gè)大豆品種中的8個(gè)植株性狀和生育日數(shù)及小區(qū)產(chǎn)量進(jìn)行回歸分析,其中植株性狀選用:株高x2、有效分枝數(shù)x3、主莖節(jié)數(shù)x4、單株莢數(shù)x5、單株粒數(shù)x6、每莢粒數(shù)x7、百粒重x8、單株粒重x9,生育日數(shù)x1及小區(qū)產(chǎn)量y。(二)數(shù)據(jù)分析本文利用R語(yǔ)言對(duì)以上數(shù)據(jù)進(jìn)行分析,分析過(guò)程及結(jié)果如下:1、數(shù)據(jù)選用及處理整理已選用好的9個(gè)自變量及一個(gè)因變量,剔除