資源描述:
《十一、簡(jiǎn)單相關(guān)與簡(jiǎn)單直線回歸分析 (Simple Linear》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、十一、簡(jiǎn)單相關(guān)與簡(jiǎn)單直線回歸分析(SimpleCorrelationsandSimpleLinearRegression)劉仁沛教授國(guó)立臺(tái)灣大學(xué)農(nóng)藝學(xué)研究所生物統(tǒng)計(jì)組國(guó)家衛(wèi)生研究院生物統(tǒng)計(jì)與生物資訊組jpliu@ntu.edu.tw例1:氮肥用量與水稻穀收量表(公斤)氮肥用量x00.51.01.52.02.5稻穀收量y101832485562例2:成人年齡與血液中膽固醇的量年齡x343944464851膽固醇y(mg/ml)141.4180.5178.4212.0203.2224.1年齡x53661656667膽固醇y(mg/ml)186.0350.0286.3287.6330.3371.3
2、例3:年雨量與小麥產(chǎn)量年雨量(公厘/20)23.520.422.825.928.927.126.825.2產(chǎn)量(公斤/100)20.423.033.535.844.641.245.439.0氮肥用量與稻穀收量的ScatterPlot年齡與膽固醇量的ScatterPlot(mg/ml)年雨量與小麥產(chǎn)量的ScatterPlot(公斤/100)探討兩個(gè)變數(shù)之間的關(guān)係問(wèn)題:兩個(gè)變數(shù)間是否存在直線關(guān)係?將直線關(guān)係以方程式表示?資料型態(tài)(xi,yi)假定(Assumption)每對(duì)資料均為獨(dú)立常態(tài)相同變方X與Y的關(guān)係為直線簡(jiǎn)單關(guān)係數(shù)(Simplecorrelationcoefficient)簡(jiǎn)單直線回歸
3、(SimpleLinearRegression)模式建立之推論(ModelsandInference)回歸模式直線性檢定(EvaluationofLinearity)假定之確認(rèn)(CheckingtheModelAssumptions)ⅡⅠⅢⅣⅡⅠⅢⅣⅡⅠⅢⅣμχμχμχμyμyμyy(a)ρ>0正相關(guān)(b)ρ<0負(fù)相關(guān)(c)ρ=0無(wú)相關(guān)圖11.8b三種不同族群相關(guān)散播圖象限(χ-μχ)(y-μy)(χ-μχ)(y-μy)Ⅰ+++Ⅱ-+-Ⅲ--+Ⅳ+--正相關(guān):落在第Ⅰ及Ⅲ象限的點(diǎn)數(shù)>落在第Ⅱ及Ⅳ象限的點(diǎn)數(shù)負(fù)相關(guān):落在第Ⅰ及Ⅲ象限的點(diǎn)數(shù)<落在第Ⅱ及Ⅳ象限的點(diǎn)數(shù)無(wú)相關(guān):落在第Ⅰ及Ⅲ象限的點(diǎn)數(shù)=落
4、在第Ⅱ及Ⅳ象限的點(diǎn)數(shù)族群簡(jiǎn)單相關(guān)係數(shù):(x1,y1)…(xN,yN),-1<ρ<1樣品簡(jiǎn)單相關(guān)係數(shù)樣品資料:(x1,y1),…,(xn,yn)乘積和:X平方和:Y平方和:,r之範(fàn)圍:1≦r≦-1xyr=1xyr=-1(a)完全正相關(guān)(b)完全負(fù)相關(guān)(a)不完全正相關(guān)(b)不完全負(fù)相關(guān)xy0tα/2,n-2拒絕H0例:雨量與小麥產(chǎn)量n=8,Σxi=200.5,Σyi=296.5簡(jiǎn)單直線回歸(SimpleLinearRegress
5、ion)水稻穀產(chǎn)量(y)與氮肥用量(x)可以用直線關(guān)係描述yi=β0+βxi,i=1,…,6(=n)yi:依變數(shù)(Dependentvariable)xi:獨(dú)立(自)變數(shù)(Independentvariable)β0:截距(Intercept)x=0時(shí)y的值β:斜率(Slope)x變動(dòng)一個(gè)單位y變動(dòng)的量但實(shí)際觀測(cè)值與直線y=β+βx有差距原因:環(huán)境、實(shí)驗(yàn)誤差、量測(cè)誤差及其他原因yi=β0+βxi+εi,i=1,…,6(=n)εi:誤差(Error)或殘差(Residual)TheSimpleLinearRegressionModel(Hereβ1>0)xy-interceptOne-unit
6、changeinxSlope=β1Meanvalueofywhenxequalsx0Anobservedvalueofywhenxequalsx0yβ00ErrortermStraightlinedefinedbytheequationμy∣x=β0+β1xx0=Aspecificvalueoftheindependentvariablex假定(Assumptions):獨(dú)立性(Independent)常態(tài)性(Normality)直線關(guān)係(Linearity)相同變方(homogeneityofVariance)無(wú)數(shù)條直線可描述X與Y的關(guān)係選擇直線的方法:最小平方法(LeastSquares
7、Method)德國(guó)大數(shù)學(xué)家Gauss發(fā)明yixie1e2e3e4e6e5圖11.4回歸直線與殘差圖最小平方法正常方程式(NormalEquations)斜率估算值截距估算值推測(cè)直線回歸方程式(PredictedLinearRegressionEquations)殘差估算值為當(dāng)獨(dú)立之變數(shù)為xi時(shí)依變數(shù)之最小平方推測(cè)平均值計(jì)算推測(cè)直線回歸方程式所需統(tǒng)計(jì)值例:成人年齡與血液膽固醇含量假定獨(dú)立性常態(tài)性直線關(guān)係相關(guān)變方