資源描述:
《線性回歸simple regression course.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、簡(jiǎn)單線性回歸(simplelinearregression)回歸術(shù)語(yǔ)(regressionterminology)相關(guān)(correlation)最小二乘法(leastsquares)殘差分析(residualanalysis)異常觀測(cè)(abnormalobservation)學(xué)習(xí)目標(biāo)¨如何應(yīng)用回歸分析法來(lái)研究并建立因變量與一個(gè)或幾個(gè)預(yù)測(cè)量之間的模型關(guān)系?¨如何評(píng)價(jià)模型對(duì)數(shù)據(jù)的擬合性?¨如何檢驗(yàn)?zāi)P偷募僭O(shè)?¨進(jìn)行回歸分析時(shí)潛在的缺陷是什么?簡(jiǎn)單回歸-2回歸術(shù)語(yǔ)變量類(lèi)型¨自變量(X’s)¢也稱(chēng)為預(yù)測(cè)變量或解釋變量誤差¢也可以是連續(xù)的或群組的X1¨因變量
2、(Y’s)X2Y過(guò)程X3¢也稱(chēng)為反應(yīng)變量或輸出量(我output們?cè)O(shè)法預(yù)測(cè)的東西)inputs¢可以是連續(xù)的或絕對(duì)的簡(jiǎn)單回歸-3回歸術(shù)語(yǔ)變量類(lèi)型¨簡(jiǎn)單線性回歸¢一個(gè)預(yù)測(cè)變量(X)¢例如:Y=B0+B1X+E“E”“E”指什么指什么??¨多重線性回歸¢不止一個(gè)預(yù)測(cè)變量(X1,X2,…,Xk)¢例如:Y=B0+B1X1+B2X2+B3X3+E線性回歸的數(shù)學(xué)基礎(chǔ):高斯假設(shè)及最小二乘法簡(jiǎn)單回歸-4回歸建模的一般策略?什么變量?制定計(jì)劃并收集制定計(jì)劃并收集?如何取得數(shù)據(jù)?數(shù)據(jù)數(shù)據(jù)?我需要多少數(shù)據(jù)??什么輸入變量對(duì)結(jié)果的影響最大?初始分析和精簡(jiǎn)變量初始分析和精
3、簡(jiǎn)變量?哪些備選的預(yù)測(cè)模型??檢驗(yàn)?zāi)P偷募俣?域外點(diǎn),有影響的點(diǎn)?選擇并定義模型選擇并定義模型?最佳模型是什么?確認(rèn)模型確認(rèn)模型?模型對(duì)新觀測(cè)值的預(yù)測(cè)效果好嗎??預(yù)測(cè)的方差有多大?簡(jiǎn)單回歸-5回歸建模的一般策略制定計(jì)劃并收集制定計(jì)劃并收集?以油壓過(guò)程為例:制定計(jì)劃收集關(guān)數(shù)據(jù)數(shù)據(jù)于油壓產(chǎn)品彈性(Y)方面的數(shù)據(jù)。波動(dòng)或誤差溫度壓力油壓過(guò)程彈性初始分析和精簡(jiǎn)變量初始分析和精簡(jiǎn)變量時(shí)間硬度?對(duì)彈性(Y)和模溫(X)之間的關(guān)系感興趣根據(jù)數(shù)據(jù)建立回歸模型:(忽略上下模溫差)選擇并定義模型選擇并定義模型Y=B0+B1X+E?模型對(duì)新觀測(cè)值的預(yù)測(cè)效果好嗎?確認(rèn)模型
4、確認(rèn)模型?預(yù)測(cè)的方差有多大?簡(jiǎn)單回歸-6回歸模型:基本步驟步驟目標(biāo)1過(guò)程流程圖確定自變量和應(yīng)變量2散點(diǎn)圖,柱狀圖將數(shù)據(jù)直觀化3將C&E關(guān)系定量化(強(qiáng)度,%易變相關(guān)關(guān)系,檢驗(yàn)假設(shè)使用相關(guān)系數(shù)(R)來(lái)說(shuō)明性,P-值)4將C&E關(guān)系定量化(最小二乘法)回歸分析使用R平方來(lái)分析5驗(yàn)證選擇的模型以高斯假設(shè)為依據(jù)殘差分析C&E是指cause&effectmatrix(即因果矩陣)簡(jiǎn)單回歸-7簡(jiǎn)單線性回歸的例子¨假定我們對(duì)預(yù)測(cè)一個(gè)新社區(qū)的夏季用電需求感興趣.我們研究分布在美國(guó)的十二個(gè)社區(qū),七至八月的日均最高溫度(X)及每個(gè)居民消費(fèi)者的用電量需求(Y)記錄如下:X
5、=溫度Y=需求7789861717158你將怎么做?你將怎么做?757685139你可能會(huì)問(wèn)什么問(wèn)你可能會(huì)問(wèn)什么問(wèn)831307278題題??7911589182801308415476105數(shù)據(jù)來(lái)源:StatisticsinPlainEnglish,byRobertS.Schulman簡(jiǎn)單回歸-82觀測(cè)數(shù)據(jù):一個(gè)好的開(kāi)始!¨將數(shù)據(jù)繪圖(用電量對(duì)溫度.mtw)¢分布圖,X和Y柱狀圖或散點(diǎn)圖¢可視化190170150130and110dem907050708090temperature我們能發(fā)現(xiàn)什么我們能發(fā)現(xiàn)什么??簡(jiǎn)單回歸-93我們得到相關(guān)關(guān)系嗎?¨
6、在‘對(duì)應(yīng)’數(shù)據(jù)間相關(guān)關(guān)系測(cè)量線性關(guān)系,不管它們是X或Y.相關(guān)關(guān)系告訴你一列數(shù)據(jù)與另一列數(shù)據(jù)相比較時(shí)是否存在某種形態(tài).¨相關(guān)公式:Σ(X?X)(Y?Y)iiR=()2()2ΣX?XΣY?Yii¨R的取值范圍:[-1,1]¢1=完美的“正”相關(guān)¢0=不相關(guān)¢-1=完美的“負(fù)”相關(guān)由Minitab我們得到例子中溫度和用電量之相關(guān)性R=0.967簡(jiǎn)單回歸-10對(duì)應(yīng)數(shù)據(jù)的樣本相關(guān)性3030292928282727262625125CC124242323222221212020202122232425262728293020212223242526272829
7、30C2C1和C2的相關(guān)關(guān)系=0.057C1和C2的相關(guān)關(guān)系=1.0030302929282827272626125125CC2424232322222121202020212223242526272829302021222324252627282930C1和C2的相關(guān)關(guān)系C2=0.985C2C1和C2的相關(guān)關(guān)系=0.819簡(jiǎn)單回歸-11回歸模型:基本步驟步驟目標(biāo)1過(guò)程流程圖確定自變量和應(yīng)變量2散點(diǎn)圖,柱狀圖將數(shù)據(jù)直觀化3將C&E關(guān)系定量化(強(qiáng)度,%易變相關(guān)關(guān)系,檢驗(yàn)假設(shè)使用相關(guān)系數(shù)(R)來(lái)說(shuō)明性,P-值)4將C&E關(guān)系定量化(最小二乘法)回歸分析
8、使用R平方來(lái)分析5驗(yàn)證選擇的模型以高斯假設(shè)為依據(jù)殘差分析C&E是指cause&effectmatrix(即因果矩陣)簡(jiǎn)單回