資源描述:
《《西格瑪培訓(xùn)》ppt課件》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第8部分:回歸分析方法復(fù)習(xí)目的:將回歸分析方法作為一種經(jīng)驗(yàn)式的過程建模技術(shù)來進(jìn)行評論,回歸分析方法主要應(yīng)用于具有連續(xù)的Y響應(yīng)和連續(xù)的X變量的過程。目標(biāo):復(fù)習(xí)回歸分析方法使用的時(shí)機(jī)和原因。復(fù)習(xí)如何使用多重回歸分析法將多個(gè)數(shù)據(jù)點(diǎn)擬合成一條線,從而構(gòu)造該直線的相應(yīng)等式,以在給定多個(gè)X的情況下預(yù)測Y。復(fù)習(xí)回歸分析方法中的誤區(qū)。第8部分-回歸分析方法復(fù)習(xí)回歸分析方法…尋找X和Y對應(yīng)關(guān)系的有效方法什么是回歸分析方法?回歸分析方法是一種描述變量X和Y之間對應(yīng)關(guān)系的數(shù)學(xué)方法-為過程建模。Y=b0+b1x+e其中:b0是Y的截距
2、b1是直線的斜率e是模型的誤差項(xiàng)為什么使用回歸分析方法?找到潛在的關(guān)鍵少數(shù)X變量預(yù)測/預(yù)報(bào)Y變量優(yōu)化Y變量確定在何處設(shè)置X變量以優(yōu)化Y變量何時(shí)使用回歸分析方法?篩選被動數(shù)據(jù)(歷史數(shù)據(jù)或基線數(shù)據(jù))以確定潛在關(guān)鍵X變量。對DOE(實(shí)驗(yàn)設(shè)計(jì))結(jié)果進(jìn)行分析?;貧w分析方法是一個(gè)需細(xì)心使用的功能強(qiáng)大的工具單變量回歸分析方法我們可能對獨(dú)立變量X和響應(yīng)變量Y的相互關(guān)系很感興趣,以下列舉了一個(gè)表明其相互關(guān)系的散點(diǎn)圖:1.51.00.50.00100200300400假定兩變量間真正的關(guān)系式為:Yi=b0+b1*Xi+ei兩者間存
3、在線性關(guān)系“b0”(常數(shù))和“b1”(系數(shù))是固定但未知參數(shù)“X”是獨(dú)立變量。“Y”是被觀察的響應(yīng)值?!癳”是誤差項(xiàng)。通常對誤差的假設(shè)為:-平均值為0.0-不相關(guān)-正態(tài)分布-誤差的分布不存在任何型態(tài)使用回歸分析方法時(shí)應(yīng)切記以下事項(xiàng):首先將數(shù)據(jù)繪圖!1.51.00.50.00100200300400看似線性關(guān)系使用Minitab進(jìn)行分析工作。分析殘差的型態(tài)、正態(tài)性、變差以及模型的擬合性。使用R-sg(調(diào)整)確定模型所解釋的變差量。會話窗口包括了分析結(jié)果…回歸分析回歸表達(dá)式為:Evap=0.069+0.00383v
4、elocity(即:蒸發(fā)量=0.069+0.00383周轉(zhuǎn)率)預(yù)報(bào)器系數(shù)StDevTP常數(shù)0.06920.10100.690.512速度0.00382880.00043788.750.000S=0.1591R-Sq=90.5%R-Sq(adj)=89.3%分析變化:源數(shù)據(jù)DFSSMSFP回歸11.93511.935176.490.000誤差80.2.240.0253合計(jì)92.1375X變量-速度的p值H0:斜率=0Ha:斜率=0或換一種方式來講:H0:該X為非顯著Ha:該X為顯著:速度影響蒸發(fā)作用參見附錄部分對
5、對話窗口輸出的更為詳細(xì)的講述。接受Ha回歸分析回歸表達(dá)式為:Evap=0.069+0.00383velocity(即:蒸發(fā)量=0.069+0.00383周轉(zhuǎn)率)預(yù)報(bào)器系數(shù)StDevTP常數(shù)0.06920.10100.690.512速度0.00382880.00043788.750.000S=0.1591R-Sq=90.5%R-Sq(adj)=89.3%變差分析:源數(shù)據(jù)DFSSMSFP回歸11.93511.935176.490.000誤差80.2.240.0253合計(jì)92.1375此值(誤差的標(biāo)準(zhǔn)差)越小,模型越
6、好。S:殘差的標(biāo)準(zhǔn)偏差(誤差)。誤差是觀測值減去預(yù)測值。換句話講,是由觀測值點(diǎn)到由回歸等式所確定的擬和直線的距離。(對于一個(gè)優(yōu)良的模型來講,該值應(yīng)當(dāng)很小。)S=MS(error)1/2R-Sq:擬和直線所解釋的變差百分比,由X解釋的變差(對于一個(gè)優(yōu)良模型來講,該值應(yīng)很大)。R2=SSregressionSStotalR-Sq(adj):對于過度擬合情況的進(jìn)行調(diào)整(在回歸表達(dá)式中設(shè)置過多變量),因而綜合考慮模型中合并的項(xiàng)數(shù)與觀測值數(shù)目:R2(adj)=1-n-1(1-R2)n-p其中:n=觀測值的數(shù)量p=包括常數(shù)
7、在內(nèi)的模型所包含的總項(xiàng)數(shù)什么是多重回歸?定義連續(xù)變量Y和多個(gè)連續(xù)變量X之間關(guān)系的一種方法。在所提供的數(shù)據(jù)的基礎(chǔ)上構(gòu)建的工序數(shù)學(xué)模型。為什么使用多重回歸?它不僅能夠以線性方程,還能夠使用二次方程式建立工序的數(shù)學(xué)模型(二次方程中含有平方項(xiàng))。表達(dá)式的一般格式?Yi=b0+b1*X1i+…+bk*Xki+error如果在回歸中采用了基線數(shù)據(jù),你必須運(yùn)行DOE來確認(rèn)該模型(證實(shí)這些X變量確實(shí)對Y變量有控制作用)通過對中X提供正交性多重回歸表達(dá)式中的X變量可以是獨(dú)立的不同的變量,也可能是相互關(guān)聯(lián)的,如:X12或X1*X2
8、當(dāng)兩個(gè)變量相關(guān)時(shí),如何分離其各自產(chǎn)生的影響?(X1確實(shí)與X12相關(guān))對X變量進(jìn)行變換,以分離它們各自對Y所產(chǎn)生的作用。這種分離可以通過將數(shù)據(jù)集中在其平均值上而實(shí)現(xiàn),即用單個(gè)的數(shù)據(jù)點(diǎn)減去其平均值(Xj-X)。Mintab中稱此類變換為“編碼數(shù)據(jù)”。原始數(shù)據(jù)與編碼數(shù)據(jù)幾乎是正交的,這樣便可以實(shí)現(xiàn)作用分離。數(shù)據(jù)必須編碼,以使p值有意義。讓我們來看一個(gè)實(shí)例…多重回歸-扭轉(zhuǎn)次數(shù)定義設(shè)計(jì)方案插圖為