資源描述:
《《SAS基礎(chǔ)》PPT課件》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第七章方差分析什么是方差分析(ANOVA)?1)檢驗多個總體均值是否相等通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等2)研究分類型自變量對數(shù)值型因變量的影響3)有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個分類的自變量雙因素方差分析:涉及兩個分類的自變量什么是方差分析?(例題分析)消費者對四個行業(yè)的投訴次數(shù)行業(yè)觀測值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對幾個行業(yè)的服務(wù)質(zhì)量進行評價,消費
2、者協(xié)會在四個行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費者對總共23家企業(yè)投訴的次數(shù)如下表一個分類變量什么是方差分析?(例題分析)分析四個行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗這四個行業(yè)被投訴次數(shù)的均值是否相等。怎樣檢驗?若它們的均值相等,則意味著“行業(yè)”對投訴次數(shù)是沒有影響的,即它們之間的服務(wù)質(zhì)量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異方差分析中的其他有關(guān)概念1.因素
3、或因子(factor)所要檢驗的對象要分析行業(yè)對投訴次數(shù)是否有影響,行業(yè)是要檢驗的因素或因子2.水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)就是因子的水平3.觀察值在每個因素水平下得到的樣本數(shù)據(jù)每個行業(yè)被投訴的次數(shù)就是觀察值4.試驗這里只涉及一個因素,因此稱為單因素四水平的試驗5.總體因素的每一個水平可以看作是一個總體比如零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)可以看作是四個總體6.樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這四個總體中抽取的樣本數(shù)據(jù)2.方差分析的基本思想和原理
4、零售業(yè)旅游業(yè)航空公司家電制造從散點圖上可以看出不同行業(yè)被投訴的次數(shù)是有明顯差異的同一個行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理(圖形分析)3僅從散點圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異可能是由于抽樣的隨機性所造成的,也有可能是系統(tǒng)性影響因素造成的。4需要有更
5、準確的方法來檢驗這種差異是否顯著,也就是進行方差分析所以叫方差分析,因為雖然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進行方差分析時,需要考察數(shù)據(jù)誤差的來源方差分析的基本思想和原理(兩類誤差)隨機誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的這種差異可以看成是隨機因素的影響,稱為隨機誤差系統(tǒng)誤差因素的不同水平(不同總體)下,各觀察值之間的差異比如,不同行
6、業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差方差分析的基本思想和原理(兩類方差)數(shù)據(jù)的誤差用平方和(sumofsquares)表示,又構(gòu)成方差。組內(nèi)方差(withingroups)因素的同一水平(同一個總體)下樣本數(shù)據(jù)的方差比如,零售業(yè)被投訴次數(shù)的方差組內(nèi)方差只包含隨機誤差組間方差(betweengroups)因素的不同水平(不同總體)下各樣本之間的方差比如,四個行業(yè)被投訴次數(shù)之間的方差組間方差既
7、包括隨機誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理(方差的比較)若不同行業(yè)對投訴次數(shù)沒有影響,則組間誤差中只包含隨機誤差,又有系統(tǒng)誤差。這時,組間誤差與組內(nèi)誤差經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就會接近1若不同行業(yè)對投訴次數(shù)有影響,在組間誤差中除了包含隨機誤差外,還會包含有系統(tǒng)誤差,這時組間誤差平均后的數(shù)值就會大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會大于1當這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,也就是自變量對因變量有影響判斷行業(yè)對投訴次數(shù)是否有顯著影響,實際上也就是
8、檢驗被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對投訴次數(shù)有顯著影響方差分析的基本假定1每個總體都應(yīng)服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本比如,每個行業(yè)被投訴的次數(shù)必需服從正態(tài)分布各個總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,四個行業(yè)被投訴次數(shù)的方差都相等觀察值是獨立的比如,每個行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨立方差分析中的基本假定2在上述假定條件下,判斷行