資源描述:
《多元分析入門》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、多兀分析1?基本信息首先涉足多元分析方法是F.高爾頓,他于1889年把雙變量的止態(tài)分布方法運用于傳統(tǒng)的統(tǒng)計學(xué),創(chuàng)立了相關(guān)系數(shù)和線性冋歸。其后的兒十年中,C.E.斯皮爾曼提岀因索分析法(見因索分析),R.A.費希爾提出方差分析和判別分析,S.S.威爾克斯發(fā)展了多元方差分析,H.霍特林確定了主成分分析和典型相關(guān)。到20世紀(jì)前半葉,多元分析理論人多已經(jīng)確立。60年代以后,隨著計算機科學(xué)的發(fā)展,多元分析方法在心理學(xué)以及其他許多學(xué)科的研究中得到了越來越廣泛的應(yīng)用。2?常用的多元分析方法包括3類:①多元方并分析、多元回歸分析和協(xié)方并分析,稱為線性模型方法,用以研究確定的口變量與因變量Z間的關(guān)系;②判
2、別函數(shù)分析和聚類分析,用以研究對事物的分類;③主成分分析、典型和關(guān)和因素分析,研究如何用較少的綜合因素代替為數(shù)較多的原始變量。多元方差分析是把總變異按照其來源(或?qū)嶒炘O(shè)計)分為多個部分,從而檢驗各個因素對因變量的影響以及各因素間交互作用的統(tǒng)計方法。例如,在分析2X2析因設(shè)計資料時,總變界可分為分屬兩個因素的兩個組間變異、兩因素間的交互作用及誤丼(即組內(nèi)變異)等四部分,然后對組間變異和交互作用的顯著性進行F檢驗。多元方差分析的優(yōu)點是可以在一次研究中同時檢驗具有多個水平的多個因素各自對因變量的影響以及各因素間的交互作用。其應(yīng)用的限制條件是,各個因素每一水平的樣本必須是獨立的隨機樣本,其重復(fù)觀
3、測的數(shù)據(jù)服從正態(tài)分布,且各總體方差相等。多元回歸分析用以評佔和分析一個因變量與多個口變量Z間線性函數(shù)關(guān)系的統(tǒng)計方法。一個因變量y與口變量幻、貯、…也有線性回歸關(guān)系是指:其中—是待估參數(shù),£是表示誤并的隨機變量。通過實驗可獲得力、x2…XH】的若干組數(shù)據(jù)以及對應(yīng)的y值,利用這些數(shù)據(jù)和最小二乘法就能對方程中的參數(shù)作出估計,記為+、劇J…另,它們稱為偏回歸系數(shù)。多元回歸分析的優(yōu)點是可以定量地描述某一現(xiàn)彖和某些因素間的線性函數(shù)關(guān)系。將各變量的已知值代入回歸方程便可求得因變量的估計值(預(yù)測值),從而可以有效地預(yù)測某種現(xiàn)彖的發(fā)生和發(fā)展。它既可以用于連續(xù)變量,也可用于二分變量(0,1回歸)。多元回歸的
4、應(yīng)用有嚴(yán)格的限制。首先要用方差分析法檢驗自變量y與刃個口變量Z間的線性回歸關(guān)系有無顯著性,其次,如果y與刃個口變量總的來說有線性關(guān)系,也并不意味著所有自變量都與因變量有線性關(guān)系,還需對每個自變量的偏回歸系數(shù)進行t檢驗,以剔除在方程中不起作用的口變量。也可以用逐步回歸的方法建立回歸方程,逐步選取自變量,從而保證引入方程的自變量都是重要的。協(xié)方差分析把線性回歸與方差分析結(jié)合起來檢驗多個修正均數(shù)間有無差別的統(tǒng)計方法。例如,一個實驗包含兩個多元自變量,一個是離散變量(具有多個水平),一個是連續(xù)變量,實驗口的是分析離散變量的各個水平的優(yōu)劣,此變量是方差變量;而連續(xù)變量是由于無法加以控制而進入實驗的
5、,稱為協(xié)變量。在運用協(xié)方差分析時,可先求出該連續(xù)變量與因變量的線性回歸函數(shù),然后根據(jù)這個函數(shù)扣除該變量的影響,即求岀該連續(xù)變量取等值情況時因變量的修正均數(shù),最后用方差分析檢驗各修正均數(shù)間的差異顯著性,即檢驗離散變量對因變量的影響。協(xié)方差分析兼具方差分析和回歸分析的優(yōu)點可以在考慮連續(xù)變量影響的條件下檢驗離散變量對因變量的影響,有助于排除非實驗因素的干擾作用。其限制條件是,理論上要求齊組資料(樣本)都來自方差相同的正態(tài)總體,各組的總體直線回歸系數(shù)相等且都不為0o因此應(yīng)用協(xié)方差分析前應(yīng)先進行方差齊性檢驗和回歸系數(shù)的假設(shè)檢驗,若符合或經(jīng)變換后符合上述條件,方可作協(xié)方差分析。判別函數(shù)分析判定個體所
6、屈類別的統(tǒng)計方法。其基本原理是:根據(jù)兩個或多個已知類別的樣本觀測資料確定一個或幾個線性判別函數(shù)和判別指標(biāo),然后用該判別函數(shù)依據(jù)判別指標(biāo)來判定另一個個體屬于哪一類。判別分析不僅用于連續(xù)變量,而且借助于數(shù)量化理論亦可用于定性資料。它有助于客觀地確定歸類標(biāo)準(zhǔn)。然而,判別分析僅可用于類別已確定的情況。當(dāng)類別木身未定時,預(yù)用聚類分析先分出類別,然后再進行判別分析。聚類分析解決分類問題的一種統(tǒng)計方法。若給定刀個觀測對象,每個觀察對象有P個特征(變量),如何將它們聚成若干可定義的類?若對觀測對象進行聚類,稱為Q型分析;若對變量進行聚類,稱為R型分析。聚類的基木原則是,使同類的內(nèi)部差別較小,而類別間的差
7、別較大。最常用的聚類方案有兩種。一種是系統(tǒng)聚類方法。例如,要將刀個對象分為斤類,先將刀個對象各白分成一類,共類。然后計算兩兩Z間的某種“距離”,找出距離最近的兩個類、合并為一個新類。然后逐步重復(fù)這一過程,直到并為斤類為止。另一種為逐步聚類或稱動態(tài)聚類方法。當(dāng)樣木數(shù)很大時,先將77個樣本大致分為斤類,然后按照某種最優(yōu)原則逐步修改,直到分類比較合理為止。聚類分析是依據(jù)個體或變量的數(shù)量關(guān)系來分類,客觀性較強,但各種聚類方法都只能在某種條件