資源描述:
《《多元相關(guān)續(xù)》ppt課件》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第十五講多元相關(guān)(續(xù))一、主成分分析二、因子分析三、典型相關(guān)分析二、因子分析因子分析法是用盡可能少的不可觀測(cè)的所謂的“公共因子”的線性函數(shù)與特定因子之和來描述原來觀測(cè)的每一分量。其目的是盡可能合理地解釋存在于原始變量之間的相關(guān)性,且簡(jiǎn)化變量的維數(shù)與結(jié)構(gòu)。(一)因子模型模型稱為因子模型,其中假設(shè)1.是可觀測(cè)的向量,且均值協(xié)方差陣等于其相關(guān)矩陣2.是不可觀測(cè)的向量,其均值協(xié)方差陣是3.與相互獨(dú)立,且的協(xié)方差陣為對(duì)角矩陣用矩陣可將因子模型表示為其中滿足前面的三個(gè)假設(shè)條件,是矩陣,即模型中叫做公共因子,它們是在各個(gè)原變量的
2、表達(dá)式中都共同出現(xiàn)的因子,是相互獨(dú)立的不可觀測(cè)的理論變量。叫做特殊因子,是原單一變量(各分量)所特有因子,各特殊因子之間以及特殊因子與公共因子之間都是相互獨(dú)立的。矩陣的元素叫做因子載荷,當(dāng)?shù)慕^對(duì)值大時(shí)()表明與的相依程度大,或說公共因子對(duì)于的載荷量大,因此稱為公共因子載荷量,簡(jiǎn)稱因子載荷,而矩陣稱為因子載荷矩陣。所謂因子分析,就是如何從一組資料出發(fā),分析出公共因子與特殊因子來,并求出相應(yīng)的(二)因子載荷矩陣的統(tǒng)計(jì)意義載荷矩陣,最后解釋各個(gè)公共因子的含義。1.因子載荷的統(tǒng)計(jì)意義因?yàn)榍乙虼思仁桥c協(xié)方差,又是它們的相關(guān)系
3、數(shù),即就是說是用來度量可用線性組合表示的程度,這樣稱因子載荷叫做權(quán),表示與的依賴程度。2.變量共同度的統(tǒng)計(jì)意義稱因子載荷矩陣中各行的平方和為變量的共同度。由于即上式表明變量的方差有兩部分組成:其一是它是全部公共因子對(duì)于變量的總方差所作出的貢獻(xiàn);其二是它是變量的特殊因子所產(chǎn)生的方差,僅與變量的本身變化有關(guān),而與公共因子無關(guān),常稱為剩余方差。3.公共因子的方差貢獻(xiàn)統(tǒng)計(jì)意義將載荷矩陣的各列元素平方和稱為公共因子對(duì)的貢獻(xiàn)。(二)因子載荷矩陣得求法三、典型相關(guān)分析典型相關(guān)分析是一種研究?jī)蓚€(gè)隨機(jī)向量的相關(guān)關(guān)系的統(tǒng)計(jì)方法。類似于
4、主成分分析,它是將兩個(gè)隨機(jī)向量的相關(guān)變?yōu)閮蓚€(gè)新隨機(jī)變量之間的相關(guān)來進(jìn)行討論,同時(shí)又盡可能保留原變量的信息,即就是分別對(duì)兩個(gè)隨機(jī)向量構(gòu)造其分量的線性組合,并使兩個(gè)線性組合所形成為典型相關(guān),形成的兩個(gè)新變量為典型變量。進(jìn)而還可以在原兩個(gè)隨機(jī)向量中找出第二對(duì)線性組合,使其與第一對(duì)線性組合不相關(guān),而第二對(duì)變量間又具有最大相關(guān)性。如此繼續(xù)進(jìn)行下去直到兩個(gè)隨機(jī)向量間的相關(guān)性被提取完畢為止。兩個(gè)隨機(jī)變量具有最大的相關(guān)性,稱這種相關(guān)(一)典型相關(guān)和典型變量假設(shè)有兩個(gè)隨機(jī)向量且令并將改寫成分塊矩陣其中是與之間的協(xié)方差陣。顯然,當(dāng)時(shí),
5、有成立。令其中與是兩個(gè)待定的常向量,它們的選取原則是在與已知的條件下,使得與的相關(guān)系數(shù)達(dá)到最大。由于不妨假設(shè)因此所討論的問題就轉(zhuǎn)化為在約束和下求與,使得目標(biāo)函數(shù)達(dá)到最大。定理20.1在滿足約束條件和下,使得相關(guān)系數(shù)達(dá)到最大的與是齊次線性方程組的非零解,其中是矩陣(或矩陣)的最大特征根。設(shè)已求出矩陣的特征根為由定理20.1可知,第一對(duì)典型相關(guān)變量為其中與滿足且此時(shí),與的相關(guān)系數(shù)為重復(fù)以上過程可得第對(duì)典型相關(guān)變量與滿足且同樣地有即各對(duì)典型變量間是不相關(guān)的??偨Y(jié)以上,可得求典型變量的過程如下:1.求矩陣的特征值,記為對(duì)應(yīng)
6、的單位特征向量為3.第對(duì)典型相關(guān)變量為2.令(二)典型相關(guān)系數(shù)和典型相關(guān)變量的估計(jì)在實(shí)際問題中,總體的均值和協(xié)方差陣往往未知,應(yīng)由與的樣本這時(shí)總體均值和協(xié)方差陣的估計(jì)分別為若的秩為,非零特征根記為對(duì)應(yīng)的單位特征向量為取則第對(duì)樣本典型變量為第對(duì)樣本典型變量的相關(guān)系數(shù)為注:無論總體的均值和協(xié)方差陣是已知或未知,若分量的量綱不同或取值差異很大,可考慮標(biāo)準(zhǔn)化變量,再重復(fù)前面的方法可求出標(biāo)準(zhǔn)化變量的典型變量,不再贅述。找到了與的典型變量后,進(jìn)一步的工作就是分析典型變量的實(shí)際意義,這只能結(jié)合具體的實(shí)際例子才能給出合理的解釋。例
7、對(duì)個(gè)16歲的男孩進(jìn)行體格檢查,將身高和坐高作為第一組變量,將體重和胸圍作為第二組變量,記已知其樣本協(xié)方差陣為試對(duì)與進(jìn)行樣本典型相關(guān)分析。解經(jīng)計(jì)算可求得矩陣特征根為再求對(duì)應(yīng)的單位特征向量,由可得于是可得第一對(duì)樣本典型變量為對(duì)應(yīng)的樣本的典型相關(guān)系數(shù)為這表明身高與坐高之和同體重與胸圍之差有較大的依賴關(guān)系。