資源描述:
《CH11 典型相關(guān)分析和協(xié)整.ppt》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、CH.11典型相關(guān)分析1要點(diǎn)典型相關(guān)分析的數(shù)學(xué)表達(dá)方式,假定條件;典型相關(guān)系數(shù)的數(shù)學(xué)含義;典型變量系數(shù)的數(shù)學(xué)含義;簡單相關(guān),復(fù)相關(guān)和典型相關(guān)的意義;典型相關(guān)的應(yīng)用2一、什么是典型相關(guān)分析及基本思想通常情況下,為了研究兩組變量的相關(guān)關(guān)系,可以用最原始的方法,分別計(jì)算兩組變量之間的全部相關(guān)系數(shù),一共有pq個(gè)簡單相關(guān)系數(shù),這樣又煩瑣又不能抓住問題的本質(zhì)。如果能夠采用類似于主成分的思想,分別找出兩組變量的各自的某個(gè)線性組合,討論線性組合之間的相關(guān)關(guān)系,則更簡捷。3在解決實(shí)際問題中,這種方法有廣泛的應(yīng)用。如,在工廠里常常要研究產(chǎn)品的q個(gè)質(zhì)量指標(biāo)和p個(gè)原材料的指標(biāo)之間的相關(guān)關(guān)系;也可以是采用
2、典型相關(guān)分析來解決的問題。如果能夠采用類似于主成分的思想,分別找出兩組變量的線性組合既可以使變量個(gè)數(shù)簡化,又可以達(dá)到分析相關(guān)性的目的。4例家庭特征與家庭消費(fèi)之間的關(guān)系為了了解家庭的特征與其消費(fèi)模式之間的關(guān)系。調(diào)查了70個(gè)家庭的下面兩組變量:分析兩組變量之間的關(guān)系。5X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣6y2y3y1x2x17典型相關(guān)分析的思想:首先分別在每組變
3、量中找出第一對線性組合,使其具有最大相關(guān)性,8然后再在每組變量中找出第二對線性組合,使其分別與本組內(nèi)的第一線性組合不相關(guān),第二對本身具有次大的相關(guān)性。u2和v2與u1和v1相互獨(dú)立,但u2和v2相關(guān)。如此繼續(xù)下去,直至進(jìn)行到r步,兩組變量的相關(guān)性被提取完為止。r?min(p,q),可以得到r組變量。9二、典型相關(guān)的數(shù)學(xué)描述考慮兩組變量的向量其協(xié)方差陣為(一)想法其中?11是第一組變量的協(xié)方差矩陣;?22是第二組變量的協(xié)方差矩陣;是X和Y的其協(xié)方差矩陣。10如果我們記兩組變量的第一對線性組合為:其中:所以,典型相關(guān)分析就是求?1和b1,使?uv達(dá)到最大。11(二)典型相關(guān)系數(shù)和典型
4、變量的求法在約束條件:下,求a1和b1,使?uv達(dá)到最大。令12利用柯西不等式有(參看1.8.4式)13記m為?12的秩,則記為相應(yīng)的特征向量為其余的零特征根對應(yīng)的向量為14由特征向量可以構(gòu)成一個(gè)正交矩陣T,有15若取則16相應(yīng)的特征向量為a1和b1分別構(gòu)成了第一組變量和第二組變量的第一對典型變量的系數(shù)。17第一對典型相關(guān)變量提取了原始變量x組和y組之間相關(guān)的主要部分,那么這部分的信息不夠,則還可以在剩余相關(guān)中提取第二對典型變量:在以下的約束條件下:18求令則,約束條件等價(jià)于1920當(dāng)取這時(shí)uk和vk達(dá)到最大值?k,稱它為第k個(gè)典型相關(guān)系數(shù),稱ak和bk為第k對典型變量系數(shù)。21
5、相應(yīng)的特征向量為ak和bk分別構(gòu)成了第一組變量和第二組變量的第k對典型變量的系數(shù)。22注有相同的特征根,而可以驗(yàn)證:根據(jù)線性代數(shù)的思想,下列矩陣23方法二根據(jù)數(shù)學(xué)分析中條件極值的求法,引入Lagrange乘數(shù),求極值問題,則可以轉(zhuǎn)化為求的極大值,其中?和?是Lagrange乘數(shù)。24將上面的3式分別左乘和25將左乘(3)的第二式,得并將第一式代入,得的特征根是,相應(yīng)的特征向量為26將左乘(3)的第一式,并將第二式代入,得的特征根是,相應(yīng)的特征向量為27結(jié)論:既是M1又是M2的特征根,和是相應(yīng)于M1和M2的特征向量。至此,典型相關(guān)分析轉(zhuǎn)化為求M1和M2特征根和特征向量的問題。第一對
6、典型變量提取了原始變量X與Y之間相關(guān)的主要部分,如果這部分還不能足以解釋原始變量,可以在剩余的相關(guān)中再求出第二對典型變量和他們的典型相關(guān)系數(shù)。。28在剩余的相關(guān)中再求出第二對典型變量和他們的典型相關(guān)系數(shù)。設(shè)第二對典型變量為:在約束條件:求使達(dá)到最大的和。29例家庭特征與家庭消費(fèi)之間的關(guān)系為了了解家庭的特征與其消費(fèi)模式之間的關(guān)系。調(diào)查了70個(gè)家庭的下面兩組變量:分析兩組變量之間的關(guān)系。30X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35
7、y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣31典型相關(guān)分析典型相關(guān)系數(shù)調(diào)整典型相關(guān)系數(shù)近似方差典型相關(guān)系數(shù)的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491932X組典型變量的系數(shù)U1U2X1(就餐)0.7689-1.4787X2(電影)0.27211.6443Y組典型變量的系數(shù)V1V2Y1(年齡)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0