R語(yǔ)言作圖之PCA作圖和散點(diǎn)圖

R語(yǔ)言作圖之PCA作圖和散點(diǎn)圖

ID:47476487

大小:68.50 KB

頁(yè)數(shù):7頁(yè)

時(shí)間:2020-01-11

R語(yǔ)言作圖之PCA作圖和散點(diǎn)圖_第1頁(yè)
R語(yǔ)言作圖之PCA作圖和散點(diǎn)圖_第2頁(yè)
R語(yǔ)言作圖之PCA作圖和散點(diǎn)圖_第3頁(yè)
R語(yǔ)言作圖之PCA作圖和散點(diǎn)圖_第4頁(yè)
R語(yǔ)言作圖之PCA作圖和散點(diǎn)圖_第5頁(yè)
資源描述:

《R語(yǔ)言作圖之PCA作圖和散點(diǎn)圖》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。

1、.PCA分析和散點(diǎn)圖今天主要跟大家演示一下簡(jiǎn)單的PCA分析,并且以散點(diǎn)圖的形式將結(jié)果展示出來(lái)。首先在進(jìn)行PCA分析之前,先跟大家稍微討論下什么是PCA分析。PCA分析又叫主成分分析,其實(shí)從字面上來(lái)理解我們可以發(fā)現(xiàn)它其實(shí)是和樣品分組相關(guān)的。舉個(gè)簡(jiǎn)單的例子,我們觀察了某種植物的株高、葉片大小、果實(shí)大小等等多種性狀,并記錄每種性狀對(duì)應(yīng)的數(shù)值。這時(shí)候我們想看看根據(jù)這些性狀信息看看我們觀察的樣本是否明顯的分組現(xiàn)象。每一種性狀相當(dāng)于一個(gè)維度。利用PCA分析可以將結(jié)果投影到一個(gè)低維的向量空間(具體計(jì)算就不詳述了)。類似的比如我

2、們多個(gè)樣本的表達(dá)譜數(shù)據(jù),每個(gè)基因在各個(gè)樣品的表達(dá)情況就可以算作一個(gè)維度。如果大家對(duì)PCA算法感興趣的話,可以自行百度,在這里就不進(jìn)行太多的描述了。畢竟今天主要是教大家怎么利用R進(jìn)行PCA分析和結(jié)果展示。還是第一步,我們先準(zhǔn)備好我們用來(lái)分析的數(shù)據(jù)。setwd("C:/Users/gaom/Desktop")#打開(kāi)文件所在路徑,并將文件所在目錄作為工作目錄data<-read.table(file="test_data.txt",header=T,sep="t")#讀取數(shù)據(jù),并將首行作為列名dim(data)##[

3、1]299913head(data)##ID_REFT01T02T03T04T05T06##11007_s_at10.19858611.80567610.86795311.76366012.07223212.108312##21053_at9.5940748.7131089.2470969.4332659.0923299.005518##3117_at8.5817638.6036808.8044258.6617008.6349798.606976##4121_at12.02231512.65532912.6273

4、3412.79139012.96176112.885307##51255_g_at7.2285697.2146007.2371317.2934177.2767997.268233##61294_at8.8284879.3802779.2979898.8589858.9957729.126825##T07T08T09T10T11T12##110.64686810.85274410.67589811.13766310.79673711.102408##29.0876819.0272088.9652838.958309

5、9.2750108.940965##38.6258388.5772448.6467518.6258438.6251648.522129##413.40204413.24012613.08888313.23409913.38290313.472223##57.1974407.2626627.2897967.2322497.2023647.306229##69.0023859.0035619.0062789.0067219.0181839.164313..上述數(shù)據(jù)為從GEO數(shù)據(jù)庫(kù)隨意找的基因表達(dá)。其中第一列為基因探針

6、號(hào),后續(xù)幾列則為T(mén)01到T12的12個(gè)樣品對(duì)應(yīng)的表達(dá)量數(shù)據(jù),每三個(gè)樣品為一組。因?yàn)閿?shù)據(jù)是拼湊的,所以這里不關(guān)注探針具體信息了。準(zhǔn)備好數(shù)據(jù)之后我們就開(kāi)始進(jìn)行PCA計(jì)算了。其實(shí)代碼非常簡(jiǎn)單。pca<-prcomp(t(data[,-1]),scale=T)head(pca$x)##PC1PC2PC3PC4PC5PC6##T01-43.457435-44.9500318.3055713.210563-7.428048114.818150##T0242.067255-19.142248-25.57404121.12029

7、4-5.793099014.702922##T03-2.123455-21.512488-11.19247417.58300615.2149034-34.730308##T048.166077-4.77481422.837578-11.3641288.4021038-6.921738##T0518.214073-5.83680718.522768-10.941626-0.6183613-5.548845##T0627.219529-5.51932826.649872-11.054961-4.14804135.09

8、7715##PC7PC8PC9PC10PC11PC12##T01-1.9663429.2181269-1.520882-1.0608353.0484982.731227e-13##T025.8321978.97930189.3861871.6687611.7054742.674666e-13##T03-5.168168-9.7483411-11.5703202.61820

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。