代謝組學(xué)的數(shù)據(jù)分析技術(shù)

代謝組學(xué)的數(shù)據(jù)分析技術(shù)

ID:19001802

大小:18.00 KB

頁數(shù):3頁

時(shí)間:2018-09-27

代謝組學(xué)的數(shù)據(jù)分析技術(shù)_第1頁
代謝組學(xué)的數(shù)據(jù)分析技術(shù)_第2頁
代謝組學(xué)的數(shù)據(jù)分析技術(shù)_第3頁
資源描述:

《代謝組學(xué)的數(shù)據(jù)分析技術(shù)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、代謝組學(xué)的數(shù)據(jù)分析技術(shù)摘要:代謝組學(xué)是效仿基因組學(xué)和蛋白質(zhì)組學(xué)的研究思想,對生物體內(nèi)所有代謝物進(jìn)行定量分析,并尋找代謝物與生理病理變化的相對關(guān)系的研究方式,是系統(tǒng)生物學(xué)的組成部分。其研究對象大都是相對分子質(zhì)量1000以內(nèi)的小分子物質(zhì)。先進(jìn)分析檢測技術(shù)結(jié)合模式識別和專家系統(tǒng)等計(jì)算分析方法是代謝組學(xué)研究的基本方法。文章主要綜述了將代謝組學(xué)中的圖譜、數(shù)據(jù)信息轉(zhuǎn)換為相應(yīng)的參數(shù)所采用的分析方法。關(guān)鍵詞:代謝組學(xué);數(shù)據(jù)分析方法代謝組學(xué)是以代謝物分析的整體方法來研究功能蛋白如何產(chǎn)生能量和處理體內(nèi)物質(zhì),評價(jià)細(xì)胞和體液內(nèi)源性和外源性代謝物濃度及功能關(guān)系的新

2、興學(xué)科,是系統(tǒng)生物學(xué)的重要組成部分,其相應(yīng)的研究能反映基因組、轉(zhuǎn)錄組和蛋白組受內(nèi)外環(huán)境影響后相互協(xié)調(diào)作用的最終結(jié)果,更接近反映細(xì)胞或生物的表型,因此被越來越廣泛地應(yīng)用。而代謝組學(xué)的數(shù)據(jù)分析包括預(yù)處理和統(tǒng)計(jì)分析方法,多元統(tǒng)計(jì)分析方法主要分為兩大類:非監(jiān)督和監(jiān)督方法,非監(jiān)督方法包括主成分分析PCA;聚類分析CA等;監(jiān)督方法包括顯著性分析、偏最小二乘法等,本文就是主要綜述代謝組學(xué)圖譜信息轉(zhuǎn)化為參數(shù)信息所采用的數(shù)據(jù)分析方法。1預(yù)處理數(shù)據(jù)的預(yù)處理過程包括以下:譜圖的處理;生成原始的數(shù)據(jù)矩陣;數(shù)據(jù)的歸一化以及標(biāo)準(zhǔn)化處理過程。針對實(shí)驗(yàn)性質(zhì)、條件以及樣品

3、等因素采用不同的預(yù)處理方法。在實(shí)際應(yīng)用過程中,預(yù)處理可以通過實(shí)驗(yàn)系統(tǒng)自帶的軟件如XCMS軟件。進(jìn)行,因此一般較容易獲得所需的數(shù)據(jù)形式。2數(shù)據(jù)分析方法2.1主成分分析PCA是多元統(tǒng)計(jì)中最常用的一種方法,它是在最大程度上提取原始信息的同時(shí)對數(shù)據(jù)進(jìn)行降維處理的過程,其目的是將分散的信息集中到幾個(gè)綜合指標(biāo)即主成分上,有助于簡化分析和多維數(shù)據(jù)的可視化,進(jìn)而通過主成分來描述機(jī)體代謝變化的情況。PCA的具體過程是通過一種空間轉(zhuǎn)換,形成新的樣本集,按照貢獻(xiàn)率的大小進(jìn)行排序,貢獻(xiàn)率最大的稱為第一主成分,依次類推。經(jīng)驗(yàn)指出,當(dāng)累計(jì)貢獻(xiàn)率大于85%時(shí)所提取的主

4、成分就能代表原始數(shù)據(jù)的絕大多數(shù)信息,可停止提取主成分。在代謝組數(shù)據(jù)處理中,PCA是最早且廣泛使用的多變量模式識別方法之一。,具有不損失樣品基本信息、對原始數(shù)據(jù)進(jìn)行降維處理的同時(shí)避免原始數(shù)據(jù)的共線性問題等優(yōu)點(diǎn),但在實(shí)際應(yīng)用過程中,PCA存在著自身的缺點(diǎn)[1]:離群樣本點(diǎn)的存在嚴(yán)重影響其生物標(biāo)志物的尋找;非保守性的代謝組分?jǐn)_亂正確的分類以及尺度的差異影響小濃度組分的表現(xiàn)等,其他的問題之前也有討論[2]。針對PCA的缺陷采用了不同的改進(jìn)措施,與此同時(shí),為了簡化計(jì)算,侯詠佳等[3]。提出了一種主成分分析算法的FPGA實(shí)現(xiàn)方案,通過Givens算法

5、和CORDIC算法的矢量旋轉(zhuǎn),用簡單的移位和加法操作來實(shí)現(xiàn)協(xié)方差矩陣的特征分析,只需計(jì)算上三角元素,因此計(jì)算復(fù)雜度小、迭代收斂速度快。2.2locatedintheTomb,DongShenJiabang,deferthenextdayfocusedontheassassination.Linping,Zhejiang,1ofwhichliquorwinemasters(WuzhensaidinformationisCarpenter),whogotAfewbayonets,duetomissedfatal,whennightcame聚類

6、分析CA是用多元統(tǒng)計(jì)技術(shù)進(jìn)行分類的一種方法。其主要原理是:利用同類樣本應(yīng)彼此相似,相類似的樣本在多維空間里的彼此距離應(yīng)較小,而不同類的樣本在多維空間里的距離較大。具體的做法是先將每個(gè)樣本自成一類,選擇距離最小的一對并成一個(gè)新類,計(jì)算新類與其他類之間的距離,再將距離最小的兩類并為一類,直至所有樣本都成為一類為止。目前多維空間里的兩樣本距離的算法主要有:歐氏距離、閔氏距離、馬氏距離等,其中以歐氏距離最常用。2.3判別分析DA又稱分辨分析或分辨法,是在一系列多因子(xi)觀測值的基礎(chǔ)上,對事物的屬性差別進(jìn)行分類或分辨的統(tǒng)計(jì)學(xué)法,主要用于定性預(yù)測

7、。其基本方法是根據(jù)樣品的P個(gè)測定指標(biāo),對一批位置樣品進(jìn)行分類;前提是已知一些樣品的分類,然后根據(jù)P個(gè)測定指標(biāo)來確定未知樣品究竟歸屬哪一類。在判別分析中,判別函數(shù)有最佳型判別函數(shù)和固定型判別函數(shù)兩類。目前,判別分析的準(zhǔn)則和方法亦有許多,如馬氏距離判別法、Fisher判別法、Bayes判別法、逐步判別法等等。2.4偏最小二乘法PLS是SWold和CAlbano等[19]1983年首次提出的回歸方法。它在克服自變量多重相關(guān)性的情況下,能對較少的樣本量進(jìn)行建模以及有效的篩選。葉鶯等[4]實(shí)驗(yàn)證明,與一般最Jb---乘法及PCA相比,PLS計(jì)算所得

8、的擬合殘差最小,穩(wěn)定度最高,能改善各變量的作用方向并使其更符合專業(yè)解釋,成為模型變量篩選的有效工具。其基本原理如下:①將數(shù)據(jù)進(jìn)行中心化和標(biāo)準(zhǔn)化,形成自變量和因變量的矩陣;②求協(xié)方差矩陣,并根據(jù)

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。