基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究.pdf

基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究.pdf

ID:51200664

大?。?.25 MB

頁數(shù):63頁

時間:2020-03-21

基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究.pdf_第1頁
基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究.pdf_第2頁
基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究.pdf_第3頁
基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究.pdf_第4頁
基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究.pdf_第5頁
資源描述:

《基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、碩碩碩士士士學(xué)學(xué)學(xué)位位位論論論文文文基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究RESEARCHONIDENTIFYINGPROTEINCOMPLEXESBASEDONHIERARCHICALCLUSTERINGANDGENEONTOLOGY劉劉劉銀銀銀海海海哈哈哈爾爾爾濱濱濱工工工業(yè)業(yè)業(yè)大大大學(xué)學(xué)學(xué)2012年年年6月月月國內(nèi)圖書分類號:TP391.3學(xué)校代碼:10213國際圖書分類號:681.37密級:公開工工工學(xué)學(xué)學(xué)碩碩碩士士士學(xué)學(xué)學(xué)位位位論論論文文文基于層次聚類和基因本體的蛋白質(zhì)復(fù)合體預(yù)測研究碩士研究生:劉銀海導(dǎo)師:王曉龍教授申請學(xué)位:工學(xué)碩士學(xué)科:計

2、算機科學(xué)與技術(shù)所在單位:計算機科學(xué)與技術(shù)學(xué)院答辯日期:2012年6月授予學(xué)位單位:哈爾濱工業(yè)大學(xué)Classi?edIndex:TP391.3U.D.C:681.37DissertationfortheMasterDegreeinEngineeringRESEARCHONIDENTIFYINGPROTEINCOMPLEXESBASEDONHIERARCHICALCLUSTERINGANDGENEONTOLOGYCandidate:LiuYinhaiSupervisor:Prof.WangXiaolongAcademicDegreeAppliedfor:Mast

3、erofEngineeringSpecialty:ComputerScienceandTechnologyAliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2012Degree-Conferring-Institution:HarbinInstituteofTechnology哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文摘要蛋白質(zhì)復(fù)合體在各種細(xì)胞活動中都扮演了非常重要的角色。因此,如何有效地從蛋白質(zhì)相互作用網(wǎng)絡(luò)中預(yù)測蛋白質(zhì)復(fù)合體成為生物信息學(xué)中一項重要的工作。蛋白質(zhì)復(fù)合體具有高密度和核-附加結(jié)

4、構(gòu)等拓?fù)涮卣?;?fù)合體預(yù)測即從大規(guī)模蛋白質(zhì)網(wǎng)絡(luò)中挖掘出符合復(fù)合體特征的子圖。本文主要研究如何利用層次聚類和基因本體解決復(fù)合體預(yù)測中存在的三個挑戰(zhàn),從而提升復(fù)合體預(yù)測算法的性能。本文的主要研究內(nèi)容包括以下幾個方面:(1)本文將復(fù)合體預(yù)測問題轉(zhuǎn)換為復(fù)雜網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)問題,在分析了社區(qū)發(fā)現(xiàn)中經(jīng)典的GN算法和HLC算法預(yù)測復(fù)合體的不足之后,通過融合HLC算法和核-附加結(jié)構(gòu)提出了HLC-CA算法。實驗結(jié)果表明HLC-CA算法的性能要明顯好于其他主流算法。此外,本文推導(dǎo)出HLC-CA的時間復(fù)雜度比較低,適合于從大規(guī)模網(wǎng)絡(luò)中挖掘復(fù)合體。(2)本文利用由基因本體計算出的蛋白

5、質(zhì)之間的語義相似度去評估蛋白質(zhì)相互作用的可靠性,從而解決蛋白質(zhì)網(wǎng)絡(luò)的假陽性問題。實驗結(jié)果表明在處理過后的蛋白質(zhì)網(wǎng)絡(luò)上已有復(fù)合體預(yù)測算法的性能得到了顯著的提升。此外,本文通過融合兩個蛋白質(zhì)網(wǎng)絡(luò)證明解決蛋白質(zhì)網(wǎng)絡(luò)假陰性問題能夠有效地提升已有算法的性能。(3)本文基于有監(jiān)督學(xué)習(xí)的方法提出了SCGO算法。SCGO算法從基因本體中抽取出生物學(xué)特征表示蛋白質(zhì)復(fù)合體,接著根據(jù)正反例復(fù)合體集合構(gòu)建復(fù)合體分類器,然后利用復(fù)合體分類器過濾已有算法的預(yù)測結(jié)果。實驗結(jié)果表明SCGO算法能夠顯著提升已有算法的準(zhǔn)確率。關(guān)鍵詞:蛋白質(zhì)復(fù)合體預(yù)測;層次聚類;基因本體;語義相似度-I-哈爾濱

6、工業(yè)大學(xué)工學(xué)碩士學(xué)位論文AbstractProteincomplexesplayafundamentalroleinperformingcellularfunctions.There-fore,determininghowtoeectivelyidentifyproteincomplexesfromprotein-proteinin-teraction(PPI)networksisanimportanttaskinbioinformatics.Proteincomplexeshavetheirinherenttopologicalfeaturesinclud

7、inghigh-densityandcore-attachmentstructure.Theidenti?cationofproteincomplexesistominesub-graphswhichconformthefeaturesofcomplexesfromlarge-scalePPInetworks.Thisthesismainlyfocusesontacklingthethreechallengesexistingincurrentidentifyingcom-plexesalgorithms.Belowisalistofourmainresea

8、rchcontent.First,thisthesi

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。