資源描述:
《GO術(shù)語間語義相似性的度量方法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、摘要關(guān)于相似性的研究在很多研究領(lǐng)域里都起到了關(guān)鍵作用。相似性的研究主要包括結(jié)構(gòu)的相似性和語義的相似性。以往對結(jié)構(gòu)相似性的關(guān)注和研究比較多,近幾年,語義相似性吸引了越來越多的注意。由于歷史原因所致,生物學數(shù)據(jù)來源非常復雜。為了減少或消除概念及術(shù)語的混亂,Gene0ntology協(xié)會開發(fā)了生物學數(shù)據(jù)的大型語義詞典?一基因本體G0(Gene0ntology)。GO應用的一個重要方面就是對GO術(shù)語的語義相似性進行度量。通常認為,如果兩個基因產(chǎn)物的功能相似,那么它們的基因表達就相近,同時它們在Go中注解的術(shù)語就相似,所以我們只要能找
2、出G0中術(shù)語對的相似度,就可以近似估計兩基因表達的相似度,從而判斷兩基因產(chǎn)物功能的相似程度。所以說,GO術(shù)語間語義相似性的度量是解決生物學數(shù)據(jù)集成中語義異構(gòu)問題的重要方法。本文首先介紹了關(guān)于GO的背景知識和對于語義相似性的研究;接著分析了當前G0術(shù)語間語義相似性的幾種常用度量方法;然后主要針對其中最常用的一種提出了改進的措施一一基于語義子圖計算G0術(shù)語間語義相似性的方法;并以GO圖的一小部分為例,做了算法的研究:最后對該方法進行了總結(jié),并探討了其更為廣闊的應用空間。本文提出的方法是結(jié)合了基于信息量和基于概念距離兩方面的方法
3、,可使語義相似性測量的精確度得到進一步的提高,如果能應用到大的Go數(shù)據(jù)庫中,將能更加準確地查找功能相似或者相關(guān)的蛋白質(zhì),為相關(guān)研究及應用打下良好的基礎。關(guān)鍵詞:GO;語義相似性:信息量;語義距離Abstract11lestudyofsimilarityincludcsmostlystmcturalsimilarity蛐ds哪anticsimilarity.Thestudy衄stnlctufalsimilarityispen,勰ive∞mpamtivelyinthep勰t,卸dtllestlldyofsem鋤ticsimil
4、arityattractsmofcandmoreattentiontinreoentyc甜s.‘0wingtollistoricalrcasons,thedatasource0fbiologyisVerycomplicated.F0rfeducillgorelimiIlatiIlgconfusionbetweenc0Ⅱc印ts柚dte珊s,GeneOntologyconsoniumresearchedanddcvdopedalargcs哪anticdictionary?G0(Geneontology).11Iereseac
5、hOfsimilarityplaysanimponantroleinm鋤ystudyfidds.0neiⅡlport卸taspcctofGOapplicatiOnismeasuringsem柚ticsimil缸itybctweenGOte珊s.ItisgenemⅡybclieVedthatifMogcnepmductsarcsimil鵝we、釉uldexc印ttilaCtheirgcneticcxp佗ssi∞sarcsiIIlil甄柚dthattheyaresimiIarly鋤otatedinthcGO.Thus,wcma
6、ycomparesimil捌tyoffIlnctionlevels0ft、vOgeneproductsagainsttheircorrcspondjngsiInilarityof卸notationintheGo.Someasu血gsemanticsimilaritybctweenGOtemsis粕i1IlponaIItappfo扯ht0r鷦olVethepIoblemofsem鋤tichetcro群meityinbiolo百caldataintegration.AtfiISt,weprcsentthebackgroundO
7、fGO柚dthestudysitIlationofsemanticsjmilarityinthispapeLTheⅡwe鋤alyzeseVeralavailableappfoachesformeasu血gsemanticsimilafitybe錒eeⅡGOte咖s,孤dproposeasub鮒lph-based印proachagainst伽eoftllemostcomm衄lyu∞dappmaches.加dtl】en,wedesi韶allalgorjthl】1柚dt%t匆ituponapanofGO掣aph.Fillally
8、,asummaryof,tllisappmachis百vcn,柚dwediscIlssmo咒bIoadapplicationspaceforit.弧enew印pmachproposedinthispaperis趾appf0卵hwhichcombinesinlfo鋤ationc0Ⅱtent.b嬲ed卸ds