資源描述:
《GO術(shù)語間語義相似性的度量方法》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、摘要關(guān)于相似性的研究在很多研究領(lǐng)域里都起到了關(guān)鍵作用。相似性的研究主要包括結(jié)構(gòu)的相似性和語義的相似性。以往對結(jié)構(gòu)相似性的關(guān)注和研究比較多,近幾年,語義相似性吸引了越來越多的注意。由于歷史原因所致,生物學(xué)數(shù)據(jù)來源非常復(fù)雜。為了減少或消除概念及術(shù)語的混亂,Gene0ntology協(xié)會開發(fā)了生物學(xué)數(shù)據(jù)的大型語義詞典?一基因本體G0(Gene0ntology)。GO應(yīng)用的一個重要方面就是對GO術(shù)語的語義相似性進(jìn)行度量。通常認(rèn)為,如果兩個基因產(chǎn)物的功能相似,那么它們的基因表達(dá)就相近,同時它們在Go中注解的術(shù)語就相似,所以我們只要能找
2、出G0中術(shù)語對的相似度,就可以近似估計兩基因表達(dá)的相似度,從而判斷兩基因產(chǎn)物功能的相似程度。所以說,GO術(shù)語間語義相似性的度量是解決生物學(xué)數(shù)據(jù)集成中語義異構(gòu)問題的重要方法。本文首先介紹了關(guān)于GO的背景知識和對于語義相似性的研究;接著分析了當(dāng)前G0術(shù)語間語義相似性的幾種常用度量方法;然后主要針對其中最常用的一種提出了改進(jìn)的措施一一基于語義子圖計算G0術(shù)語間語義相似性的方法;并以GO圖的一小部分為例,做了算法的研究:最后對該方法進(jìn)行了總結(jié),并探討了其更為廣闊的應(yīng)用空間。本文提出的方法是結(jié)合了基于信息量和基于概念距離兩方面的方法
3、,可使語義相似性測量的精確度得到進(jìn)一步的提高,如果能應(yīng)用到大的Go數(shù)據(jù)庫中,將能更加準(zhǔn)確地查找功能相似或者相關(guān)的蛋白質(zhì),為相關(guān)研究及應(yīng)用打下良好的基礎(chǔ)。關(guān)鍵詞:GO;語義相似性:信息量;語義距離Abstract11lestudyofsimilarityincludcsmostlystmcturalsimilarity蛐ds哪anticsimilarity.Thestudy衄stnlctufalsimilarityispen,勰ive∞mpamtivelyinthep勰t,卸dtllestlldyofsem鋤ticsimil
4、arityattractsmofcandmoreattentiontinreoentyc甜s.‘0wingtollistoricalrcasons,thedatasource0fbiologyisVerycomplicated.F0rfeducillgorelimiIlatiIlgconfusionbetweenc0Ⅱc印ts柚dte珊s,GeneOntologyconsoniumresearchedanddcvdopedalargcs哪anticdictionary?G0(Geneontology).11Iereseac
5、hOfsimilarityplaysanimponantroleinm鋤ystudyfidds.0neiⅡlport卸taspcctofGOapplicatiOnismeasuringsem柚ticsimil缸itybctweenGOte珊s.ItisgenemⅡybclieVedthatifMogcnepmductsarcsimil鵝we、釉uldexc印ttilaCtheirgcneticcxp佗ssi∞sarcsiIIlil甄柚dthattheyaresimiIarly鋤otatedinthcGO.Thus,wcma
6、ycomparesimil捌tyoffIlnctionlevels0ft、vOgeneproductsagainsttheircorrcspondjngsiInilarityof卸notationintheGo.Someasu血gsemanticsimilaritybctweenGOtemsis粕i1IlponaIItappfo扯ht0r鷦olVethepIoblemofsem鋤tichetcro群meityinbiolo百caldataintegration.AtfiISt,weprcsentthebackgroundO
7、fGO柚dthestudysitIlationofsemanticsjmilarityinthispapeLTheⅡwe鋤alyzeseVeralavailableappfoachesformeasu血gsemanticsimilafitybe錒eeⅡGOte咖s,孤dproposeasub鮒lph-based印proachagainst伽eoftllemostcomm衄lyu∞dappmaches.加dtl】en,wedesi韶allalgorjthl】1柚dt%t匆ituponapanofGO掣aph.Fillally
8、,asummaryof,tllisappmachis百vcn,柚dwediscIlssmo咒bIoadapplicationspaceforit.弧enew印pmachproposedinthispaperis趾appf0卵hwhichcombinesinlfo鋤ationc0Ⅱtent.b嬲ed卸ds