資源描述:
《基于語(yǔ)義關(guān)系和鏈接分析的疾病知識(shí)提取研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、犬-‘ilii大愛DALIANUNIVERSITYOFTECmOLOGY碩士奪位論文MASTERALDISSERTATION基于語(yǔ)義關(guān)系和鏈接分析的疾病知識(shí)提取研究對(duì)斗錢——呀—峽哩5——作者姓名指導(dǎo)教師一—20156答辯日期_^^_J_碩士學(xué)位論文基于語(yǔ)義關(guān)系和鏈接分析的疾病知識(shí)提取研究AResearchonDiseaseKnowledgeSummarizationBasedonSemanticRelationan
2、dLinkAnalysis作者姓名:吳曉芳學(xué)科、專業(yè):計(jì)算機(jī)應(yīng)用技術(shù):21209185學(xué)號(hào)指導(dǎo)教師:楊志豪教授完成日期:2015年5月4日大遠(yuǎn)理工大摩DalianUniversityofTechnology大連理工大學(xué)學(xué)位論文獨(dú)創(chuàng)性聲明作者鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下進(jìn)行研究工作所取得的成果。盡我所知,除文中巳經(jīng)注明引用內(nèi)容和致謝的地方外,本論文不包含其他個(gè)人或集體已經(jīng)發(fā)表的研究成果,也不包含其他巳申請(qǐng)學(xué)位或其他用
3、途使用過(guò)的成果一。與我同工作的同志對(duì)本研究所做的貢獻(xiàn)均已在論文中做了明確的說(shuō)明并表示了謝意。若有不實(shí)之處,本人愿意承擔(dān)相關(guān)法律責(zé)任。學(xué)位論文題目:;效孫令巧和談梭秘乾令命作者簽名:曰期:年6月另曰大連理工大學(xué)碩十學(xué)位論文摘要近年來(lái),生物醫(yī)學(xué)領(lǐng)域的在線文獻(xiàn)數(shù)量呈指數(shù)增長(zhǎng),大量的文獻(xiàn)查詢費(fèi)時(shí)費(fèi)力,無(wú)法高效地提供給用戶所需的生物醫(yī)學(xué)信息。信息檢索技術(shù)和信息抽取技術(shù)在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用,極大地促進(jìn)了傳統(tǒng)生物醫(yī)學(xué)文獻(xiàn)查詢方式的變革。信息檢索技術(shù)的應(yīng)用為生物醫(yī)學(xué)文獻(xiàn)的搜
4、索提供了便利,例如在線生物醫(yī)學(xué)資源庫(kù)PubMed,可以根據(jù)輸入的查詢語(yǔ)句檢索到相關(guān)主題的文獻(xiàn)返回給用戶。然而,信息檢索技術(shù)需要給出適當(dāng)?shù)牟樵冊(cè)~,并且查詢后返回的文獻(xiàn)依然很多一。信息抽取技術(shù)在定程度上解決了文獻(xiàn)閱讀數(shù)量巨大的問(wèn)題,對(duì)特定主題進(jìn)行信息提取,給用戶提供文獻(xiàn)的文本摘要。本文基于語(yǔ)義網(wǎng)絡(luò),利用信息抽取技術(shù)對(duì)生物醫(yī)學(xué)文獻(xiàn)進(jìn)行知識(shí)提取,并以網(wǎng)絡(luò)圖的形式將特定主題提取得到的語(yǔ)義知識(shí)網(wǎng)絡(luò)呈現(xiàn)出來(lái)。本文基于顯著信息提取算法,從疾病相關(guān)的語(yǔ)義網(wǎng)絡(luò)數(shù)據(jù)集中抽取與疾病相關(guān)的基因、藥物以及基
5、因和藥物之間的關(guān)系。顯著信息提取算法得到疾病相關(guān)的單層語(yǔ)義網(wǎng)絡(luò)提取結(jié)果,并實(shí)現(xiàn)了疾病知識(shí)提取可視化系統(tǒng)。本文在顯著信息提取算法啟發(fā)下提出了一種基于鏈接分析的深層知識(shí)提取方法。實(shí)一驗(yàn)應(yīng)用種新的顯著信息提取算法KM,對(duì)特定疾病的基因數(shù)據(jù)集中的語(yǔ)義類型和關(guān)系謂詞進(jìn)行提取,得到與主題直接相關(guān)的基因。顯著信息提取算法得到的疾病和基因的提一取結(jié)果作為第層關(guān)系,利用深度搜索得到疾病與基因之間的深層關(guān)系,并通過(guò)隨機(jī)游走RRW的轉(zhuǎn)移概率矩陣對(duì)深層關(guān)系網(wǎng)絡(luò)進(jìn)行過(guò)濾,最終得到疾病知識(shí)網(wǎng)絡(luò)可視化呈現(xiàn)。基
6、于鏈接分析的深層知識(shí)提取方法在三種疾病數(shù)據(jù)上進(jìn)行了推廣和應(yīng)用。實(shí)驗(yàn)結(jié)果表明一,該方法在疾病知識(shí)提取方面具有定的有效性和普適性。生物醫(yī)學(xué)語(yǔ)義網(wǎng)絡(luò)知識(shí)提取,能夠有效地提煉跟特定生物醫(yī)學(xué)主題相關(guān)的重要信一息。本文的實(shí)驗(yàn)方法對(duì)比Combo生物醫(yī)學(xué)信息提取算法有定提高,并在多個(gè)疾病語(yǔ)料集上進(jìn)行了驗(yàn)證,能夠有效地提高生物醫(yī)學(xué)知識(shí)的獲取效率。關(guān)鍵詞:信息抽??;語(yǔ)義網(wǎng)絡(luò);顯著信息提取算法;深度搜索;隨機(jī)游走RRW--1基于語(yǔ)義關(guān)系和鏈接分析的疾病知識(shí)提取研究AResearchon
7、DiseaseKnowledeSummarizationBasedongSemanticRelationandLinkAnalysisAbstractBiomedicalliteratureisgrowingrapidlyinrecentdecades.Thecontinuedgrowthofbiomedicalliteraturebrinsreatchallenestotraditionalinformationsearchinfrom
8、texts.ggggInformationretrievalandinformationextractiongreatlypromotethetransformationoftraditionalbiomedicalliteratureresearch.Biomedicalinformationretrievalprovidesaconvenientwaywh