資源描述:
《數(shù)據(jù)挖掘技術(shù)在臨床決策中的應(yīng)用研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、數(shù)據(jù)挖掘技術(shù)在臨床決策中的應(yīng)用研究彭柳芬周怡夏毓榮馮博華【摘要】介紹數(shù)據(jù)挖掘技術(shù)的概念、工作原理,在闡述醫(yī)學(xué)數(shù)據(jù)特點的基礎(chǔ)上,探討數(shù)據(jù)挖掘技術(shù)在臨床決策中的應(yīng)用過程,并以糖尿病為例,提出基于數(shù)據(jù)挖掘的輔助臨床決策支持系統(tǒng)設(shè)想,以利于提高醫(yī)院的臨床決策能力?!娟P(guān)鍵詞】數(shù)據(jù)挖掘;臨床決策;決策樹1前言隨著國家信息基礎(chǔ)結(jié)構(gòu)建設(shè)目標(biāo)的實施,企業(yè)在各種活動中普遍采用現(xiàn)代信息技術(shù)來提高競爭力。傳統(tǒng)的基于數(shù)據(jù)的管理信息系統(tǒng)已不能滿足決策者對數(shù)據(jù)質(zhì)量的需求,面向決策的知識管理系統(tǒng)正在蓬勃興起,智能決策支持技術(shù)成為目前迫切
2、需要發(fā)展的方向。醫(yī)學(xué)領(lǐng)域也不例外,臨床決策研究已成為臨床醫(yī)學(xué)中的一個重要領(lǐng)域,當(dāng)下的臨床決策問題涉及到醫(yī)學(xué)信息學(xué)、循證醫(yī)學(xué)、費用-效益評估、衛(wèi)生技術(shù)評估、醫(yī)學(xué)倫理與法律等學(xué)科領(lǐng)域,因此在臨床決策中單一的經(jīng)驗-描述的研究綱領(lǐng)已不適應(yīng)當(dāng)代醫(yī)學(xué)發(fā)展的需要,需要引入綜合的決策方法,以使臨床醫(yī)療達到最佳療效。 2數(shù)據(jù)挖掘近年來,隨著電子信息技術(shù)的迅速發(fā)展,醫(yī)院信息系統(tǒng)(hospitalinformationsystem,HIS)和醫(yī)療設(shè)備的廣泛應(yīng)用,醫(yī)院數(shù)據(jù)庫的信息容量不斷膨脹。數(shù)據(jù)庫技術(shù)的發(fā)展解決了海量數(shù)據(jù)的存
3、儲和數(shù)據(jù)檢索的效率問題,但無法改變“數(shù)據(jù)爆炸但知識貧乏”的現(xiàn)象。如何充分利用些寶貴的醫(yī)學(xué)信息資源來為疾病的診斷和治療提供科學(xué)的決策,促進醫(yī)學(xué)研究?如何在醫(yī)院信息系統(tǒng)中積累了大量的管理信息和臨床信息資源中挖掘深層次的、隱含的、有價值的知識?數(shù)據(jù)挖掘有解決這方面問題的能力,利用數(shù)據(jù)挖掘技術(shù)開展科學(xué)研究,提高醫(yī)學(xué)技術(shù)和醫(yī)院管理水平是很有必要的?! ?.1數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘(DataMining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)集中識別有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡
4、過程。它是一門涉及面很廣的交叉學(xué)科,包括機器學(xué)習(xí)、數(shù)理統(tǒng)計、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫、模式識別、粗糙集、模糊數(shù)學(xué)等相關(guān)技術(shù)。數(shù)據(jù)挖掘可粗略地理解為三部曲:數(shù)據(jù)準(zhǔn)備(DataPreparation)、數(shù)據(jù)挖掘,以及結(jié)果的解釋評估(IterpretationandEvaluation)。將數(shù)據(jù)挖掘技術(shù)應(yīng)用到醫(yī)學(xué)信息數(shù)據(jù)庫中,可以發(fā)現(xiàn)其中的醫(yī)學(xué)診斷規(guī)則和模式,從而輔助醫(yī)生進行疾病診斷,實現(xiàn)臨床決策支持的效果?! ?.2臨床決策支持系統(tǒng)在醫(yī)院信息系統(tǒng)(HospitalInformationSystem,HIS)中,主要有
5、兩大分支:醫(yī)院管理信息系統(tǒng)(HospitalManagementInformationSystem,HMIS)和臨床信息系統(tǒng)(ClinicalInformationSystem,CIS)。HMIS主要目標(biāo)是支持醫(yī)院的行政管理與事務(wù)處理業(yè)務(wù);而CIS主要目標(biāo)是支持醫(yī)護人員的臨床活動,收集和處理病人的臨床醫(yī)療信息,豐富和積累臨床醫(yī)學(xué)知識,提供臨床咨詢、輔助診療、輔助臨床決策,提高醫(yī)護人員的工作效率。臨床決策支持系統(tǒng)(ClinicalDecisionSupportSystem,CDSS)是屬于CIS中的一部分。
6、CDSS是用人工智能技術(shù)對臨床醫(yī)療工作予以輔助支持的信息系統(tǒng),它可以根據(jù)收集到的病人資料,做出整合型的診斷和醫(yī)療意見,提供給臨床醫(yī)務(wù)人員參考。系統(tǒng)主要采用基于決策樹和真值表的方法,接著出現(xiàn)了基于統(tǒng)計學(xué)方法的系統(tǒng),研究人員針對不同醫(yī)療領(lǐng)域開發(fā)不同的臨床CDSS?;镜呐R床CDSS由數(shù)據(jù)庫、模型庫和對話系統(tǒng)(人機交互系統(tǒng))3個部分組成,如圖1所示?! ?.3挖掘算法對醫(yī)學(xué)數(shù)據(jù)庫進行數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的主要目的是預(yù)測疾病和對疾病進行分類。分類和預(yù)測是兩種數(shù)據(jù)分析形式,可以用于描述重要數(shù)據(jù)類的模型或預(yù)測未來的數(shù)據(jù)
7、趨勢。常用的數(shù)據(jù)挖掘算法有:關(guān)聯(lián)規(guī)則、決策樹、粗糙集、統(tǒng)計分析、神經(jīng)網(wǎng)絡(luò)、支持向量機、模糊聚類、基于范例的推理(Case-BasedReasoning簡稱CBR)、貝葉斯預(yù)測、可視化技術(shù)。在數(shù)據(jù)挖掘技術(shù)中,常用于輔助臨床疾病診斷的方法,主要有①Bayes判別分析;②人工神經(jīng)網(wǎng)絡(luò);③決策樹。其中,決策樹是一種非常有效的機器學(xué)習(xí)分類算法。決策樹方法的起源是概念學(xué)習(xí)系統(tǒng)CLS,然后發(fā)展到ID3方法而為高潮,最后又演化為能處理連續(xù)屬性的C5.0。有名的決策樹方法還有CART和Assistant。決策樹學(xué)習(xí)著眼于從
8、一組無次序、無規(guī)則的事例中推理出決策樹表示形式的分類規(guī)則。它采用自頂向下的遞歸方式,在決策樹的內(nèi)部結(jié)點進行屬性值的比較并根據(jù)不同的屬性值判斷從該結(jié)點向下的分支,在決策樹的葉結(jié)點得到結(jié)論。所以從根到葉結(jié)點的一條路徑就對應(yīng)著一條合取規(guī)則,整棵決策樹就對應(yīng)著一組析取表達式規(guī)則?;跊Q策樹的學(xué)習(xí)算法的一個最大的優(yōu)點就是它在學(xué)習(xí)過程中不需要使用者了解很多背景知識(這也同時是它最大的缺點),只要訓(xùn)練例子能夠用屬性——結(jié)論式的方式表達出來,