資源描述:
《基于機器學(xué)習(xí)方法藥物不良反應(yīng)預(yù)測》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、摘要嚴重藥物不良反應(yīng)(severeAdverseDrugReaction,sADR)是新藥開發(fā)中導(dǎo)致藥物失敗的一個主要因素。當(dāng)前,評估嚴重藥物不良反應(yīng)的方法主要是通過臨床實驗的方法進行的。這樣會給患者造成不必要的痛苦并且花費巨大。因此,在藥物開發(fā)的早期階段開發(fā)一個可行的方法能夠?qū)蜻x藥物分子進行嚴重藥物不良反應(yīng)的評估是非常有必要的。在本次研究中,我們利用機器學(xué)習(xí)(MachineLearnin已ML)方法來進行藥物不良反應(yīng)的預(yù)測。在這次研究中,我們選擇了一個普遍發(fā)生的致命嚴重不良反應(yīng)一呼吸困難(Dyspn朗)作為一個方法性探索的實例來構(gòu)建一個藥物不良反應(yīng)的預(yù)測模型。我們搜集了11
2、68個上市藥物結(jié)構(gòu)和其相關(guān)的藥物不良反應(yīng)信息。搜集到的每一個藥物分子結(jié)構(gòu)都通過MoEQSAR描述符模塊將其轉(zhuǎn)成包含成333個描述符作為建模的特征向量。經(jīng)過特征提取總共有152個分子描述符被選出與所研究的嚴重不良反應(yīng)一呼吸困難有較強的關(guān)聯(lián)性?;谶@些分子描述符,我們使用3種優(yōu)秀的并且比較成熟的算法分別構(gòu)建了3個獨立的預(yù)測模型。然后,我們利用十重交叉驗證對著三個模型的預(yù)測性能進行評估。三個模型的總體預(yù)測準確率均高達82%。對于預(yù)測性能最佳的貝葉斯網(wǎng)絡(luò)模型,我們利用外部測試集對其進行了進一步的評估。經(jīng)過對預(yù)測后的結(jié)果分析,我們發(fā)現(xiàn)貝葉斯網(wǎng)絡(luò)預(yù)測模型對導(dǎo)致呼吸困難發(fā)生頻率在1%以上的藥
3、物的預(yù)測預(yù)測準確率可以達到86.76%。此外,預(yù)測模型在非處方藥(O、,erThecounte‘OTc)的總體預(yù)測準確度也能達到80.oo%。在利用Y.陽ndomization對模型的評估中發(fā)現(xiàn)所建立的模型并沒有偶然關(guān)聯(lián)性。經(jīng)過我們的研究分析,我們認為我所構(gòu)建的機器學(xué)習(xí)模型能夠作為一個有效的工具在藥物開發(fā)的早期階段進行藥物安全性的評估。關(guān)鍵字:機器學(xué)習(xí);藥物不良反應(yīng);呼吸困難.ABSTRACTSeVereAdVerSeDmgReaction(SADR)isoneoftllem血re嬲onsⅡ斌1eadt0也e筋lureofnew(1mgdeVelopment.Cu玎emly,m
4、e舔sessmentofSAD黜is刪血lyacllievI耐byobseⅣationofclillicaltrials,W11ichcausesm砒1ypainsofpatientSaIldiscostly.Therefore,itisdeshdt0deVelopametllodtllatcaneV2Ll岫tcthepotentialSAD黜ofdmgc趾Ididatesinedydmgdiscove珥hl廿lisresearch,weutilizeMacllil艙Le戤11iI培(ML)techIliquet0predictSADR.111this咖dy,wechoseac
5、ommon趾dl劬alSAD凡dySpnea,嬲恤ex鋤plet0buildacomputationalmodelforADR嬲sessment.T0taJIy,1,168markeddmgsaIld此ir咖tures、Ⅳerecollected.Eachofthesedrugs饑lcturesw懿firstconverted硫oafeatureVectorbycalculationof152QSARde剛ptors.U.pontlle∞Vectors,threei11dependentmodelswerecons協(xié)lctedusingt11reealgori廿lms,Baye
6、si趾Net、^,o咄C4.5觚dR矗ndomForestrespectively.Thepe響mances0fmese缸eemacllinelearrIhlgmodels、ⅣereeV2Ll瑚ltedby10-crossValidation,WIlich廿leoVerallpredictionacCuraciesareallabove82%.ThebeStmodelofBayesianNetwDrkw鵲缸恤ereValuatedbye燦emaltestset.Itw弱obseⅣednlattl圮modeleValuateddrug—iIlduceddyspneaofabove
7、1%incidence謝tllaCcuraCyof86.76%.Thedyspnea嬲sessment0n證lecurremOVermeCounter(0TC)血lgsalsoachieved觚oVerallaccuracy0f80.00%.FumerY-randomizationamllysisiIldica_testhatmeperf.omanceoftheBayesianN咖rkmodeldoesn’thaveobviouscllanceco玎elation.Our咖dysuggest