數(shù)學(xué)建模華中賽b題優(yōu)秀論文

數(shù)學(xué)建模華中賽b題優(yōu)秀論文

ID:36111215

大?。?85.00 KB

頁數(shù):23頁

時間:2019-05-06

數(shù)學(xué)建模華中賽b題優(yōu)秀論文_第1頁
數(shù)學(xué)建模華中賽b題優(yōu)秀論文_第2頁
數(shù)學(xué)建模華中賽b題優(yōu)秀論文_第3頁
數(shù)學(xué)建模華中賽b題優(yōu)秀論文_第4頁
數(shù)學(xué)建模華中賽b題優(yōu)秀論文_第5頁
資源描述:

《數(shù)學(xué)建模華中賽b題優(yōu)秀論文》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、--第八屆華中地區(qū)大學(xué)生數(shù)學(xué)建模邀請賽承諾書我們仔細(xì)閱讀了第八屆華中地區(qū)大學(xué)生數(shù)學(xué)建模邀請賽的競賽細(xì)則。我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競賽規(guī)則的,如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們將受到嚴(yán)

2、肅處理。我們的參賽報名號為:參賽隊員(簽名):隊員1:----隊員2:隊員3:武漢工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會第八屆華中地區(qū)大學(xué)生數(shù)學(xué)建模邀請賽組委會第八屆華中地區(qū)大學(xué)生數(shù)學(xué)建模邀請賽編號專用頁選擇的題號:B參賽的編號:----(以下內(nèi)容參賽隊伍不需要填寫)競賽評閱編號:----第八屆華中地區(qū)大學(xué)生數(shù)學(xué)建模邀請賽題目:基因調(diào)控網(wǎng)絡(luò)的重構(gòu)及病毒感染的致病機(jī)制【摘要】一個基因的表達(dá)受其他基因的影響,而這個基因又影響其他基因的表達(dá),這種相互影響相互制約的關(guān)系構(gòu)成了復(fù)雜的基因調(diào)控網(wǎng)絡(luò)?;蛘{(diào)控網(wǎng)絡(luò)的研究是從基因之間相

3、互作用的角度揭示復(fù)雜的生命現(xiàn)象,是當(dāng)前生物信息學(xué)研究的前沿。疾病的發(fā)病因素和原理,對于醫(yī)療領(lǐng)域有著十分重要的作用。這不僅僅能夠讓更多的患者免受病痛的困擾,還能促進(jìn)人類醫(yī)學(xué)史的進(jìn)步。所以根據(jù)基因數(shù)據(jù)譜來重構(gòu)基因調(diào)控網(wǎng)絡(luò),以及某個疾病癥狀產(chǎn)生的原因的研究具有很大的意義。本文對基因調(diào)控網(wǎng)絡(luò)的重構(gòu)以及導(dǎo)致嚴(yán)重臨床癥狀的蛋白質(zhì)進(jìn)行了研究和推測。由于所給的基因數(shù)據(jù)譜(附錄一)十分龐大,所以首先要對數(shù)據(jù)進(jìn)行降維處理。本題基于時間序列給出了272組基因數(shù)據(jù),為了減小噪聲以及缺失值對實(shí)驗(yàn)精度的干擾,在實(shí)驗(yàn)前對四組噪聲

4、較大或有缺失的數(shù)據(jù)進(jìn)行剔除。具體的降維方式采用了多元統(tǒng)計法中的主成分分析和聚類分析:先對這一萬多個數(shù)據(jù)做主成分分析,從這一萬多個數(shù)據(jù)中,通過線性變化選出了1000個左右的重要變量來組成新的樣本。既降低了數(shù)據(jù)的處理難度,又盡量保持了新數(shù)據(jù)和原數(shù)據(jù)相比,盡可能保持原數(shù)據(jù)的信息。然后用spss兩階聚類法粗略地對要聚類的數(shù)目進(jìn)行一個估計,根據(jù)此估計用K-means算法對數(shù)據(jù)進(jìn)行處理,得到相應(yīng)的30組數(shù)據(jù)。對這30組數(shù)據(jù)建立模型,來重構(gòu)基因調(diào)控網(wǎng)絡(luò)。本文中采用的模型是線性回歸模型,并對它的合理性,以及相較貝葉

5、斯網(wǎng)絡(luò)作了對比。最后依據(jù)所得到的系數(shù)矩陣進(jìn)行基因網(wǎng)絡(luò)圖的繪制與呈現(xiàn)。----問題二在第一問的基礎(chǔ)上,尋求導(dǎo)致產(chǎn)生嚴(yán)重臨床癥狀的蛋白質(zhì)。根據(jù)附錄二給出的個體出現(xiàn)感染癥狀時間節(jié)點(diǎn)示意圖,1代表此志愿者在該時間節(jié)點(diǎn)表現(xiàn)出了臨床癥狀,0則表示沒有,這是一個二分類。本題采用邏輯回歸模型,利用LR分類器模型去尋找該重要蛋白質(zhì)。用268組數(shù)據(jù),其中每一個基因視為該組數(shù)據(jù)的一個屬性,對這些基因進(jìn)行LR分類,并得到相應(yīng)的系數(shù)矩陣。然后對系數(shù)矩陣進(jìn)行分析,取出影響比較大的幾個基因,然后對照基因表對基因作用的描述去尋求該

6、重要蛋白。本題最終找出四個導(dǎo)致志愿者產(chǎn)生嚴(yán)重的臨床癥狀的蛋白質(zhì)。所有代碼實(shí)現(xiàn),以及每次得到的系數(shù)矩陣均在附錄中給出。關(guān)鍵詞:線性回歸模型,基因調(diào)控網(wǎng)絡(luò)重構(gòu),多元統(tǒng)計法,主成分分析,聚類分析,邏輯回歸(LR分類器模型)1.問題重述通過基因之間的相互調(diào)控,生物體可以實(shí)現(xiàn)細(xì)胞的生長,器官的發(fā)育、以及免疫等各種生物機(jī)能。隨著測序技術(shù)的發(fā)展,產(chǎn)生了越來越多的高通量實(shí)驗(yàn)數(shù)據(jù)?;谶@些實(shí)驗(yàn)數(shù)據(jù)重建基因調(diào)控網(wǎng)絡(luò)(Generegulatorynetworks,GRNs),對于深入了解生物機(jī)能的實(shí)現(xiàn)過程具有重要作用。生

7、物實(shí)驗(yàn)中,在17個健康志愿者鼻內(nèi)接種流感病毒H3N2/Wisconsin,其中9個人出現(xiàn)了嚴(yán)重的感染癥狀,另外的8個人沒有出現(xiàn)癥狀。接種后,每隔大約8h從血液中采集樣本測量基因表達(dá)譜數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)一共有16個時間點(diǎn)(單位:h),包括baseline(-24),0,5,12,21,29,36,45,53,60,69,77,84,93,101,108,共268----個樣本?;虮磉_(dá)譜數(shù)據(jù)見附件1,其中前8個為未出現(xiàn)嚴(yán)重感染癥狀的數(shù)據(jù),后9個為出現(xiàn)嚴(yán)重感染癥狀的數(shù)據(jù)。(其中行代表探針號,對應(yīng)著不同的基因

8、;列為各個個體血液樣本在各個時間節(jié)點(diǎn)的數(shù)據(jù))個體出現(xiàn)感染癥狀的時間節(jié)點(diǎn)示意圖見附件2。問題:1)根據(jù)實(shí)驗(yàn)數(shù)據(jù)重構(gòu)基因調(diào)控網(wǎng)絡(luò);2)通過比較出現(xiàn)感染癥狀的志愿者和健康志愿者的樣本數(shù)據(jù),試確定病毒感染人體后導(dǎo)致志愿者是否會出現(xiàn)嚴(yán)重臨床癥狀的重要蛋白。1.問題分析一個基因的表達(dá)受其他基因的影響,而這個基因又影響其他基因的表達(dá),這種相互影響相互制約的關(guān)系構(gòu)成了復(fù)雜的基因調(diào)控網(wǎng)絡(luò)。更一般些,幾乎所有的細(xì)胞活動都被基因網(wǎng)絡(luò)所控制。生命是存儲并加工信息的復(fù)雜系統(tǒng),孤立地研究單個基因

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。