資源描述:
《基于高通量測序的瑞香狼毒轉(zhuǎn)錄組數(shù)據(jù)分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、基于高通量測序的瑞香狼毒轉(zhuǎn)錄組數(shù)據(jù)分析中國林業(yè)科學(xué)研宄院林業(yè)研宄所林木遺傳育種國家重點實驗室國家林業(yè)局林木培育重點實驗室河北省科學(xué)院生物研究所河北省主要農(nóng)作物病害微生物控制工程技術(shù)研究中心摘要:目的獲得瑞香狼毒Stellerachamaejasme轉(zhuǎn)錄組數(shù)據(jù)陣代謝途徑基因序列、SSR以及轉(zhuǎn)座子等信息。方法以瑞香狼毒根作為受試材料,采用二代測序方法中的IlluminaHiSeq2000進行轉(zhuǎn)錄組測序,并進行系統(tǒng)的牛.物信息學(xué)分析。結(jié)果井獲得26785872個Cleanreads片段,拼接得到47053條Unigenes
2、,平均長度為419nt。將拼裝所得到的Unigene序列利用BLAST工具分別與Nr、Swiss-Prot、KEGG、COG和GO數(shù)據(jù)庫進行比對,分別有11138和24744條Unigene在Nr和Swiss-Prot數(shù)據(jù)庫中比對得到了注釋信息,可歸于36個G0分類,涉及119個KEGG標準代謝通路,進一步分析發(fā)現(xiàn)15條萜類生物合成途徑的關(guān)鍵酶基因。利用MISA軟件發(fā)現(xiàn)3480tSSR,數(shù)量最高的SSR類型為單堿基重復(fù),為1986條,出現(xiàn)頻率為57.07%,最少的是六堿基重復(fù)SSR,只有5條,出現(xiàn)頻率僅為0.14%。
3、利用RepeatMasker在線工具針對瑞香狼毒轉(zhuǎn)錄組序列進行轉(zhuǎn)座子預(yù)測分析,結(jié)果共發(fā)現(xiàn)有1497條轉(zhuǎn)座子,其中E值〈IX10-5的序列有827條,包含22種類型轉(zhuǎn)座子,數(shù)目最多的為LINE/L1類型(405條),占比為48.97%,占比最少的為DNA/Ginger、DNA/hAT、DNA/PIF-ISL2EU和LINE/Jockey以及LTR/Lenti類型分別只有1條。結(jié)論對瑞香狼毒進行高通量測序,獲得丫火量基因序列信息以及SSR和轉(zhuǎn)座子信息,為今后分離克隆瑞香狼毒中佛波酯等有效成分生物合成的關(guān)鍵酶基因以及幵展相
4、關(guān)分子機制研宄提供了數(shù)據(jù)資源和理論基礎(chǔ)。關(guān)鍵詞:瑞香狼毒;轉(zhuǎn)錄組;縫佛波酯;代謝通路;作者簡介:楊艷芳(1978—),女,副研宂員,研宂方向為林木次生代謝。Tel:(010)62889638E-mail:echoyyf@caf.ac.cn作者簡介:邱德有,男,研究員,博士生導(dǎo)師,主要從事植物次生代謝研究。Tel:(010)62889641E-mail:qiudy@caf.ac.cn收稿日期:2017-07-18基金:中央級公益性科研院所基本科研業(yè)務(wù)費專項(CAFYBB2014QB001)Transcriptomech
5、aracterizationofStellerachamaejasmewithIlluminasequencingtechnologyYANGYan-fangLIUHong-weiQIUDe-youResearchInstituteofForestry,ChineseAcademyofForestry,StateKeyLaboratoryofTreeGeneticsandBreeding,KeyLaboratoryofTreeBreedingandCultivationofStateForestryAdministr
6、ation;BiologyInstitute,HebeiAcademyofSciences,HebeiEngineeringandTechnologyCenterofMicrobiologicalControlonMainCropDisease;Abstract:ObjectiveToobtainthetranscriptomedatabaseandgenesequence,SSRaswellastransposoninformationofStellerachamaejasme-MethodsUsingthehig
7、h-throughputsequencingplatform(IlluminaHiSeq2000),aroottranscriptomedatasetofS.chamaejasmewasobtained,andthesequencingresultswereanalyzedwiththebioinformaticway.ResultsWithatotalof26785872cleanreads,47053unigeneswereassembled.Alltheseunigeneswerethenblastedwith
8、Nr,Swiss-Prot,KEGG,COG,andGOdatabases.Therewere11138and24744unigeneswereannotatedwithNrandSwiss-Protdatabases,respectively.Theunigeneswereinvolvedin36GO-termsand119metabolic