資源描述:
《擬南芥全長(zhǎng)cDNA探究進(jìn)展》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、擬南芥全長(zhǎng)cDNA探究進(jìn)展【摘要】全長(zhǎng)cDNAs是基因組序列注釋和基因及其產(chǎn)物功能分析的基礎(chǔ)。目前共分離了155,144個(gè)RIKEN擬南芥全長(zhǎng)(RAF)cDNA克隆。將得到的155,144個(gè)RAFLcDNAs進(jìn)行了3'端表達(dá)序列標(biāo)簽聚類成14,668個(gè)非冗余cDNA類,其中60%預(yù)測(cè)到基因。同時(shí)已從14,034個(gè)非冗余cDNA類中獲得了5'ESTs,并構(gòu)建成啟動(dòng)子文庫(kù)。RAFLcDNAs序列數(shù)據(jù)庫(kù)的建立有助于啟動(dòng)子分析、預(yù)測(cè)出轉(zhuǎn)錄本單元的正確注釋和基因產(chǎn)物的注釋。而且,全長(zhǎng)cDNAs還為表達(dá)譜分析、功能分析和植物蛋白結(jié)構(gòu)分析提供了寶貴的資
2、源。【關(guān)鍵詞】擬南芥;cDNA擬南芥因其具有個(gè)體小,世代周期短和轉(zhuǎn)化率高等特點(diǎn),因此在植物研究中被廣泛的作為一種模式生物。為了將擬南芥的小基因組測(cè)序,日本、歐洲和美國(guó)的科學(xué)家共同合作完成了擬南芥基因組測(cè)序工程。擬南芥5條染色體中的2條(2號(hào)和4號(hào)染色體,不包括核仁組織區(qū)和著絲點(diǎn)區(qū))在1991年進(jìn)行了測(cè)序,其余3條染色體在2000年進(jìn)行了測(cè)序。2001年5月,大約127,000個(gè)擬南芥表達(dá)序列標(biāo)簽(ESTs)被提交到EST數(shù)據(jù)庫(kù)(dbEST)。其中的序列來自法國(guó),美國(guó)和日本共同合作的大范圍EST工程。這些工程已從不同的組織、器官、種子和發(fā)育
3、階段的擬南芥中獲得EST數(shù)據(jù)。然而,這些基于cDNA文庫(kù)的EST工程中的大部分的插入片段都不是全長(zhǎng)的。ESTs有助于為表達(dá)基因提供標(biāo)簽,大圣無法進(jìn)行基因功能的進(jìn)一步研究。因此,全基因組范圍的獲得表達(dá)基因的全長(zhǎng)cDNA,對(duì)于在功能基因組學(xué)領(lǐng)域中分析基因及其產(chǎn)物的表達(dá)標(biāo)簽和功能是十分重要的。1.擬南芥全長(zhǎng)cDNA文庫(kù)的構(gòu)建目前已應(yīng)用biotinylatedCAPtrapper法建立了擬南芥的全長(zhǎng)cDNA文庫(kù)。最近,研究人員有將trehalose-ther-moactivated反轉(zhuǎn)錄酶應(yīng)用到CAPtrapper法中,構(gòu)建了不同處理的擬南芥全長(zhǎng)
4、cDNA文庫(kù)。在文庫(kù)構(gòu)建中使用了入ZAP和XFLC載體。XFLC載體適合較大長(zhǎng)度范圍的cDNAs,并且有利于較長(zhǎng)cDNA片段的高效率克隆。入FLC載體也可通過Cre-lox-based系統(tǒng)被大量檢測(cè),而不受質(zhì)粒文庫(kù)的片段大小的限制。在RIKEN擬南芥全長(zhǎng)文庫(kù)(RAFL)12、13、14、15、16、17、18、19和21的構(gòu)建中,應(yīng)用單鏈連接方法用DNA連接酶將雙鏈(ds)cDNA接頭連接到單鏈全長(zhǎng)(ss)cDNA上。通過將5'端單向測(cè)序數(shù)據(jù)定位到基因組序列,研究人員將155,144個(gè)RAFLcDNA克隆聚合成14,668個(gè)cDNA類。去
5、除掉GC尾巴以便隨后的測(cè)序和將全長(zhǎng)cDNA翻譯成蛋白。在構(gòu)建全長(zhǎng)cDNA文庫(kù)(RAFL11、12、13、14、17、18、19和21)中,進(jìn)行了均一化和消減處理,以減少高表達(dá)的mRNAs的富集和去除在單向測(cè)序中已分類的cDNAso這種方法建立在全長(zhǎng)cDNA的第一條鏈與若干RNA驅(qū)趕子雜交的基礎(chǔ)上,包括將起始mRNA作為標(biāo)準(zhǔn)化的驅(qū)趕子,將來自重排的克隆中完全轉(zhuǎn)錄的轉(zhuǎn)錄本作為消減子。這種方法會(huì)顯著促進(jìn)新的cDNAs的發(fā)現(xiàn)。cDNA文庫(kù)制備的整個(gè)策略,包括標(biāo)準(zhǔn)化、均一化和消減文庫(kù),在之前已發(fā)布。研究人員以處于不同發(fā)育階段的擬南芥各組織為材料,經(jīng)
6、不同脅迫條件、激素和圖同光照條件處理,共構(gòu)建了19個(gè)全長(zhǎng)cDNA文庫(kù)。2.全長(zhǎng)cDNA序列的結(jié)構(gòu)和功能分析研究人員將cDNA克隆進(jìn)行了3'端單向測(cè)序、將155,144個(gè)ESTs進(jìn)行聚類,并且定位到擬南芥基因組上。最終,鑒定出14,668個(gè)非冗余RAFLcDNA克隆,并定位到擬南芥基因組上。這14,668個(gè)非冗余RAFLcDNA克隆具體信息在網(wǎng)上可見。如果擬南芥總共有25,00個(gè)基因,那么這些RAFL克隆應(yīng)該可以占擬南芥全部基因的60%。通過單向測(cè)序349個(gè)RAFLcDNA克隆進(jìn)行質(zhì)量評(píng)價(jià),表明其中98%的克隆包括起始密碼子和終止密碼子。因
7、此,研究人員用biotinylatedCAPtrapper法構(gòu)建的cDNA文庫(kù)包括很高比例的全長(zhǎng)基因。通過與擬南芥基因組序列的比較,從5'端測(cè)序的mRNA中可以獲得啟動(dòng)子序列。從14,034個(gè)RAFLcDNA克隆中獲得了5'ESTs,并利用PLACE數(shù)據(jù)庫(kù)建立了一個(gè)啟動(dòng)子數(shù)據(jù)庫(kù)。擬南芥啟動(dòng)子數(shù)據(jù)庫(kù)表明,每個(gè)RAFLcDNA克隆5'末端上游lOOObp的基因組序列是植物中的300順式作用元件。從19個(gè)全長(zhǎng)文庫(kù)中分離出的155,144個(gè)cDNA克隆進(jìn)行了3,端單向測(cè)序。用這些單向測(cè)序數(shù)據(jù)進(jìn)行了兩步聚類,在附錄方法中有詳細(xì)描述。在兩次聚類之后,
8、選擇質(zhì)量最好的序列作為該類的代表。然后將每個(gè)代表性克隆的3'EST定位到擬南芥基因組上,在附錄中有描述。共獲得14,878條非冗余的代表性3'EST被定位到擬南芥基因組上。然后,對(duì)這14,87