資源描述:
《如何分析測(cè)序結(jié)果.pptx》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、軟件和文件用Sequencher軟件Demo版看序列,Demo版不能保存序列,但其實(shí)絕大部分時(shí)候并不需要保存,只要簡(jiǎn)單看一下測(cè)序結(jié)果是否正確即可,用這個(gè)軟件是最方便的。測(cè)序返回兩種格式的文件,ABI和SEQ。ABI是原始文件,SEQ是根據(jù)ABI結(jié)果導(dǎo)出的,未必完全正確,建議只看ABI,有需要再拿SEQ去修改、拼接。1、選擇同一個(gè)載體的所有測(cè)序ABI文件,拖拽到Sequencher窗口釋放即可導(dǎo)入序列文件2、在Sequencher窗口中雙擊序列文件打開(kāi),可見(jiàn)序列質(zhì)量:藍(lán)色越深表示序列越不可信。2、點(diǎn)擊ShowChromatogram
2、可查看峰圖:不可信不可信可信3、因此,先把序列前后深藍(lán)色的部分都刪掉這一條序列可信的長(zhǎng)度只有880bp,而相應(yīng)的SEQ文件并沒(méi)有刪除前后不可信的序列,仍然給出了1225bp的長(zhǎng)度,因此不能用SEQ去判斷測(cè)序結(jié)果。同時(shí),在可信的序列中仍然存在個(gè)別深藍(lán)色的堿基,這些堿基是否可信,也要根據(jù)峰圖自行判斷。4、所有序列都只留下可信區(qū)段之后,全選,點(diǎn)擊第二個(gè)按鈕AssembleAutomatically則可將序列比對(duì)到一起,形成一個(gè)Contig文件。4、Contig文件打開(kāi)就是下圖的overview形式,如果序列之間能連通,說(shuō)明目標(biāo)序列完整測(cè)
3、通了,如果有缺口則需要加測(cè)。要把Contig文件拆散重組,則點(diǎn)擊菜單欄的Contig→DissolveContig…即可4、第一個(gè)按鈕AssemblyParameters是調(diào)整比對(duì)的參數(shù),右圖表示至少有85%相似性和20bp的overlap才能比對(duì)到一起,如果要比對(duì)引物且引物少于20bp,則要調(diào)低minimumoverlap的值;如果序列有某一段差異較大比對(duì)不上,也可調(diào)低minimummatchpercentage的值,但調(diào)得太低可能會(huì)比對(duì)到錯(cuò)誤的位置。5、點(diǎn)擊Bases按鈕,可查看具體的序列信息5、一個(gè)載體挑至少兩個(gè)克隆去測(cè)序,
4、兩個(gè)之間相互比,有不一樣的就會(huì)在底下出現(xiàn)一個(gè)點(diǎn)(按Ctrl+D可以快速定位到有點(diǎn)的地方),這些點(diǎn)就是需要我們自己判斷正誤的地方。以上兩個(gè)點(diǎn)的出現(xiàn)是由于測(cè)序質(zhì)量下降導(dǎo)致,因?yàn)樗臈l序列,1和2號(hào)克隆各測(cè)到兩次,其中三條序列一樣,說(shuō)明兩個(gè)克隆是相同的。左圖四個(gè)克隆中,第四個(gè)與另外三個(gè)不同,說(shuō)明第四個(gè)在PCR擴(kuò)增中有堿基錯(cuò)配。也有發(fā)生堿基缺失的、堿基插入的。以上出現(xiàn)差異的點(diǎn)都是位于淺藍(lán)色的可信區(qū)段,通常不會(huì)有讀峰錯(cuò)誤的問(wèn)題,可以不用理會(huì)峰圖。如果點(diǎn)出現(xiàn)在深藍(lán)色的區(qū)段,則要打開(kāi)峰圖自己解讀。如右圖,第三個(gè)克隆多了一個(gè)G,且此處是深藍(lán)色,表明
5、儀器對(duì)此處的解讀存在疑問(wèn)。打開(kāi)峰圖比較三個(gè)克隆的差異,發(fā)現(xiàn)第三個(gè)克隆在GG處的兩個(gè)峰拖得比較開(kāi),導(dǎo)致儀器誤判為GGG,但又不及三個(gè)峰的寬度,原序列應(yīng)該是正確的GG。6、若需導(dǎo)入模板和引物進(jìn)行比對(duì),可將模板和引物序列按以下格式保存在txt文檔中,直接將txt拖拽到Sequencher窗口釋放即可:>16666-NIP-gDNAATCGATCG……>16666-Pro-FATCGATCG……>16666-Pro-RATCGATCG……注意區(qū)別錯(cuò)配與SNP位點(diǎn)的差異!一個(gè)載體挑至少兩個(gè)克隆,如果它們之間有不一樣的位點(diǎn),則說(shuō)明是PCR過(guò)程
6、中引入的錯(cuò)配,發(fā)生錯(cuò)配的克隆就不要用了。我們從HHZ中擴(kuò)出來(lái)的序列跟NIP比,會(huì)有很多SNP、InDels,表現(xiàn)為幾個(gè)克隆之間一模一樣,但都與NIP模板序列不一樣。