序列類似性比較與同源性分析

首先應該注意區分序列類似性與序列同源性的關係,序列類似不必定同源,可是斷定同源性關係的時候有些算法(Maximum likelihood除外)要考慮到序列類似性。序列類似性是將待研究序列與DNA或蛋白質序列庫進行比較,用於肯定該序列的生物屬性,也就是找出與此序列類似的已知序列是什麼,完成這一工做只須要用到兩兩序列比較算法,經常使用的程序包有BLAST,FASTA等。同源性分析是將待研究序列加入到一組與之同源,可是來自不一樣物種的序列中進行多序列比對,以肯定該序列與其它序列間的同源性大小。多序列比較算法經常使用的程序包有CLUSTAL等。html

一、  序列比對,從數據庫中尋找類似序列: 首先打開NCBI的BLAST網站:https://blast.ncbi.nlm.nih.gov/Blast.cgi ,選擇protein blast,而後將待比對序列粘貼進去,進行BLAST(一些參數的設置收藏夾或百度)。等待必定時間後將會出現與所選數據庫的比對結果,按照打分高低將top100(能夠設置成其餘數值)的序列顯示出來,而後能夠將該100條序列下載下來。存成test.fasta文件。這個文件就是在mega中進行多序列比對建樹所用的文件。算法

二、  多序列比對:打開mega,ALIGN-BUILDALIGNMENT-Create a new alignment-protein-open-retrieve sequences from file-no -test.fasta(或者直接拖動進去,或者雙擊打開test.fasta),而後點擊Alignment——Align by ClustalW——OK——OK。而後比對成功,選擇Data——Export Alignment——MEGA format保存文件爲test.meg,能夠關閉Align會話框。數據庫

三、  構建進化樹:打開test.meg。點擊PHYLOGENY——選擇最上面的ML方法,參數能夠選擇默認參數。就出現了進化樹。固然一些參數最好仍是用到,好比說可信度驗證的次數設置最好要大於等於500次。網站

四、  進化樹的美化與理解orm

http://www.360doc.com/content/14/0617/22/17553313_387599563.shtmlhtm

https://www.sohu.com/a/196872269_675868get

相關文章
相關標籤/搜索