生信分析-windows-blast序列比對

這是一個嘗試性的文章,能不能解決我要解決的問題,並不清楚。ide

===本文利用NCBI的blast界面,實現將短序列比對上reference基因組,並實現變異位點可視化。===補言===網站

比對經常使用的是NCBI網站,打開NCBI。(百度 谷歌直接搜索NCBI, 如今中國也在搭建和完善國家生物信息中心,一個是位於深圳的國家基因庫,由BGI代運營,一個是北京的國家生物信息中心,由BIG開發和運營)。3d

 

 

核苷酸序列比對選默認的blast就好,其餘的比對模塊能夠自行查看,有必要的狀況下公衆號再講。blog

搜索本身想要比對的物種(reference)。開發

 

serch (點擊搜索)ast

好了,database已經爲咱們選定的物種基因組(可自行選擇版本),若是沒有基因組的話,可能須要本身上傳或者是其餘的辦法(本處未作嘗試)。可視化

 

 輸入須要查找的序列,或者文件。百度

格式爲fasta格式,以下(關於序列的格式文件說明,能夠參見鄙人公衆號):搜索

>ID1im

ATCG

>ID2

ATCG

...

 

 類似度通常用默認的,我的習慣在新的頁面打開,而後點blast。

 

 我給的是雙子葉植物的一段序列,不負衆望,沒有搜到任何信息。

==============================================================================

下面我想找一段同物種的基因:

 

 

 

 

 

 

 

 

 

 管它三七二十幾(這裏省略了約三個步驟),終究找了一段序列,貼進去看看效果:

 

而後結果:

 

 

 沒錯,就是這段,點開果真是100%的類似度。

 

 

 如今我突變3個位點,再比對一次。

 

 

 

 能夠看到類似度變低了:右側pre.ident 爲99.75%(前一分鐘是100%)。

 

 三個位點發生了差別。

 

 能夠看到被人爲突變的位置是沒法對齊的,可是沒有顏色標記不是很好看。

 繼續,打開右邊的可視化頁面:

 

 可視化信息以下:

 

 

點擊紅色的query(沒錯,這就是剛剛輸入的sequence,如今被重命名爲Query_8543),能夠看到咱們以前人爲作的三個突變位點,以下(紅線所示):

 

 

 放大mismatch的位點,能夠看到詳細的鹼基信息:

 

 

 以上,

abysw

相關文章
相關標籤/搜索