一般咱們用的都是經過blast比對來肯定咱們須要的家族成員,首先是比對序列,再次是須要目標物種的蛋白序列,來進行比對,一般比對的時候咱們都須要設定e-value值。今天咱們來學習一下利用HMMER來鑑定基因家族成員。html
1 、利用軟件HMMER進行模型搜索,
軟件官網:http://hmmer.org/download.html ,主要用到hmmsearch,已經來自pfam數據庫的隱馬爾可夫模型。記住模型下載是在pfam數據庫中,選擇你本身須要的模型便可,如若沒有你須要的模型怎麼辦呢,這時咱們能夠本身創建模型,請看圖3後一行碼。(所用到的數據都上傳到網盤了,查看:http://132.232.42.33/?p=59)數據庫
二、在pfam數據沒有模型的時候,咱們能夠利用clustalX2要比對的序列進行比對,而後會陳勝*.aln文件(注:該軟件的目標文件必須在桌面才能夠添加)。windows
下載桌面版本:hmmer3.0_windows,將下載下來的版本解壓到桌面 文件準備,擬南芥蛋白組數據,來自pfam數據庫的模型,模型是怎樣肯定的,請參考:http://132.232.42.33/?p=105微信
將蛋白文件,模型文件放到解壓的hmmer文件中學習
圖 1ui
修改模型文件f—>b:code
圖 2orm
win+R-->cmd>cd desktop-->cd hmmer3.0_windows
若是你有Git的話,能夠直接在該文件夾右鍵打開,也是同樣的:htm
圖 3blog
創建模型:
hmmbuild new.hmm *.aln
模型搜索並保存爲wrky.txt文件:
圖 4
打開wrky.txt文件結果以下:
圖 5
如上圖就見wrky基因鑑定出來了,若是還要進行下一步分析鑑定。包括多個轉錄本的狀況,任然須要進行手動鑑定。以防出現假。之後得分享我基本上都會把入手的數據所有上傳。
歡迎關注微信公衆號:螞蟻生信
如如有問題,或侵犯您的版權請及時聯繫我,謝謝:smyang2018@gmail. com
原文出處:https://www.cnblogs.com/smyang/p/12063907.html