Iqtree2:新模型高效構建系統發育樹

系統發育推斷(phylogenetic inference)的算法五花八門,從最簡單的UPGMA法,到鄰接法(neighbor joining)、最大簡約法(maximum parsimony),再到複雜的的最大似然法(maximum likelihood)與貝葉斯推斷法(Bayesian inference),每種方法都有很多可選擇的實現工具。這些方法無一例外都遵循一個規律:越精確則速度越慢。而隨着分析的數據愈來愈龐大,對於用戶來講,須要尋找一個儘量快速並且錯誤率能夠容忍的算法是十分必要的。css

貝葉斯法能夠準確地推斷時間樹,但速度最慢;而鄰接法與最大簡約法在處理有較大分歧的序列時容易出現長枝吸引(long branchattractionLBA)現象,所以目前來講最大似然法仍是最經常使用的方法。目前實現最大似然法建樹的工具備MEGAPhyMLRaxML等,然而這些軟件參數設置十分複雜,尤爲是核苷酸與氨基酸替代矩陣的選擇每每對結果的準確性有着很大的影響,而普通用戶每每難以選擇。並且,這些工具的分析速度也較慢。
近幾年悄然興起一個新的系統發育推斷工具Iqtree http://www.iqtree.org/ ),其簡化了參數設置,能夠幫助用戶選擇最佳的進化模型,並且在速度上有很大提高。

最新版的是Iqtree2,其安裝方法以下所示:web

tar -zxvf iqtree-2.0.6-Linux.tar.gzcd iqtree-2.0.6-Linux

解壓後iqtree執行文件就在bin/目錄下,其使用方法以下所示:
iqtree [-s ALIGNMENT] [-p PARTITION] [-m MODEL] [-t TREE] ...-s:序列比對文件(支持多個文件逗號隔開,或者包含比對文件的文件夾),可選PHYLIP、FASTA、NEXUS、CLUSTAL、MSF--seqtype:序列類型,可選BIN、DNA、AA、NT2AA、CODON、MORPH默認爲自動檢測-o:外類羣列表,不一樣物種之間逗號隔開--prefix:結果文件名前綴--seed:隨機數種子,主要出於調試目的--mem:最大可以使用內存,單位爲G、M或百分數%--redo:忽略檢查重寫輸出文件,默認爲off,也即從上次意外中斷處開始-T:程序運行使用的核數,可設置具體數字或者AUTO(推薦),默認爲1--threads-max:最大可以使用的核數,默認爲全部核--fast:快速模式,相似FastTree-b:非參數bootstrap次數,大於等於100-B:超快速bootstrap次數,大於等於1000--bnni:使用NNI優化超快速bootstrap的樹,搭配-B使用--alrt:SH近似似然比檢驗重複次數-m:模型選擇,設置MF自動選擇最佳模型但不建樹;設置MFP自動檢測最佳模型並建樹。此外還能夠設置具體的模型,或者多個可選模型,例如-m LG,WAG--ancestral:基於經驗貝葉斯的祖先狀態重建
接下來看這個工具如何使用。首先從最簡單的建樹開始:
iqtree -s example.phy -T AUTO

假如設置自動選擇最佳模型並建樹:算法

iqtree -s example.phy -m MFP -T AUTO

選擇最佳模型並只輸出模型選擇結果:bootstrap

iqtree -s example.phy -m MF -T AUTO

Iqtree會測試多達546個蛋白模型並給出最佳模型,結果以下所示:微信

使用bootstrap自助法計算節點支持率(相似於RaxML):編輯器

iqtree -s example.phy -m MFP -b 100 -T AUTO

使用SH近似似然比檢驗計算節點支持率:工具

iqtree -s example.phy -m MFP --alrt 100 -T AUTO

同時使用兩種方法計算節點支持率:測試

iqtree -s example.phy -m MFP --alrt 100 -b 100 -T AUTO

使用超快速bootstrap自助法計算節點支持率:優化

iqtree -s example.phy -m MFP -B 1000 --bnni -T AUTO
使用上述設置構建500個基因組的120個串聯蛋白樹須要兩天左右。超快自助法ultrafast bootstrap1000次比普通自助法100次要快10倍左右,是該軟件的特有算法,因此通常使用Iqtree的超快自助法建樹。
END

本文分享自微信公衆號 - 微生態與微進化(MicroEcoEvo)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。spa

相關文章
相關標籤/搜索