轉自http://www.dxy.cn/bbs/topic/35655953算法
一、OTU是什麼?數據庫
OTU(operational taxonomic units),即操做分類單元。經過必定的距離度量方法計算兩兩不一樣序列之間的距離度量或類似性,繼而設置特定的分類閾值,得到同一閾值下的距離矩陣,進行聚類操做,造成不一樣的分類單元。專業解釋太書面很差理解?沒事兒,給你舉個「栗子」就明白了!url
二、OTU在16S測序中有何用?spa
高通量測序獲得的16S序列有成千上萬條,若是對每條序列都進行物種註釋的話,工做量大、耗時長,並且16S擴增、測序等過程當中出現的錯誤會下降結果的準確性。在16S分析中引入OTU,首先對類似性序列進行聚類,分紅數量較少的分類單元,基於分類單元進行物種註釋。這不只簡化工做量,提升分析效率,並且OTU在聚類過程當中會去除一些測序錯誤的序列,提升分析的準確性。.net
三、OTU如何聚類?3d
OTU聚類的方法多種多樣,如Uclust、cd-hit、BLAST、mothur、usearch和 prefix/suffix,這些聚類方法都可以在QIIME軟件中實施。不一樣聚類方法基於不一樣的算法,獲得的聚類結果雖然不一樣,可是大致的聚類流程都是一致的:cdn
![](http://static.javashuo.com/static/loading.gif)
舒適提示:嵌合體序列是RCR擴增時,兩條不一樣的序列產生雜交、擴增的序列。blog
四、OTU跟物種的關係get
-
OTU聚類後,挑選出每一個OTU中的表明序列,與RDP、Sliva或GreenGene等數據庫進行比對,進行物種註釋。it
-
OTU和物種是映射關係,它們一一對應或多對一,以下圖所示。
![](http://static.javashuo.com/static/loading.gif)
-
在上圖中,A、B、C分別表示OTU 一、OTU m和OTU n中有A、B、C條reads,假設OTU 1和OTU m比對到物種1,那麼物種1的丰度是A+B;同理假設OTU n比對到物種2,物種2的丰度是C。