擴增子分析解讀6進化樹 Alpha Beta多樣性

分析前準備
# 進入工做目錄
cd example_PE250
上一節回顧:咱們的OTU得到了物種註釋,並學習OTU表的各類操做————添加信息,格式轉換,篩選信息。
 
接下來咱們學習對OTU序列的進化分析、同時計算Alpha和Beta多樣性值。
 
16. 進化樹構建
進化樹是基於多序列比對的結果,可展現豐富的信息,咱們將在R繪圖中詳細解讀。此處只是建樹,用於Alpha, Beta多樣性分析的輸入文件。
# clustalo多序列比對,若是沒有請安裝Clustal Omega
clustalo -i result/rep_seqs4.fa -o temp/rep_seqs_align.fa --seqtype=DNA --full --force --threads=30
# 篩選結果中保守序列和保守區
filter_alignment.py -i temp/rep_seqs_align.fa -o temp/  # rep_seqs_align_pfiltered.fa, only very short conserved region saved
# 基於fasttree建樹
make_phylogeny.py -i temp/rep_seqs_align_pfiltered.fasta -o result/rep_seqs.tree # generate tree by FastTree
17. Alpha多樣性
Alpha多樣性是計算樣品內物種組成,包括數量和豐度兩維信息。具體解釋可見: 擴增子圖表解讀1箱線圖:Alpha多樣性
 
Alpha多樣性計算前須要對OTU表進行標準化,由於不一樣測序深度,檢測到的物種數量會不一樣。咱們將OTU表重抽樣至相同數據量,以公平比較各樣品的物種數量。方法以下:
# 查看樣品的數據量最小值
biom summarize-table -i result/otu_table4.biom
# 基於最小值進行重抽樣標準化
single_rarefaction.py -i result/otu_table4.biom -o temp/otu_table_rare.biom -d 2797
# 計算經常使用的四種Alpha多樣性指數
alpha_diversity.py -i temp/otu_table_rare.biom -o result/alpha.txt -t result/rep_seqs.tree -m shannon,chao1,observed_otus,PD_whole_tree
18. Beta多樣性
Beta多樣性是計算各樣品間的相同或不一樣,OTU表也須要標準化。採用重抽樣方法丟失的信息太多,不利於統計。此步咱們選擇CSS標準化方法。
# CSS標準化OTU表
normalize_table.py -i result/otu_table4.biom -o temp/otu_table_css.biom -a CSS
# 轉換標準化OTU表爲文本,用於後期繪圖
biom convert -i temp/otu_table_css.biom -o result/otu_table_css.txt --table-type="OTU table" --to-tsv
# 刪除表格多餘信息,方便R讀取
sed -i '/# Const/d;s/#OTU //g;s/ID.//g' result/otu_table_css.txt
# 計算Beta多樣性
beta_diversity.py -i temp/otu_table_css.biom -o result/beta/ -t result/rep_seqs.tree -m bray_curtis,weighted_unifrac,unweighted_unifrac
# Beta多樣性距離文件整理,方便R讀取
sed -i 's/^\t//g' result/beta/*
相關文章
相關標籤/搜索