The Biological Observation Matrix (BIOM) format http://biom-format.org/python
biom-format有兩種方式安裝:工具
1. python pkg:spa
pip install numpyorm
因爲最新版的biom-format還不支持python3,因此須要切換到python2對象
sudo update-alternatives --config pythonip
而後安裝開發
pip install biom-formatget
爲了處理BIOM 2.0+的文件,須要安裝這個:it
pip install h5pypip
2. R pkg:
百度,找安裝包,安裝好依賴便可。
版本:
版本1.0基於JSON格式開發。
版本2.0和2.1基於HDF格式開發。(HDF格式專門存儲大規模、多對象的科學研究數據)
開發目的:
1. 存儲和操做大規模的稀疏的生物數據列聯表(列聯表是觀測數據按兩個或更多屬性(定性變量)分類時所列出的頻數表,其實就是一般的統計表格);
2. 將核心元數據(contingency table data and sample/observation metadata)封裝到單個文件中;
3. 便於在不一樣工具見交流(如 QIIME/MG-RAST/VAMPS)。
支持 BIOM格式的軟件:
QIIME,MG-RAST,PICRUSt,Mothur,phyloseq,MEGAN,VAMPS,metagenomeSeq,
Phinch,RDP Classifier
OTU table:
兩種都支持,但>=85%的是0再用sparse更合適。
dense
sparse
***************************************************************************************************************************************
操做
Parse a table from an open file object:
from biom import parse_table
with open('path/to/table.biom') as f:
table = parse_table(f)
Parse a table from a path:
from biom import load_table
table = load_table('path/to/table.biom')