生物信息學練習2- Biom-format

The Biological Observation Matrix (BIOM) format http://biom-format.org/python

biom-format有兩種方式安裝:工具

1. python pkg:spa

pip install numpyorm

因爲最新版的biom-format還不支持python3,因此須要切換到python2對象

sudo update-alternatives --config pythonip

而後安裝開發

pip install biom-formatget

爲了處理BIOM 2.0+的文件,須要安裝這個:it

pip install h5pypip

2. R pkg:

百度,找安裝包,安裝好依賴便可。

版本:

版本1.0基於JSON格式開發。

版本2.02.1基於HDF格式開發。(HDF格式專門存儲大規模、多對象的科學研究數據)

開發目的:

1. 存儲和操做大規模的稀疏的生物數據列聯表(列聯表是觀測數據按兩個或更多屬性(定性變量)分類時所列出的頻數表,其實就是一般的統計表格);

2. 將核心元數據(contingency table data and sample/observation metadata)封裝到單個文件中;

3. 便於在不一樣工具見交流(如 QIIME/MG-RAST/VAMPS)。

支持 BIOM格式的軟件:

QIIMEMG-RASTPICRUStMothurphyloseqMEGANVAMPSmetagenomeSeq

PhinchRDP Classifier

OTU table:

兩種都支持,但>=85%的是0再用sparse更合適。

dense


sparse

 

 

 

 

***************************************************************************************************************************************
操做


Parse a table from an open file object:

from biom import parse_table

with open('path/to/table.biom') as f:

table = parse_table(f)

Parse a table from a path:

from biom import load_table

table = load_table('path/to/table.biom')

相關文章
相關標籤/搜索