KEGG被稱爲京都基因組百科全書,是一個綜合性的數據庫。對於如此龐大的數據庫,確定須要對數據進行分門別類的整理。除了將各類數據拆分到不一樣的子數據庫中以外,KEGG還對全部的數據進行了更加細緻的功能分類,這些功能分類的信息就存儲在brite 數據庫中。html
birte 主要包含如下五大類別的分類信息:java
genes and proteinreact
compounds and reactions數據庫
drugs編程
diseasesjson
organisms and cells微信
在brite數據庫中,以文件的形式存儲分類信息。包含兩種格式的文件:網絡
table 格式,好比對藥物的分類編輯器
http://www.genome.jp/kegg/drug/br08340.html工具
htext 文件,好比kegg orthology 的分類
http://www.kegg.jp/kegg-bin/get_htext?ko00000.keg
提供了兩種格式的文件用於下載,htext
對應的後綴爲 keg, json
對應json。
json
格式是網絡數據傳說的新標準,主要用於程序解析;`keg 文件是純文本文件,能夠用文本編輯器打開。
以全部ko的分類文件 ko00000.keg
文件爲例:
分類層級按照字母順序排列,示例文件中A 爲第一級分類,B, C, D 依次爲第二級。
咱們能夠直觀的看到 K00844 屬於Glycolysis / Gluconeogenesis
這個分類,對應的更上一級的分類爲Carbohydrate metabolism
,再上一級爲 Metabolism
。
keg 文件格式仍是很是容易理解的,可是使用起來不夠直觀,當咱們想要查詢某個KO的具體分類時,若是和這個KO處於同一分類的節點太多時,須要往上翻閱不少行,才能找到對應的分類;有時一不當心就翻過了,就會搞錯。
固然能夠經過程序格式化這個文件,好比將這個文件變成以下的格式:
KO | Name | C | B | A |
---|---|---|---|---|
K00844 | HK… | Glycolysis… | Carbo..bolism | Metabolism |
這樣方便查看條目的詳細分類信息;
對於沒有編程基礎的人來講,kegg 提供了keggHier
程序,專門用於查看brite中的分類信息。軟件是用java 開發的,提供了圖形界面,簡單易用;
下載地址 :
http://www.kegg.jp/kegg/download/kegtools.html
使用方法
雙加批處理文件啓動
從菜單欄點擊
File
按鈕,選擇導入kegg網站上的數據這裏選擇第一個
kegg pathway map
的分類結構,進行查看
向下的三角形表示展開的意思,這裏有3個,說明pathway 共有3層分類,鼠標能夠點擊任意一條記錄,能夠展開詳細信息;右上角的搜索框能夠搜索,經過搜索框能夠快速查找你感興趣的記錄
總結:
brite
是存儲分類信息的數據庫,提供了包含pathway, ko, module, drug, disease,organism 等全部記錄的分類;分類信息經過文件進行距離,有
keg
和table
兩種格式;經過
KEGGHier
工具,能夠方便的瀏覽 KEGG 分類系統;
本文分享自微信公衆號 - 生信修煉手冊(shengxinxiulian)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。