KEGG Brite 數據庫

KEGG被稱爲京都基因組百科全書，是一個綜合性的數據庫。對於如此龐大的數據庫，確定須要對數據進行分門別類的整理。除了將各類數據拆分到不一樣的子數據庫中以外，KEGG還對全部的數據進行了更加細緻的功能分類，這些功能分類的信息就存儲在brite 數據庫中。html

birte 主要包含如下五大類別的分類信息：java

在brite數據庫中，以文件的形式存儲分類信息。包含兩種格式的文件:網絡

htext 文件，好比kegg orthology 的分類

http://www.kegg.jp/kegg-bin/get_htext?ko00000.keg

提供了兩種格式的文件用於下載，htext 對應的後綴爲 keg， json 對應json。

json 格式是網絡數據傳說的新標準，主要用於程序解析；`keg 文件是純文本文件，能夠用文本編輯器打開。

以全部ko的分類文件 ko00000.keg 文件爲例：

分類層級按照字母順序排列，示例文件中A 爲第一級分類，B, C, D 依次爲第二級。

咱們能夠直觀的看到 K00844 屬於Glycolysis / Gluconeogenesis 這個分類，對應的更上一級的分類爲Carbohydrate metabolism，再上一級爲 Metabolism。

keg 文件格式仍是很是容易理解的，可是使用起來不夠直觀，當咱們想要查詢某個KO的具體分類時，若是和這個KO處於同一分類的節點太多時，須要往上翻閱不少行，才能找到對應的分類；有時一不當心就翻過了，就會搞錯。

固然能夠經過程序格式化這個文件，好比將這個文件變成以下的格式：

KO	Name	C	B	A
K00844	HK…	Glycolysis…	Carbo..bolism	Metabolism

這樣方便查看條目的詳細分類信息；

對於沒有編程基礎的人來講，kegg 提供了keggHier 程序，專門用於查看brite中的分類信息。軟件是用java 開發的，提供了圖形界面，簡單易用；

下載地址 :

http://www.kegg.jp/kegg/download/kegtools.html

使用方法

雙加批處理文件啓動
從菜單欄點擊File按鈕，選擇導入kegg網站上的數據
這裏選擇第一個kegg pathway map 的分類結構，進行查看

向下的三角形表示展開的意思，這裏有3個，說明pathway 共有3層分類，鼠標能夠點擊任意一條記錄，能夠展開詳細信息；
右上角的搜索框能夠搜索，經過搜索框能夠快速查找你感興趣的記錄

總結：

本文分享自微信公衆號 - 生信修煉手冊（shengxinxiulian）。
若有侵權，請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」，歡迎正在閱讀的你也加入，一塊兒分享。