KEGG Brite 數據庫

KEGG被稱爲京都基因組百科全書,是一個綜合性的數據庫。對於如此龐大的數據庫,確定須要對數據進行分門別類的整理。除了將各類數據拆分到不一樣的子數據庫中以外,KEGG還對全部的數據進行了更加細緻的功能分類,這些功能分類的信息就存儲在brite 數據庫中。html

birte 主要包含如下五大類別的分類信息:java

  1. genes and proteinreact

  2. compounds and  reactions數據庫

  3. drugs編程

  4. diseasesjson

  5. organisms and cells微信

在brite數據庫中,以文件的形式存儲分類信息。包含兩種格式的文件:網絡

  • table 格式,好比對藥物的分類編輯器

    http://www.genome.jp/kegg/drug/br08340.html工具

  • htext 文件,好比kegg  orthology 的分類

    http://www.kegg.jp/kegg-bin/get_htext?ko00000.keg

提供了兩種格式的文件用於下載,htext 對應的後綴爲 keg, json 對應json。

json 格式是網絡數據傳說的新標準,主要用於程序解析;`keg 文件是純文本文件,能夠用文本編輯器打開。

以全部ko的分類文件 ko00000.keg 文件爲例:

分類層級按照字母順序排列,示例文件中A 爲第一級分類,B, C, D 依次爲第二級。

咱們能夠直觀的看到 K00844 屬於Glycolysis / Gluconeogenesis 這個分類,對應的更上一級的分類爲Carbohydrate metabolism,再上一級爲 Metabolism

keg 文件格式仍是很是容易理解的,可是使用起來不夠直觀,當咱們想要查詢某個KO的具體分類時,若是和這個KO處於同一分類的節點太多時,須要往上翻閱不少行,才能找到對應的分類;有時一不當心就翻過了,就會搞錯。

固然能夠經過程序格式化這個文件,好比將這個文件變成以下的格式:

KO Name C B A
K00844 HK… Glycolysis… Carbo..bolism Metabolism

這樣方便查看條目的詳細分類信息;

對於沒有編程基礎的人來講,kegg 提供了keggHier 程序,專門用於查看brite中的分類信息。軟件是用java 開發的,提供了圖形界面,簡單易用;

下載地址 :

http://www.kegg.jp/kegg/download/kegtools.html

使用方法

  • 雙加批處理文件啓動

  • 從菜單欄點擊File按鈕,選擇導入kegg網站上的數據

  • 這裏選擇第一個kegg  pathway map 的分類結構,進行查看

    向下的三角形表示展開的意思,這裏有3個,說明pathway 共有3層分類,鼠標能夠點擊任意一條記錄,能夠展開詳細信息;

  • 右上角的搜索框能夠搜索,經過搜索框能夠快速查找你感興趣的記錄

總結:

  1. brite 是存儲分類信息的數據庫,提供了包含pathway, ko,  module, drug, disease,organism 等全部記錄的分類;

  2. 分類信息經過文件進行距離,有kegtable兩種格式;

  3. 經過KEGGHier工具,能夠方便的瀏覽 KEGG 分類系統;

本文分享自微信公衆號 - 生信修煉手冊(shengxinxiulian)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索