具備相同功能的基因被歸類到kegg orthology 中,每一個KO 表明具體的一個功能。在生命活動中,每每須要多個功能單位共同發揮做用,好比多個蛋白質構成複合體來發揮調控做用,此時多個KO就整合在了一塊兒。這個例子說明在KO 之上,必然還存在一個分類系統,將參與同一過程的多個KO劃分在一塊兒。實際上,KEGG Module 數據庫就是存儲這種信息的數據庫。數據庫
KEGG Module 數據庫中的每條記錄表明一個功能單元,是多個KO的集合,叫作kegg module, 經過大寫字母M和數字進行標識;微信
module 數據庫包含如下4大類別的功能:spa
pathway modules.net
structural complexescode
functional setsblog
signature modules圖片
更加詳細的分類信息能夠在brite 數據庫中找到,見如下連接get
http://www.kegg.jp/kegg-bin/get_htext?ko00002.kegit
和pathway 相似,對於每條module 的記錄,都有一張對應的圖片,叫作module map
。io
M0002對應的map 以下圖
結合其詳細信息,咱們來理解下module 的構成
從Definition 字段的信息,咱們能夠看到每一個Module 有多個KO 構成,那麼這些KO 之間有什麼樣的關係呢,這就要從definition 字段的定義提及!
被空白分隔的每一個字段叫作1個block, M0002 能夠分紅如下5個主要的block
K01803
((K00134,K00150) K00927,K11389)
(K01834,K15633,K15634,K15635)
K01689
(K00873,K12406)
在這裏,空格表明的是邏輯與 AND
的關係,表示這5個block 一塊兒發揮做用;
在(K01834,K15633,K15634,K15635)
block 中,逗號表明邏輯或OR
的關係,任何一個KO均可以起到這個blcok的做用。
注意在 ((K00134,K00150) K00927,K11389)
中同時出現了逗號和空格,爲了正確區分,還使用了圓括號。圓括號內爲1個block, 因此K00134,K00150
爲1個block, 這個block 和 K00927 用空白分隔,因此是AND關係,而逗號鏈接的是(K00134,K00150) K00927
和 K11389
兩個block。 因此這個block對應的map 就是上圖展現的那樣。理解了definition 字段的信息,不難發現根據該字段的信息,能夠計算出這個module 對應的map。
除了空格和逗號以外,definition 還會出現 +, - 。好比((K01878+K01879),K14164,K01880)
, 加號表明兩個KO一塊兒做爲一個block發揮做用,對應的map 圖爲
減號表明可選項的意思,表示這個block無關緊要。好比K01866 K01873 -K07587 -K11627 -K01884
。減號鏈接的block 雖然無關緊要,可是在map圖中仍是會出現的。
因爲module 由KO 發展而來,因此module 也是跨物種的概念。對於每一個物種而言,也有該物種對應的module, 好比M0000 在human中對應的記錄爲hsa_M00002;
在物種的module 中,根據包含的block的個數,能夠劃分紅兩類
complete module, 包含reference module 中全部的block;
incomplete module , 只缺乏了1個或者2個block;
在物種對應的module map 中,會對該物種對應的KO高亮顯示
總結
KEGG Module 數據庫是對KO的整合,每一個module 表明1個功能單元,是多個KO的集合;
Module 由block 構成,definition 字段的信息須要理解空格,逗號,加號,減號的不一樣含義,根據definition 字段的信息能夠計算獲得module map;
3.module 是跨物種的概念,最原始的叫作reference module, 定義了block的數量; 物種對應的module 根據包含的block的完整性,能夠分爲complete module 和 incomplete module; 在物種對應的module map 中,對應的KO會高亮顯示
本文分享自微信公衆號 - 生信修煉手冊(shengxinxiulian)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。