KEGG step by step

核心概念

  • KEGGKyoto Encyclopedia of Genes and Genomes,生物高水平功能是數據庫。若是不是使用服務器來查詢數據庫,須要付費。
  • KO:KEGG ortholog,已知功能(function)的同源基因數據庫。全部數據庫裏的功能都有這個編號,可是每一個功能又還有別的編號,由於每一個對象都同時扮演多個角色,存在於多個子數據中。
    • Pathway:多個功能,組成一個通路。其中通路彙總圖一共有7,叫 Atlas。下圖是大名鼎鼎的 metabolic pathways
    • Module:多個通路組成一個模塊。
    • Brite:一個功能可能在不一樣的模塊或者通路中起做用,Brite 數據庫存貯這種交叉關係。
  • Chemical information:化學物質信息,功能都依附於物質,因此不一樣的物質有本身的編號,以括號裏的字母區分分類。分爲如下4類。
    • Compound(C):圓圈
    • Glycan(G):多糖,這是
    • Reaction(R):線
    • Enzyme(E):方框,一個序列可能對應一個酶,可是序列並非酶自己。
      硝酸鹽轉運基因
  • 其餘分類
    • Organism:數據庫裏不一樣物種的註釋結果。每一個物種用三個字母表示,例如 hashomo sapiens。在 Genome數據庫裏能按照物種來
    • Subject:根據研究範圍不一樣進行分類。包括癌症、植物、病原菌、病毒等。
  • Tools:回答序列與基因的對應關係,並把一系列基因放到通路或者模塊中。
    • BlastKOALA:比對基因組的蛋白質序列(aa)中是否含有數據庫中的序列。
    • GhostKOALA:比對轉錄組的蛋白質序列(aa)中是否含有數據庫中的序列。
    • Mapper:在 pathway,模塊,brite裏搜索,也能夠在特定物種中搜索。
      • Reconstructe:完成在線註釋以後會獲得結果。裏面有重構選項。
      • Search:搜索幾個基因,就能完成重構。
      • Color:能按照本身的需求來進行配色。例如強調某個基因。

這些都是在線完成的,因此網速是硬傷。css

基本流程

1               2             3
Contigs ->  Amino acids -> KO numbers -> Maps
  1. 從測的核酸序列到預測的氨基酸序列;
  2. 在數據庫中找是否有類似的氨基酸序列;
  3. 把同一批的序列放到代謝通路,模塊或者功能關係中。

氨基酸序列

實際上KEGG要的是氨基酸序列,可是咱們不老是能直接拿到氨基酸序列,好比早起的NCBI序列就可能沒有註釋,或者做者當時沒選註釋。若是是這種狀況,就須要本身註釋,使用Prokka,10min就能完成,可是你仍是不會,那不如上傳到NCBI,請他們來註釋,大概等個7天,也就行了。html

註釋

  1. 上傳的時候選擇參考物種,或者只選大類,真核原核。
  2. 收到郵件,點擊submit。若是不想註釋了就點 cancel,否則這個郵箱就不能用。
  3. 收到註釋完成的郵件,完成。

保存結果

  • 進入連接(只有7天有效),在連接裏能下載結果。數據庫

    P0001 K0111111 proteinapi

  • 這裏能看到構建的通路,模塊或者關係,可是光下載這一頁是不能保存其中的圖的。
  • 能夠下載特別感興趣的部分,若是須要再次重構,就把下載的文本文件上傳到Reconstruct Pathway服務器

結果說明

  • Pathway:會有一副完整的代謝通路圖,和其餘的細節圖。
  • Module:這裏會顯示出一個模塊是否完整,是否是全部須要的基因都存在。
  • Brite:能看到基因都被放到哪些關係中了。這裏不會出圖。
    結果

應用

對細菌功能的瞭解程度決定了你能提出什麼問題,去哪裏找答案。
若是你知道20E測試中對應的是哪一個代謝途徑,哪一個關鍵酶,就能看看基因組中是否是有對應的基因。
若是你不知道,那麼能夠搜對應的底物,也能知道這個過程與什麼基因相關。app

輔助鑑定

  • 細菌是否有運動性:進入 Pathway cell motility
  • 硝酸根還原,ABC-transporter:能不能厭氧生長。
  • 脂肪酸的合成模塊
  • 碳源利用裏相關通路是否是斷了,能決定惟一碳源的結果

高級應用

挖掘出細菌的特殊功能,能大幅提升文章的重要性。koa

  • 從芳香族化合物降解
  • 能利用氨基酸做爲惟一碳源
  • 有光合自養能力
  • 參與硫代謝
  • 抗生素合成
  • 從信號通路猜想對元素的抗性
  • 代謝通路重構的時候運行同時上傳幾種物種註釋信息,這樣個物種會有本身的顏色。

比較兩個細菌的芳香族化合物的代謝通路

# organims 1
gene1   K02874
gene4   K00416
# organism 2
gene7   K12864

https://files.cnblogs.com/files/Xeonilian/merge.txt.css
https://www.kegg.jp/kegg-bin/blastkoala_result?id=82ac4904c56bf41cddc9cf94353fa2b731177a18&passwd=L9IqAn&type=blastkoala測試

相關文章
相關標籤/搜索