生物數據庫介紹——NCBI

 

NCBI(National Center for Biotechnology Information,美國國家生物技術信息中心)除了維護GenBank核酸序列數據庫外,還提供數據分析和檢索資源。NCBI資源包括Entrez、Entrez編程組件、MyNCBI、PubMed、PudMed Central、PubReader、Gene、the NCBI Taxonomy Browser、BLAST、Pimer-Blast、COBALT、RefSeq、UniGene、HomoloGene、ProtEST、dbMHC、dbSNP、dbVar、Epigenomics、the Genetic Testing Registry、Genome和相關工具、比對查看器、跟蹤存檔、Sequence Read Archive、BioProject、BioSample、ClinVar、MedGen、HIV-1/人類蛋白質相互做用數據庫、Gene Expression Omnibus、Probe、Online Mendelian Inheritance in Animals、the Molecular Modeling Database、the Conserved Domain Database、the Conserved Domain Architecture Retrieval Tool、Biosystem、Protein Clusters and thePubChem suite of small molecule databases,全部這些資源能夠在NCBI主頁找到。

html

Databases

Assembly

一個提供有關基因組組裝結構,裝配名稱和其餘元數據,統計報告以及基因組序列數據連接等信息的數據庫。ios

BioCollections

一個有關培養物、動植物樣本和其餘天然樣本的精選元數據集。 記錄顯示樣本狀態,有關館藏的機構的信息,以及NCBI中相關數據連接。git

基因組學,功能基因組學和遺傳學研究的集合以及其結果數據集的連接。 此資源描述項目範圍,材料和目標,並提供一種機制來檢索因爲註釋不一致,多個獨立提交以及一般存儲在不一樣數據庫中的各類數據類型的不一樣性質而常常難以找到的數據集。github

BioSample

BioSample數據庫包含實驗測定中使用的生物來源材料的描述。算法

根據生物關係對生物醫學文獻,小分子和序列數據進行分組的數據庫。數據庫

可直接搜索或從其餘NCBI數據庫中的連接數據搜索的生物醫學書籍集合。 該系列包括生物醫學、其餘科學主題書,GeneReviews等遺傳資源和NCBI幫助手冊。編程

ClinVar

儲存人類變異與觀察到的健康情況之間關係的記錄以及支持證據的數據庫。 能夠經過記錄上的超連接訪問 NIH Genetic Testing Registry (GTR)MedGenGeneOMIMPubMed 相關信息。瀏覽器

ClincialTrials.gov

世界各地公開和私人支持的臨牀研究的登記和結果數據庫併發

Computational Resources from NCBI's Structure Group

一個由對NCBI計算生物學分會(CBB)結構組開發的資源的訪問和連接的集中頁面。 這些資源包括幫助研究大分子結構,保守結構域和蛋白質分類,小分子及其生物活性,以及生物途徑和系統的數據庫和工具。app

Consensus CDS (CCDS)

人類和小鼠一致註釋和高質量的核心蛋白質編碼區域。

CDD是一種蛋白質註釋資源,由一系列通過充分註釋的古代結構域和全長蛋白質序列比對模型組成。

dbVar數據庫儲存了大規模基因組變異相關的信息,包括大插入,缺失,易位和倒位。 除了分類突變以外,dbVar還存儲已定義突變與表型信息的關聯。

儲存基因型和表型相互做用研究結果和描述的數據庫,這些研究包括全基因組關聯(GWAS)、醫學重測序、分子診斷,以及基因型與非臨牀性狀之間的關聯。

數據庫包含單核苷酸突變、微衛星和小規模插入和缺失信息。

NIH基因序列數據庫,是全部公開可用DNA序列的註釋集合。NCBI的GenBank數據庫和日本DNA數據庫(DDBJ),歐洲分子生物學實驗室(EMBL)天天交換數據,保證數據實時跟新。 GenBank由幾個部分組成,大部分序列能夠經過Nucleotide數據庫訪問。 例外的是EST和GSS分區,分別經過Nucleotide EST和Nucleotide GSS數據庫訪問。

一個可搜索的基因數據庫,專一於已經徹底測序的基因組,而且有一個活躍的研究團體來提供基因特異性數據。基因信息包括命名法、染色體定位、基因產物及其屬性(例如,蛋白質相互做用)、相關標記、表型、相互做用、引文連接、序列、突變詳情、圖譜、表達報告、同源物、蛋白結構域內容和外部數據庫連接。

公共功能基因組數據庫,支持符合MIAME標準的數據提交。接受基於芯片和測序數據,並提供工具以幫助用戶查詢和下載實驗數據並研究基因表達譜。

存儲從Gene Expression Omnibus(GEO)數據庫組裝的基因表達和分子丰度數據集。數據集每一個記錄包含其餘資源,包括集羣工具和差別表達式查詢。

存儲從Gene Expression Omnibus(GEO)數據庫組裝的單個基因表達和分子丰度配置文件。 基於基因註釋或預先計算的輪廓特徵搜索感興趣的特定配置。

GeneReviews

NCBI Bookshelf上專家撰寫的同行評審疾病描述集,將基因檢測應用於具備特定遺傳病症的患者和家眷的診斷,管理和遺傳諮詢。

Genes and Disease

選定遺傳疾病的信息摘要,討論潛在的突變和臨牀特徵,以及相關數據庫和組織的連接。

Genetic Testing Registry (GTR)

基因測試和實驗室記錄,包括測量的詳細信息,如測量和分析以及臨牀有效性。 GTR也是遺傳條件信息的紐帶,並提供與各類資源的特定背景相關的連接,包括實踐指南,已發表的文獻和遺傳數據/信息。 GTR的最初範圍包括孟德爾疾病的單基因測試,以及陣列,小組和藥物遺傳學測試。

包含來自1000多種生物的全基因組的序列和比對數據。 基因組表明徹底測序的生物和正在進行測序的生物, 三個主要領域(細菌,古細菌和真核生物),以及許多病毒,噬菌體,類病毒,質粒和細胞器。

Genome Reference Consortium (GRC)

基因組參考聯盟(GRC)負責人和小鼠參考基因組,成員包括華盛頓大學的基因組中心,Wellcome Trust Sanger研究所,歐洲生物信息學研究所(EBI)和國家生物技術信息中心(NCBI)。 GRC致力於糾正錯誤表明的位點並完善剩餘的裝配間隙。 此外,GRC尋求爲複雜或結構變異的基因組位點提供替代組裝。 在GRC網站(http://www.genomereference.org)上,公衆能夠查看目前正在審查的基因組區域,報告基因組相關問題並聯系GRC。

HIV-1, Human Protein Interaction Database

已知HIV-1蛋白與人宿主蛋白相互做用的數據庫。 它提供了已發表的蛋白質相互做用報告的註釋書目,並附有相應PubMed記錄和序列數據的連接。

Identical Protein Groups

描述在GenBank和RefSeq中註釋的編碼區中鑑定的蛋白質,以及SwissProt和PDB蛋白質序列的綜合記錄集合。 該資源容許研究人員得到更有針對性的搜索結果並快速識別感興趣的蛋白質。

Influenza Virus

來自NIAID流感基因組測序項目和GenBank的數據集合,它提供了流感序列分析,註釋和GenBank提交工具。 該資源還包含其餘流感序列資源的連接,以及有關流感病毒的出版物和通常信息。

NLM目錄數據庫的子數據庫,提供NCBI數據庫記錄中引用的期刊信息,包括PubMed摘要。支持期刊標題,MEDLINE或ISO縮寫,ISSN或NLM目錄ID搜索此數據庫。

MeSH(醫學主題詞)是美國國家醫學圖書館用於索引MEDLINE / PubMed文章的受控詞彙表。 MeSH術語提供了一種一致的方法來檢索可能對相同概念使用不一樣術語的信息。

MedGen

醫學遺傳學信息門戶,MedGen包含來自多個來源的術語列表,並將它們組織成概念分組和層次分組。還提供了 NIH Genetic Testing Registry (GTR), ClinVarGene, OMIM, PubMed和其它來源中的相關連接信息。

NCBI C++ Toolkit Manual

NCBI C++工具包綜合手冊,包括其設計和開發框架,C++庫參考,軟件示例和演示,常見問題解答和發行說明。該手冊可在線搜索,能夠下載爲一系列PDF文檔。

提供教程和培訓材料的連接,包括PowerPoint幻燈片和打印講義。

NCBI Glossary

做爲NCBI手冊的一部分,本詞彙表包含NCBI工具和首字母縮寫詞,生物信息學術語和數據表示格式的描述。

有關NCBI數據庫和軟件的文章集合。,專爲新手用戶設計,每篇文章都提供了資源及其設計的通常概述,以及搜索和使用可用分析工具的提示。 全部文章均可以在線搜索並以PDF格式下載; 該手冊能夠經過NCBI Bookshelf訪問。

經過NCBI Bookshelf訪問,幫助手冊包含許多NCBI資源的文檔,包括PubMed,PubMed Central,Entrez系統,Gene,SNP和LinkOut。 全部章節都可以PDF格式下載。

NCBI Pathogen Detection Project

一個關於收集和分析源自食品,環境和患者分離物的細菌病原體基因組序列的項目。 目前,自動化分析集羣並識別主要由公共衛生實驗室提供的序列,以協助調查食源性疾病爆發並發現潛在的食物污染源。

National Library of Medicine (NLM) Catalog

圖書館館藏中全部期刊,書籍,視聽,計算機軟件,電子資源和其餘資料的書目數據。

來自多個來源的核苷酸序列的集合,包括GenBank,RefSeq,第三方註釋(TPA)數據庫和PDB。

人類基因和遺傳疾病的數據庫。 NCBI維護當前內容並繼續支持其與其餘NCBI數據庫的搜索和集成。 可是,OMIM如今在omim.org上有一個新主頁,用戶能夠直接訪問該站點進行全面顯示。

來自比較研究的相關DNA序列的數據庫:系統發育,種羣,環境以及在較小程度上的突變。 數據庫中的每一個記錄都是一組DNA序列。 例如,羣體集提供有關生物體內遺傳變異的信息,而系統發育集能夠包含從幾個相關生物得到的單個基因的序列及其比對。

Probe

用於各類生物醫學研究應用的核酸試劑數據庫,有關試劑比例、探針有效性和序列類似性等信息。

相關蛋白質序列(簇)的集合,由完整的原核和細胞器質粒和基因組編碼的參考序列蛋白組成。 該數據庫提供對註釋信息,出版物,域,結構,外部連接和分析工具的輕鬆訪問。

包含來自各類來源的蛋白質序列記錄的數據庫,包括GenPept,RefSeq,Swiss-Prot,PIR,PRF和PDB。

由沉積的生物活性數據和用於篩選PubChem物質數據庫中包含的化學物質的生物活性測定的描述組成,包括篩選程序特有的條件和讀數(生物活性水平)的描述。

包含可使用名稱,同義詞或關鍵詞搜索的,通過驗證的惟一化學結構(小分子)。 若是不一樣的研究者提供相同的結構,則複合記錄能夠連接到多個PubChem物質記錄。 這些化合物記錄反映了用於描述PubChem物質中物質的通過驗證的化學描述信息。

PubChem物質記錄包含提交人提交給PubChem的物質信息,這包括提交的任何化學結構信息,以及化學名稱,評論和提交人網站的連接。

MEDLINE和其餘生命科學期刊的生物醫學文獻引文和摘要數據庫。

全文生物醫學和生命科學期刊文獻,包括臨牀醫學和公共衛生。

人類基因特異性參考基因組序列的集合。

由NCBI產生的主持的,非冗餘的基因組DNA,轉錄物(RNA)和蛋白質序列的集合。

Retrovirus Resources

專門用於支持逆轉錄病毒研究的資源數據庫

SARS CoV

SARS冠狀病毒(CoV)的數據摘要,包括與最新序列數據和出版物的連接,與其餘SARS相關資源的連接,以及來自各類分離株的基因組序列的預先計算的比對。

序列讀取存檔(SRA)存儲來自下一代測序平臺的測序數據,包括Roche 454GSSystem®,Illumina GenomeAnalyzer®,Life Technologies ABSOLiDSystem®,HelicosBiosciencesHeliscope®,CompleteGenomics®和PacificBiosciencesSMRT®

包含源自蛋白質數據庫的大分子3D結構,以及用於可視化和比較分析的工具。

包含NCBI數據庫中具備分子數據的160,000多種生物的名稱和系統發育譜系。

Third Party Annotation (TPA) Database

包含從GenBank中現有主序列數據構建的序列的數據庫。

用於各類大規模測序項目的單次讀取的DNA序列色譜圖(跡線),鹼基調用和質量估計的存儲庫。

Viral Genomes

普遍的資源,包括病毒生物學的簡述、Entrez Genome中病毒基因組序列的連接,以及有關病毒參考序列的信息、數千個病毒基因組的參考序列的集合。

Virus Variation

將流感病毒資源擴展到其餘生物體,提供下載所選病毒序列集的界面,分析工具,包括病毒特異性BLAST頁面和基因組註釋管道。

 

Tools

1000 Genomes Browser

一個交互式圖形查看器,容許用戶研究由 1000 Genomes Project 生成的突變、基因型和支持證據(例如,比對的序列read數)。

Amino Acid Explorer

該工具容許用戶經過比較它們的結構和化學性質,預測由突變引發的蛋白質序列變化,查看常見的取代,以及瀏覽保守結構域中給定殘基的功能來探索氨基酸的特徵。

Assembly Archive

將跟蹤存檔中找到的原始序列信息與公開可用的序列存儲庫(GenBank / EMBL / DDBJ)中的裝配信息相連接。 Assembly Viewer容許用戶查看多序列比對以及實際序列色譜圖。

BLAST Microbial Genomes

對選定的完整真核和原核基因組中的類似序列進行BLAST搜索。

BLAST RefSeqGene

  RefSeqGene/LRG集中的基因組序列進行BLAST搜索

BLAST Tutorials and Guides

此頁面連接到許多與BLAST相關的教程和指南,包括BLAST算法的選擇指南,BLAST輸出格式的說明,獨立BLAST參數的說明,在本地機器上設置獨立BLAST的說明以及 使用BLAST URL API。

找到生物序列之間的局部類似性區域,該程序將核苷酸或蛋白質序列與序列數據庫進行比較,並計算匹配的統計顯着性。 BLAST可用於推斷序列之間的功能和進化關係,以及幫助鑑定基因家族的成員。

Batch Entrez

容許你提交Nucleotide、Protein或其餘Entrez數據庫中的GI、登陸號或其餘惟一標識符的文件,從許多Entrez數據庫中檢索記錄。

CDTree

一個用於分類蛋白質序列和調查其進化關係的應用程序CDTree能夠導入,分析和更新現有的保守域(CDD)記錄和層次結構,還容許用戶建立本身的記錄和層次結構。 CDTree與Entrez CDD和Cn3D緊密集成,容許用戶建立和更新蛋白質域對齊。

COBALT

COBALT是一種蛋白質多序列比對工具,使用RPS-BLAST,BLASTP和PHI-BLAST找到從保守結構域數據庫,蛋白質基序數據庫和序列類似性衍生的成對約束的集合。

用於從NCBI的Entrez檢索服務查看三維結構的獨立應用程序。

Coffee Break

做爲NCBI Bookshelf的一部分,Coffee Break結合了近期生物醫學發現的報告和NCBI工具的使用。 每份報告都包含互動教程,展現NCBI生物信息學工具如何用做研究過程的一部分。

Conserved Domain Architecture Retrieval Tool (CDART)

顯示構成給定蛋白質序列的功能域。 它列出了具備類似結構域結構的蛋白質,而且能夠檢索含有特定結構域組合的蛋白質。

鑑定蛋白質序列中存在的保守結構域。

在常規Web查詢界面以外提供對NCBI Entrez系統內數據訪問的工具。

Ebot

容許用戶使用在線表單構建E-utility分析流程,而後生成Perl腳本以執行分析流程的工具。

Gene Expression Omnibus (GEO) BLAST

用於將查詢序列(核苷酸或蛋白質)與包含在GEO數據庫中的微陣列或SAGE平臺上的GenBank序列對齊的工具。

Genetic Codes

在表和分類樹中顯示分類法數據庫中生物的遺傳密碼。

Genome BLAST

該工具將核苷酸或蛋白質序列與基因組序列數據庫進行比較,並使用基本局部比對搜索工具(BLAST)算法計算匹配的統計顯着性。

Genome Data Viewer (GDV)

用於真核RefSeq基因組裝配的交互式導航的基因組瀏覽器,其具備對基因,表達,變異和其餘註釋的全面檢查。

Genome Decoration Page

一種可幫助生成關於基因組組裝註釋和序列名稱的期刊質量數字工具。

Genome Remapping Service

NCBI的重映射工具容許用戶映射註釋數據並將特徵的位置從一個基因組版本轉換爲另外一個,或經過鹼基分析將RefSeqGene序列轉換爲RefSeqGene序列。

用於查看和分析序列數據的集成應用程序。

LinkOut

一種容許第三方直接從PubMed和其餘Entrez數據庫記錄連接到Entrez系統以外的相關Web可訪問資源服務。

爲生物的子集提供比對和組裝序列的特殊瀏覽功能。

Multiple Sequence Alignment Viewer

一種交互式Web應用程序,使用戶可以可視化由數據庫搜索結果或其餘軟件應用程序建立的多個對齊。

提供有關新的和更新的資源以及NCBI研究和開發項目的信息。

NCBI Toolbox

NCBI用於生成分子生物學便攜式模塊化軟件的一套軟件和數據交換規範。

OSIRIS

一個公共領域質量保證軟件包,有助於根據實驗室特定的協議評估多重短串聯重複(STR)DNA譜。

Open Reading Frame Finder (ORF Finder)

一種圖形分析工具,用於查找用戶序列中或已存在於數據庫中的序列中的全部開放閱讀框。

PSSM Viewer

容許用戶從CDD記錄或位置特異性迭代(PSI)-BLAST蛋白質搜索中顯示,排序,子集和下載位置特異性評分矩陣(PSSM)。

Phenotype-Genotype Integrator (PheGenI)

支持經過表型,染色體位置,基因和SNP標識符查詢人類表型/基因型關係。

Primer-BLAST工具使用Primer3設計序列模板的PCR引物。 而後經過針對用戶指定數據庫的BLAST搜索自動分析潛在產品,以檢查對目標的特異性。

用於計算蛋白質與基因組核苷酸序列的比對的實用程序。

PubChem Power User Gateway (PUG)

PUG經過編程接口提供對PubChem服務的訪問。

PubChem Standardization Service

PubChem術語中的標準化是以與貢獻者原始結構建立PubChem化合物記錄相同的方式處理化學結構。

PubChem結構搜索容許經過化學結構或化學結構模式查詢PubChem化合物數據庫。

專門的PubMed搜索表,面向臨牀醫生和醫療服務研究人員。 該頁面簡化了臨牀研究類別的搜索,查找系統評價和搜索醫學遺傳學文獻。

PubMed Tutorials

PubMed搜索和連接的一系列Web和Flash教程,使用MeSH和其餘PubMed服務在MyNCBI中保存搜索。

Related Structures

相關結構工具容許用戶從分子建模數據庫(MMDB)中查找與查詢蛋白質序列類似的3D結構。

SNP Database Specialized Search Tools

有多種工具可用於搜索SNP數據庫,容許使用BLAST經過基因型,方法,羣體,提交者,標記和序列類似性進行搜索。

Sequence Cytogenetic Conversion Service

一種在線工具,可轉換人類,大鼠,小鼠和果蠅基因組裝配的序列和細胞遺傳學座標。

Sequence Viewer

提供核苷酸或蛋白質序列的可配置圖形顯示以及已在該序列上註釋的特徵。

用於計算cDNA到基因組序列比對的實用程序。

支持使用部分分類名稱,通用名稱,通配符和語音類似的名稱搜索分類樹。

爲選定的一組生物生成分類樹。 用戶能夠上傳分類標識或名稱的文件,也能夠直接輸入名稱或ID。

Taxonomy Statistics

顯示給定排名和包含日期的數據庫中的分類節點數。

Taxonomy Status Reports

顯示一組分類節點或ID的當前狀態。

Tree Viewer

用於建立和顯示系統發育樹數據的工具。 Tree Viewer能夠分析您本身的序列數據,將可打印的矢量圖像生成爲PDF,而且能夠嵌入到網頁中。

Variation Viewer

用於搜索和查看dbSNP,dbVar和ClinVar數據庫中列出的基因組變異的基因組瀏覽器。

VecScreen

一種用於快速鑑定多是載體來源的核酸序列區段的系統。

一種識別類似蛋白質三維結構的計算機算法。

Viral Genotyping Tool

該工具備助於識別病毒序列的基因型。

相關文章
相關標籤/搜索