bcftools或vcftools提取指定區段或者多個指定位置的vcf文件(extract specified position )

一、bcftools提取指定區段的vcf文件html

下載安裝bcftoolsios

見以下命令:git

bcftools filter 1000Genomes.vcf.gz --regions 9:4700000-4800000 > 4700000-4800000.vcf

  注意:輸入的vcf以gz格式存在,否則會報錯:Failed to open 1000Genomes.vcf: not compressed with bgzipgithub

                  如何將vcf生成gz格式,見這篇文章bcftools將vcf生成bgzip和index格式bash

 

二、vcftools提取多個指定位置(不是一段區域)的vcf文件工具

若是隻想提取指定多個獨立位置(specific position)的基因型(genotypes),則能夠用到vcftools工具spa

(此段感謝健明兄特地提出來,語言描述的不是很清楚。).net

命令行以下:命令行

vcftools --gzvcf file.vcf.gz --positions specific_position.txt --recode --out specific_position.vcf

  specific_position.txt的輸入格式以下:code

1 842013
1 891021
1 903426
1 949654
1 1018704

參考連接:https://www.biostars.org/p/162872/

相關文章
相關標籤/搜索