一、bcftools提取指定區段的vcf文件html
下載安裝bcftoolsios
見以下命令:git
bcftools filter 1000Genomes.vcf.gz --regions 9:4700000-4800000 > 4700000-4800000.vcf
注意:輸入的vcf以gz格式存在,否則會報錯:Failed to open 1000Genomes.vcf: not compressed with bgzipgithub
如何將vcf生成gz格式,見這篇文章bcftools將vcf生成bgzip和index格式bash
二、vcftools提取多個指定位置(不是一段區域)的vcf文件工具
若是隻想提取指定多個獨立位置(specific position)的基因型(genotypes),則能夠用到vcftools工具spa
(此段感謝健明兄特地提出來,語言描述的不是很清楚。).net
命令行以下:命令行
vcftools --gzvcf file.vcf.gz --positions specific_position.txt --recode --out specific_position.vcf
specific_position.txt的輸入格式以下:code
1 842013 1 891021 1 903426 1 949654 1 1018704
參考連接:https://www.biostars.org/p/162872/