fastq數據質控過濾軟件—soapnuke 使用

#soapnuke githup地址: https://github.com/BGI-flexlab/SOAPnuke
#下載
git clone  https://github.com/BGI-flexlab/SOAPnuke.git
# 安裝2.0version  參照readme.md  
For 2.X:
make
./SOAPnuke

--使用測試:git

./SOAPnuke filter -1 /home_extend/u****/R/exam/newBGIseq500_1.fq.gz -2 /home_extend/u****/R/exam/newBGIseq500_2.fq.gz -C newBGIseq500_clean_1.fq.gz -D newBGIseq500_clean_2.fq,gz \
-l 10 -q 0.1 -n 0.01 -G 1 -Q 2 -o /home_extend/u****/R/exam/cleandata
## -o 指定輸出目錄

--參數設置介紹:github

SOAPnuke -1 path_to_Fastq1 -2 path_to_Fastq2 -T 4 -n 0.1 -l 5 -q 0.5 -Q 2 -G -5 1 -o outdir -C path_to_cleanFastq1 -D path_to_cleanFastq2 
# 參數說明
-T 線程
#Adapter related:
-n, --nRate        FLOAT        N rate threshold  [0.05]
-l, --lowQual        INT        low quality threshold  [5]         
-q, --qualRate        FLOAT        low quality rate  [0.5]         

-Q, --qualSys        INT        quality system 1:illumina, 2:sanger[1],詳見-G 參數。 
-G, --outQualSys            out quality system 1:illumina, 2:sanger[1],若是設置了就表示質量值體系選擇爲phred33,默認是phred64。這個說明文檔不是很清楚,
在SOAPnuke中sanger表示phred33,illumina表示phred64質量體系。之因此會這樣其實開發該軟件的歷史緣由,在比較早期的時候,phred33和phred64這兩個詞用的還比較少。
開發人員知道的是sanger測序的質量值是ASCII-33,而illumina的質量值要-64(早期版本),所以爲了好記,就直接用了這兩個詞,表明和sanger的同樣,或者和illumina的同樣;
這個參數和-Q是有一樣的做用。-33的質量體系,使用-Q 2 (或者 -G ,也能夠兩個參數都使用)

-1, --fq1               FILE            fq1 file(required),read1的fasq文件
-2, --fq2               FILE            PE(雙端)測序時,須要read2的fastq文件 ,即fastq2
-C, --cleanFq1          STR             clean fq1 file name(required ,gz format)
-D, --cleanFq2          STR             clean fq2 file name
-o, --outDir        STR             輸出目錄,默認當前目錄    
-3, --maxReadLen    INT        read max length,default 49 for filtersRNA
-4, --minReadLen    INT        read min length,default 18 for filtersRNA,30 for other modules    
相關文章
相關標籤/搜索