#soapnuke githup地址: https://github.com/BGI-flexlab/SOAPnuke #下載 git clone https://github.com/BGI-flexlab/SOAPnuke.git # 安裝2.0version 參照readme.md For 2.X: make ./SOAPnuke
--使用測試:git
./SOAPnuke filter -1 /home_extend/u****/R/exam/newBGIseq500_1.fq.gz -2 /home_extend/u****/R/exam/newBGIseq500_2.fq.gz -C newBGIseq500_clean_1.fq.gz -D newBGIseq500_clean_2.fq,gz \ -l 10 -q 0.1 -n 0.01 -G 1 -Q 2 -o /home_extend/u****/R/exam/cleandata ## -o 指定輸出目錄
--參數設置介紹:github
SOAPnuke -1 path_to_Fastq1 -2 path_to_Fastq2 -T 4 -n 0.1 -l 5 -q 0.5 -Q 2 -G -5 1 -o outdir -C path_to_cleanFastq1 -D path_to_cleanFastq2 # 參數說明 -T 線程 #Adapter related: -n, --nRate FLOAT N rate threshold [0.05] -l, --lowQual INT low quality threshold [5] -q, --qualRate FLOAT low quality rate [0.5] -Q, --qualSys INT quality system 1:illumina, 2:sanger[1],詳見-G 參數。 -G, --outQualSys out quality system 1:illumina, 2:sanger[1],若是設置了就表示質量值體系選擇爲phred33,默認是phred64。這個說明文檔不是很清楚, 在SOAPnuke中sanger表示phred33,illumina表示phred64質量體系。之因此會這樣其實開發該軟件的歷史緣由,在比較早期的時候,phred33和phred64這兩個詞用的還比較少。 開發人員知道的是sanger測序的質量值是ASCII-33,而illumina的質量值要-64(早期版本),所以爲了好記,就直接用了這兩個詞,表明和sanger的同樣,或者和illumina的同樣; 這個參數和-Q是有一樣的做用。-33的質量體系,使用-Q 2 (或者 -G ,也能夠兩個參數都使用) -1, --fq1 FILE fq1 file(required),read1的fasq文件 -2, --fq2 FILE PE(雙端)測序時,須要read2的fastq文件 ,即fastq2 -C, --cleanFq1 STR clean fq1 file name(required ,gz format) -D, --cleanFq2 STR clean fq2 file name -o, --outDir STR 輸出目錄,默認當前目錄 -3, --maxReadLen INT read max length,default 49 for filtersRNA -4, --minReadLen INT read min length,default 18 for filtersRNA,30 for other modules