這兩天參照一篇文獻,從 NCBI SRA 下載了若干 .sra 文件來處理,發現數據是 single-end 的,相對較老(2012 年),read length 爲 35 bp,短一些,文獻中說他用的是 tophat 1.1.2, bowtie 0.12.7,設置了 the minimum and maximum intron size 參數,我的理解即設定了 -i 和 -I 值。shell
用軟件倉庫中提供的 tophat 和 bowtie 試着跑了下,發現不能成功,出現了錯誤。bash
軟件版本:服務器
# 沒有服務器,用渣渣筆記本勉強跑 tophat -o tophat/ -p 2 --bowtie1 -i 20 -I 40000 -G gff_file_path bowtie1_index_db_path fastq_file
出現錯誤以下:app
[2016-08-28 23:33:18] Mapping left_kept_reads.m2g_um_unmapped to genome segment_juncs with Bowtie (1/1) open: No such file or directory Error: bam2fastx failed to open BAM file tophat//tmp/left_kept_reads.m2g_um_unmapped.bam [2016-08-28 23:33:51] Joining segment hits [2016-08-28 23:35:26] Reporting output tracks [FAILED] Error running /usr/bin/tophat_reports --min-anchor 8 --splice-mismatches 0 ……………………
Google 了一下,沒有很好的解決方案。嘗試後發現 -i, -I 使用默認值則不會出錯,成功執行;而設定了對應的 20, 40000 後則運行失敗。code
下載文獻中所述版本的軟件,設定參數,執行,成功。it
由於要用特定版本的軟件,寫了個腳本。io
#!/bin/bash export PATH=/home/lhtk/bio/bowtie-0.12.7:/home/lhtk/bio/tophat-1.1.2.Linux_x86_64:$PATH # 此前用舊版的 bowtie 從新構建了 bowtie index db tophat -o tophat_1.1.2 -i 20 -I 40000 -G gff_file_path bowtie_index_db_path fastq_file
發現舊版本軟件要比較新版軟件運行效率低好多,比較慢。ast