「將包含一條基因數據的文件依次進行比對,轉化成二維數據進行比對」,直接目前存在的問題:html
(具體解決思路,等我實現再補充,各位大佬見諒)linux
概念介紹:ios
.fa文件格式:算法
「>基因ID 基因序列」 以下圖:AT50_0就是基因ID
解決思路:spa
執行以下命令,進行數據處理命令行
./faSomeRecords AT_50_1_a.fasta ID.txt query.fasta #其中AT_50_1_a.fasta是原始的fasta文件,ID.txt列入了須要查找的基因ID,每行一個,query.fasta爲輸出文件,包含對應ID的序列信息。
linux操做圖:code
AT_50_1_a.fasta是原始的fasta文件:htm
ID.txt列入了須要查找的基因ID:blog
query.fasta爲輸出文件:接口
最終從原始文件提取出基因ID爲:AT50_0,AT50_5的基因序列,並將結果保存在query.fasta文件中。
注:本文參考科學網陳振璽博客:http://blog.sciencenet.cn/blo... Tanvir Ahamed博士在biostarts中的回覆(https://www.biostars.org/p/12...),實際操做後整理所得。