Sam文件第二列含義

sam 文件第二列flag含義:app

1 : 表明這個序列採用的是PE雙端測序ip

2: 表明這個序列和參考序列徹底匹配,沒有錯配和插入缺失io

4: 表明這個序列沒有mapping到參考序列上cli

8: 表明這個序列的另外一端序列沒有比對到參考序列上,好比這條序列是R1,它對應的R2端序列沒有比對到參考序列上map

16:表明這個序列比對到參考序列的負鏈上di

32 :表明這個序列對應的另外一端序列比對到參考序列的負鏈上文件

64 : 表明這個序列是R1端序列, read1;ping

128 : 表明這個序列是R2端序列,read2;let

256: 表明這個序列不是主要的比對,一條序列可能比對到參考序列的多個位置,只有一個是首要的比對位置,其餘都是次要的tag

73 = 64+8+1 (R1匹配上,R2沒有匹配上)

153 = 128+16+8+1(R2比對到負連接,R1沒有匹配上)

97 = 64+32+1 (R2比對到負鏈,R1不是徹底匹配)

99 = 64+32+2+1 (R2比對到負鏈,R1徹底匹配)

147 = 128+16+2+1 (R2徹底匹配到負鏈)

145 = 128+16+1 (R2比對到負鏈,R1不是徹底匹配)

83 = 64+16+2+1 (R1徹底匹配到負鏈)

163 = 128+32+2+1(R2徹底匹配,R1比對到負鏈)

 

M alignment match (can be a sequence match or mismatch) insertion to the reference
D deletion from the reference
N skipped region from the reference

S soft clipping (clipped sequences present in SEQ)
H hard clipping (clipped sequences NOT present in SEQ)

P padding (silent deletion from padded reference) sequence match
 

 

還有一些可選的tag,格式爲tag:type:value   例如:NH:1 表明的是read alignment的個數,表示這個read只mapping到基因組一次

相關文章
相關標籤/搜索