SAM Format FLAG 설명, 추출, 분석 방법

FLAG란? Sequence Alignment/Map (SAM) format에서 FLAG는 alignment section에서 2번째 column의 정보로, sequence가 alignment된 상태를 표현한다. FLAG는 총 12자리의 이진수를 십진수로 표현하며, 이진수의 각 자리가 0인지, 1인지에 따라 그 상태의 유무를 판단할 수 있다. 예를 들어, paired-end library로 시퀀싱된 read 두 쌍이 mapping되었으면 FLAG의 첫 번째 자리 수가 1이 된다. 만약 FLAG 첫 번째 자리수가 0이면 그 read는 쌍이 없다는 것이 된다. FLAG는 bit로 표현된다 Bit 16진수 Description 1 0x1 template having multiple segments in sequencing 2 0x2 each segment properly aligned according to the aligner 4 0x4 segment unmapped. mapping이 안 된 것을 의미한다. 8 0x8 next segment in the template unmapped 16 0x10 SEQ being reverse complemented 32 0x20 SEQ of the next segment in the template being reverse complemented 64 0x40 Paired reads를 mapping했을 때, 첫 번째 read를 의미한다. 128 0x80 Paired reads를 mapping했을 때, 두 번째 read를 의미한다. 256 0x100 Secondary alignment. Primary alignment가 아님을 의미한다. 하나의 read가 여러 군데 mapping되었을 경우, 첫 번째로 mapping된 경우가 아닌…

0 Comments