シークエンサー絡みのトラブルとして、polyAのような連続した同一塩基配列に続く配列が正常に読めなくなるというトラブルがあり、連続塩基後の一つ一つのピークがbroadになるという現象が観察されます。
連続塩基より先に読まれた配列は正常に解析されますが、連続塩基後の配列はピークがbroadになっているにも関わらず正常の場合と同じbase spacingで読まれるため、一つの塩基に対し多数の塩基を割り当ててしまうという結果を生じます。
例えば、AGCTという塩基に対しAAAAAAGGGGGGCCCCCCTTTTTTTTと判別してしまう、ということが起きます。
DNA contaminationさんの仰っている事は、この現象を見ている可能性があると思うのですがどうでしょうか?
(polyA側からしか読んでない、raw dataを確認していない、などが思い当たるのであれば可能性はあるかな、と) |
|