特定の短いアミノ酸配列が、特定の種(ヒトや酵母など)で存在する可能性がないかどうかを調べたいのですが、Protein BLASTですと、annotateされた既知のタンパク質しかデータベースに存在しないと思われるため、全ゲノム配列から検索したいと思っています。
そこで、説明が下手で恐縮なんですが、標題の通り、アミノ酸配列から、コドンの多様性を考慮してDNA BLAST検索ができないか模索中です。
例: Met-Gly-Serという3アミノ酸の場合、ATG GGN (AGT/C | TCN) という配列をBLAST検索したいという形です。
3アミノ酸のこの例ですと1 x 4 x 6でわずか24通りなので手動でも可能ですが、アミノ酸数が多くなると、いうまでもなくパターンは膨れ上がり人力では不可能になります。
いい方法をご存知の方がいらっしゃいましたらアドバイスいただけると大変幸いです。よろしくお願いいたします。 |
|