ある生物のタンパク質の一次構造の比較をしようとしています。
種の間でどれほど保存されているかをみようとしています。
比較のための他種の一次構造をUniProtKBで調べようとすると
候補のタンパク質のデーターが複数出てしまいます。
アイソフォームなのかどうかもぱっと見ただけではわかりません。
中には配列中にXが混在したものもありますし,同じ登録名でも微妙に配列が異なっています。ヒトになるととんでもなく複数の候補が出てきます(なんで?)。
全部の候補をアライメントかけても仕方はないと思いますが,
選定していく際にはどういった基準を置いていけばいいでしょうか?
代表的な配列(?)さえ分かればいいのですが,いい方法はないでしょうか? |
|