おおさんの手法も確実な安全策でよいと思います。
できるだけ小さくしたい時や隣の(機能・構造類似性が明らかになっている)ドメインが離れているときは、alpha-helix, beta-sheet構造などを複数サイトで予測して、高次構造が予測されない(ドメインを繋ぐリンカーとなり得る)アミノ酸配列を見いだします。そのなかで、Gly,Ser,Proなど高次構造を破壊しやすいアミノ酸を選んで、それを含めた配列を選択するのも手だと思います。
長いフレキシブルな配列(alpha-helix, beta-sheet構造などを取らない)もタンパク認識に関与することもあるので、無用に長いフレキシブル配列を含めるのも気を付けましょう。明確な根拠はありませんが、「自分」の目安は10アミノ酸なら大丈夫(相互作用しにくい)だけど、実際には5アミノ酸くらいを採用かな。
phage-display法では7~12アミノ酸長でKdがuMオーダーのpeptideが取れますので、フレキシブル配列の特定のアミノ酸の種類(荷電性、疎水性)の含有量が多い場合は注意しましょう。Gly,Ser,Pro, (Ala)はタンパク相互作用に関与する可能性は低いです。
最近は高次構造が決定されているタンパクも多いので、それらの配列と高次構造を参考にしましょう。例えば、参考にしたドメインのC末がalpha-helixを取るなら、ご自分のドメインのC末が参考ドメインより長くなっても、alpha-helixを取りそうな連続するアミノ酸は含めるとか。
ただし、上記はあくまでも参考と思ってください(どんどん優秀な予測プログラムが出てきていますし)。事実、毎回悩みます。 |
|