タンパク質をコードしているORFを推定する方法はかなり昔からあって、
Fikett(スペル自信なし)のアルゴリズムなんかは遺伝子解析ソフトGenetyxに組み込まれていたりします。スコアがネガティブなORFが翻訳される可能性はゼロと考えていいです(ポジティブなORFではスコアが一番高いのがホンモノとは限らないようですが)。それよりだいぶ時代を経ていますから、いまではもっといろんな方法があるとは思います。いろいろなPhylaのモデル生物のゲノム解読が出来ていて、生物によって遺伝子の種類はそれほど違わないので、homologyベースでの予測というのも説得力があるでしょう。
>プロモーター下流にメチオニンが複数あり、どれが本当のスタートなのかわからないなど
Kozakなどのコンセンサス配列である程度は予想できます。
まあ、開始コドンには絶対にあり得ないのをはじくことは出来ても、それ以外の中でどれが本当の開始コドンかは、タンパク質をとって調べないと決定的なことはいえないでしょうが。 |
|