通常のcDNA配列は(技術的な理由で)mRNAの5’側が欠けていることが多いです。
完全長cDNA projectのデータも参考になるでしょう。
(きっちり転写開始点を同定している論文があれば良いのですが)
ただし、転写開始点が決定(確定)されていない遺伝子も残っていると思います。
また、複数の転写開始点や複数のプロモーター領域を有している遺伝子もあるので注意してください。ちなみにGC richなpromoterにはTATAはないことが多いですよ。
では、どうするか。。。この場合、Unigeneを入り口にするとわかりやすいかと思います。
複数のcDNA配列などを参照してありますし、近隣の遺伝子のゲノムMapにもたどり着きやすい?ので、より正しい(と思われる)promoter領域を捜しやすいでしょう。
ただし完全長cDNA projectのデータは統合されていないようです。 |
|