実際に転写因子結合配列位しか検索したことないのですが、
解析というのは、どこまでを指しているのでしょうか。トピ主さんが書いておられるように、TATAとかCAACとか、またはいくつもの転写因子結合配列を抽出してくれるソフトウェアやfreeサイトがあるのはご存じなんですよね。一般的にプロモーター解析をする場合に欠失変異体とかカセット変異なんかをいれたりしたレポーターアッセイ等を組んで個別に対応していく場合が多いかと思いますが、そういったコアプロモーターがどこか?とかまでinsilicoで一定の答えを出したいということでしょうか。
もうこれは近似で求めるしかないので、既に解析されている類似(ファミリーだとか挙動が一緒とか)プロモーターの解析結果を言語アルゴリズムから構築して、推定するくらいはできそうですね。そのためにどのくらいの論文を読ませるかはわかりませんが、結構読ませないと厳しいかもしれませんね。そもそも類似(種間も視野に入れて)な遺伝子プロモーターの報告がない、たとえば新規遺伝子とかプロモーター解析がやられていない遺伝子だと近似を得られませんから、そういうときは厳しいのではないでしょうか。 |
|