普段はゴリゴリのWet研究をしていて、Dry研究はド素人です。
表題の通りで、ヒトの全ゲノム塩基配列を、Exonを大文字でIntronは小文字で入手したいです。Fasta形式(テキストファイル)でダウンロード出来れば嬉しいです。
NIHからダウンロードしたGRCh38のReference Genome Sequenceのファイルが目的に適うものと思ったのですが、使ってて気付いたのですが、ExonとIntronの割り付けがかなり曖昧(自分の研究対象の遺伝子いくつかで調べたら、Ensembl Genome Browser等の別のブラウザで出てくる情報とかなり違っており、IntronのGT-AGルールから外れた形になってるのが殆ど。勿論そういうIntronもあるんでしょうが、余りに多すぎる。)で、もう少し正確(という言い方は正確じゃないとは思うけど、どう表現したら良いかわからない)なデータが欲しいと思っています。そういうデータベース、ダウンロード先をご存じでしたら教えて頂けないでしょうか?よろしくお願いします。 |
|