Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

遺伝子名一覧からDNA配列を取得する トピック削除
No.5067-TOPIC - 2016/05/17 (火) 12:20:41 - GeneSeq
すぐ下のヒロさんの質問に微妙に似ていますが、全然別件です。

NCBIのGeneから遺伝子の一覧を取得したのですが、この一覧から一括で例えばFASTA形式でシークエンスを得るのにいい方法はないか悩んでいます。

NCBIのNucleotideであれば、Send To: からFASTAへ持っていけるのですが、Geneではそのフォーマットが存在しません。
ならばNucleotideで検索すればいいのでは、という気がするのですが、検索アルゴリズムが違うのか、同じように検索しても希望の遺伝子一覧が全然ヒットしてくれず困っています。
Nucleotideの、画面左側にある絞り込み検索「Molecular Type」って相当適当ですよね…?希望のタイプが全然まとまってくれない感じです(これが機能してくれれば万事解決なのですが…)。

ということで、Geneからダウンロードした遺伝子名の一覧あるいはGene IDを用いて、シークエンスを一括でダウンロードする方法をご存知の方がいらっしゃいましたらご教示いただけると助かります。
現在100個程度のリストなので、人力でも何とかなるのですが、後学のためにもスマートな方法があれば身に付けておきたい次第です。

よろしくお願いいたします。
 
- このトピックにメッセージを投稿する -



4件 ( 1 〜 4 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.5067-4 - 2016/05/17 (火) 13:26:16 - GeneSeq
たていすさん、橘さん、早速ありがとうございます。

あぁ!たていすさんお示しの方法、右側にそんなボックスがあったとは盲点でした!
ばっちり機能しました、本当にありがとうございます。

橘さんの方法は、遺伝子名を"OR"でひたすらつなげるという感じでしょうか。確かに、正規表現検索・置換で、全ての遺伝子名をORでつなげばいけそうかもしれないですね。
ただ、検索ボックスの最大文字数がどのぐらいか分かりませんが、遺伝子が1000とかあるとちょっときつそうです。

でも、タブの情報から必要な部分を抜き出して検索、というのは場面によっては応用が利きそうですね。

いずれにせよ情報提供誠にありがとうございました。心よりお礼申し上げます。

(無題) 削除/引用
No.5067-3 - 2016/05/17 (火) 13:01:53 - 橘
やり方その1
NCBIのNucleotideデータベース検索で
遺伝子名[Gene Name]
で検索する。

やり方その2
1.NCBI Geneで遺伝子名で検索
2.FormatをTabularにする
3.以下の4項目を取得
genomic_nucleotide_accession.version
start_position_on_the_genomic_accession
end_position_on_the_genomic_accession
orientation
4.genomic_nucleotide_accession.versionのstart_position_on_the_genomic_accessionからend_position_on_the_genomic_accessionまでの配列を取得
5.orientationがminusだったらひっくり返す

あとは自分で考えてください。

(無題) 削除/引用
No.5067-2 - 2016/05/17 (火) 12:54:33 - たていす
geneで検索して、その後、
1) 右カラムの"Find related data"でnucleotideのリンクを拾い出し、
2) 左カラムのmRNAとrefseqをチェックするなど
3) save to fasta
では、だめだろうか?

遺伝子名一覧からDNA配列を取得する 削除/引用
No.5067-1 - 2016/05/17 (火) 12:20:41 - GeneSeq
すぐ下のヒロさんの質問に微妙に似ていますが、全然別件です。

NCBIのGeneから遺伝子の一覧を取得したのですが、この一覧から一括で例えばFASTA形式でシークエンスを得るのにいい方法はないか悩んでいます。

NCBIのNucleotideであれば、Send To: からFASTAへ持っていけるのですが、Geneではそのフォーマットが存在しません。
ならばNucleotideで検索すればいいのでは、という気がするのですが、検索アルゴリズムが違うのか、同じように検索しても希望の遺伝子一覧が全然ヒットしてくれず困っています。
Nucleotideの、画面左側にある絞り込み検索「Molecular Type」って相当適当ですよね…?希望のタイプが全然まとまってくれない感じです(これが機能してくれれば万事解決なのですが…)。

ということで、Geneからダウンロードした遺伝子名の一覧あるいはGene IDを用いて、シークエンスを一括でダウンロードする方法をご存知の方がいらっしゃいましたらご教示いただけると助かります。
現在100個程度のリストなので、人力でも何とかなるのですが、後学のためにもスマートな方法があれば身に付けておきたい次第です。

よろしくお願いいたします。

4件 ( 1 〜 4 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。