Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

DNA配列データの冗長性排除について トピック削除
No.3402-TOPIC - 2014/09/25 (木) 18:55:49 -
配列1:AAATCCG
配列2:AANTCNG


このようにN以外の塩基が一致している場合に,

配列1_配列2 AAATCCG

上のように1つの配列にまとめるソフトウェアを探しています.
入力する配列数は5万配列です.
よろしくお願いします
 
- このトピックにメッセージを投稿する -



6件 ( 1 〜 6 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.3402-6 - 2014/09/26 (金) 15:50:29 - qw
塩基配列から、
配列:AANTCNG,(N:任意の塩基)をさがすだけであれば、grepを使うのが古典的かもしれません。
grep(またはモドキ)は、windows用にも用意されているのでは無いかと思います。

(無題) 削除/引用
No.3402-5 - 2014/09/26 (金) 15:23:35 - ~
>プログラミングの自作または外注の検討とソフトの検索を行ってみます.
代理店に丸投げして、市販ソフトで目的の解析ができるものを探してもらった方が効率がいいかもしれません。
研究者は使ったことのないソフトについてまで詳しい人は少ないですが、代理店は探すのも仕事のうちなので、全国的にそのようなソフトを扱っている会社に問い合わせてくれるでしょう。

そういえば、昔、知り合いにカラオケ代1回分で解析ソフトを作ってもらったことがありますが、そのようなつてを探して見るのも手かもしれません。
数十bpの配列について、DB内の一定以上の相同性のある遺伝子をピックアップするというような物でしたが、半日くらいで作ってもらえました。
情報系に詳しい知り合いがいれば、相談してみてはいかがでしょうか。
その場合は、システム屋さんが理解できる日本語に翻訳してあげることが重要になります。

(無題) 削除/引用
No.3402-4 - 2014/09/26 (金) 11:30:50 -
回答ありがとうございます.

・N以外が一致する複数の異なる配列がある場合は、どのような処理を行うか
ということを考えていませんでした.

・塩基配列のサイズは可変ですが末端にNを挿入して長さを揃えています(570bp).
・塩基配列の位置は固定ですが,可変でも可能ならその方が望ましいです.

プログラミングの自作または外注の検討とソフトの検索を行ってみます.

要求仕様を明確に 削除/引用
No.3402-3 - 2014/09/26 (金) 10:00:57 - ~
・塩基配列のサイズは固定か可変か?
・塩基配列の位置は固定か可変か?
・N以外が一致する複数の異なる配列がある場合は、どのような処理を行うか
等によって、ソフトに求められる機能が大きく変わってくると思います。

例に挙げられたような6塩基でずれのない配列が解析対象であれば、最大で4,096種類に分類できますので、ソフトの選定から始めるよりも、手で分類した方が早くて安上がりになるかもしれません。

サイズと位置が可変であれば、DNAシーケンスアセンブルソフトウェアSEQUENCHER のような、アセンブリができるソフトを検討されてはいかがでしょうか。
使ったことはありませんが、アセンブリする際にはNを何らかの方法で処理しているでしょうし、体験版がありますので、目的の解析法ができるかまではただで評価できると思います。

また、相同性の評価法と配列の処理法と出力形式がピンポイントで決まっているようですので、フリーソフトでそのまま当てはまるものを探すのは難しいのではないでしょうか。
Perl等を理解すればプログラミングできると思いますので、自作または外注も検討されてはいかがでしょうか。

(無題) 削除/引用
No.3402-2 - 2014/09/25 (木) 23:53:27 - おお
ワードでもできそうですが、、、
3回ほどそうさを繰り返さないといけないですけど、
AACTCNG ->AAATCNGでreplace
AAGTCNG ->AAATCNGでreplace
AATTCNG ->AAATCNGでreplace

DNA配列データの冗長性排除について 削除/引用
No.3402-1 - 2014/09/25 (木) 18:55:49 -
配列1:AAATCCG
配列2:AANTCNG


このようにN以外の塩基が一致している場合に,

配列1_配列2 AAATCCG

上のように1つの配列にまとめるソフトウェアを探しています.
入力する配列数は5万配列です.
よろしくお願いします

6件 ( 1 〜 6 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。