状況によって対応が変わってくる気がします。
状況としては二つ考えられるのでしょうか。
1、データセットの量が膨大
質問者さんが例で挙げた程度のデータセット一つに対してならば、手作業でいいと思いますが、このデータセットが100や200になってくると、手作業じゃ大変です。という状況。
2、データセットそのもののサイズが膨大
質問者さんの例では高々6本の配列ですが、これが1000本や2000本になると、とても手作業じゃ難しい。という状況。
1に関しては、MEGAの5.0などの、簡便にデータセットの順番を交換できるソフトを利用するのがよろしいかと思います。とにかく、データセットの数そのものが多い場合は、その分手作業は確実に増えるので、ガチンコで取り組むのが意外と一番近道だったりします。
2の場合は、以下の手順でいかがでしょう。
1、系統樹を作成し、枝を回転させるなどして任意のオーダーに並べ替え。
2、系統樹をpdfで出力後、pdftotextなどのソフトを利用してOTUのみを書き出し。newick formatなどから書き出せる場合はそれでもいいのかもしれませんが、こちらの思い通りのオーダーでOTU名を取り出すのは難しいかも?
3、テキスト形式で書き出されたOTUの順番通りにアライメントを並び替えるソフトを探す、あるいはプログラムを作成。かなり単純なプログラムなので、PerlやRudyなら簡単にできるかも。fasta fileをエクセルに書き出してマクロでなんとかやりくりするというのも手かも知れません。 |
|