長さの異なる配列のmultiple alignmentの方法(ソフト、サイト等)を教えてください。
ゲノムのタンデムリピート配列(130 bp程度)のsequenceデータ(fasta format)が手元に大量にあります。配列、および長さにはバラツキがあります。例をあげると以下のような配列データが、5000程あります。
>A0001
ATGACGTAGTGATGACAGTGACATAGTCAAAGTG
>A0002
ATGACGTAGTGATGACAGTCATAGTCAAAGTG
>A0003
ATGACGTAGTGATGACAGTGACATAGTCTTAGTG
>A0004
ATATGACGTTGTGATGACAGTGGCATAGTCAAAGTGCAGT
これらをもとに、配列間で相同性の高い配列(consensus配列)を導きだしたいと思っています。少数の配列をもとにalignmentするだけなら、ClustalW等でうまく行くのですが、大量の配列だとどうもworkしません。大量データでmultiple alignmentがおこなえるソフト、サイト等を教えてください。
よろしくお願い致します。 |
|