お二人のおっしゃってることがよく解らなくてちょっと悩みました。
こういうことでしょうか。
最初の質問は
「生のfasta配列の並びを変えてclustalでアライメントを取り直して系統樹を
描かせたら樹形が変わるのは何故ですか?」
clustalのアルゴリズムは旧くて、一発で適切なアライメントが出来ることは
まずありません。
必ず目で見てギャップを入れたりサイトをずらしたりして、修正してやらない
とまともなアライメントにはなりません。
読み込み順(=配列の並び方)で得られるアライメント(ギャップの入れ方や
サイトの揃え方)が大きく異なるのは容易に想像出来ます。
アライメントが異なれば樹形が同じになるはずがありません。
たとえ「データが同じで作成方法も同じ」であっても、読み込み順が違えば計
算させる度に細部の樹形は異なります。この辺は教科書で勉強してください。
{読み込み順が違えば違うデータという意見は理解できません}
樹形が変わるから、ブートストラップ確率で樹形のrobustnessを評価します。
適切なアライメントであればBS確率については、ランダマイズのパラメーター
を変えて何度計算させても、BS確率の大きい分岐については似たような結果が
再現よく得られます。(当たり前ですが)
再現の悪い(=BS確率の低い)分岐については議論しても意味はありません。
最初は、同じアライメントでも計算させる度に毎回樹形が変わるのは何故か?
という質問かと思いました。
最近はアライメントを目で見ながら修正することはないのでしょうか?
MAFFTとかの良いアルゴリズムがあるようですし。 |
|