Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

トピック一覧 | 研究留学ネットに戻る

最新のフォーラム | このフォーラム | ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

系統樹のブートストラップをあげたい トピック削除
No.3670-TOPIC - 2010/12/12 (日) 00:20:59 - みな
系統樹をフィギュアに追加するようにリバイスを受けました
かなり大きな遺伝子ファミリーなので
もともと精度の高いつまりブートストラップの高い系統樹を作成するのはかなり困難なのですが
少しでもよくしたいと考えています
しかしブートストラップの低い枝を除くと逆に上流の枝のブートストラップが悪くなるなどなかなか操作が難しい状況です
どうしたらいいでしょうか

そもそもブートストラップの低い部分が散在する系統樹はどのような評価を受けるのでしょうか

かなりダイバージェンスの激しい遺伝子ファミリーです
 
- このトピックにメッセージを投稿する -



15件 ( 1 〜 15 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.3670-18 - 2010/12/17 (金) 15:08:16 - 橘
質問者の研究に関してはBWさんのおっしゃっていることが全てですが、2点だけ。

ブートストラップ値ゼロという結果は多数決合意樹作成のアルゴリズム上、原理的に決して得られません。
最尤系統樹上に支持率をマッピングする場合、完全にあり得ないとは言い切れませんが、通常の配列データ解析結果から得るのは極めて難しいです。
何か根本的な部分での無理解があるのではないでしょうか。

また、紹介した論文の支持率ですが、細い実線は「2つ未満」の解析法(全部で3種類。最小進化法・最尤法・ベイズ法です)でしか90または95%以上の支持率を得られなかったものとあります。
2つ未満ですから、一つもないという可能性もあります。
こういう書き方をする場合、大部分がそうだろうと私は考えますので、上流のサポートはほとんどないと思います。

(無題) 削除/引用
No.3670-17 - 2010/12/17 (金) 14:12:20 - BW
> 私のは最上流でブートストラップゼロが結構混じります
> こんなのでも論文に載せていいのか迷います

個別のことになると、データを見ないとなんとも言えないのですが、
例えば
   -A
 -|
|  -B
|
 ---C
となるような“最尤法”系統樹でブートストラップ値が低くても
   -B
 -|
|   -C
|
 ---A
ベイズ法で描くとこうなるとしましょう。
とすると、どのクラスターとどのクラスターがつながるのかは
はっきりしないけど、A〜Cまで3つの大きなクラスターに分かれる
ということははっきり言えると思います。

これが質問者さんの例に当てはまるのかどうかはわかりませんが。

いずれにせよ、レフェリーから「系統樹を載せろ」と言われたんですよね?
それでも載せないのであれば、しかるべき理由が必要なので
載せざるを得ないと思います。

が、そこで、自分が思うような系統樹が描けないのであれば、
自分の論理展開のどこかが間違えているわけですよね?
そこを素直に認めて、考察で議論するしかないと思います。

ブートストラップ値を上げる、というのは、「どうすれば統計で有意差が出るか?」というのと同類の問題だと思います。

再三繰り返しますが、議論(結論)ありきで結果を“作る”のではなくて、
結果を基に議論を展開するのがサイエンスですよ。

(無題) 削除/引用
No.3670-14 - 2010/12/15 (水) 13:11:12 - みな
アドバイスありがとうございます
参考になります
論文の系統樹ですが個人的にはかなり頑健性の高いものだと思いました
九割をベースにして
上流もかなりサポートされてますよね
私のは最上流でブートストラップゼロが結構混じります
こんなのでも論文に載せていいのか迷います

(無題) 削除/引用
No.3670-13 - 2010/12/15 (水) 00:19:23 - 橘
支持率の低い枝には数値が書いてなかったり、多数決合意樹の作成によって支持率の低い枝は多分岐化されて消滅しているだけだと思います。

> ブートストラップが低い部分が多いけれども価値の高い論文報告って何かありますか?

「低い」ってのはどこから下で、「多い」っていうのはどこから上か分かりませんが、それはさておき、最新のScienceに載っていたこれとかどうでしょうか。
http://dx.doi.org/10.1126/science.1195203
価値が高いかどうか分かりませんがとりあえずScienceに載ってるってことで。

(無題) 削除/引用
No.3670-12 - 2010/12/14 (火) 20:17:32 - みな
皆様のアドバイス参考になります

有名な雑誌ではブートストラップが低い枝をほとんど見ないのですが
これは何かしら意味があるのかと思っていましたが
勘違いなんですね
ブートストラップ値が低い部分がかなりあるので改善しようと思ってしまいました
ブートストラップが低い部分が多いけれども価値の高い論文報告って何かありますか?

(無題) 削除/引用
No.3670-11 - 2010/12/14 (火) 10:33:30 - BW
> ただ高インパクトの論文はほとんどブートストラップの改善に取り組んでいるように見えますが気のせいでしょうか
> ある程度故意に配列を除いているのも事実な気がします

橘さんのおっしゃるとおり、それはねつ造です。

自分の作ったストーリーに沿ったデータを出したいと思うものですが、
それは研究者として間違えています。

まず、データありきです。

自分のストーリーとデータがマッチしていないのであれば、
それはストーリーが間違えているのです。

さて、ブートストラップ値ですが、私はそれが改善するような努力など
したことはありません。
それが「今ある真実」だからです。

もちろん、様々なモデルを試して、様々な系統樹を描いていますが
そもそも系統樹を描いても、本当の「答え」はわかりません。
あくまでも推測の材料です。
なので、モデルや描き方を変える度に、描ける樹は変わります。
その中で、最ももっともらしい樹を採用し、議論するのではないでしょうか?

また、橘さんと同様に「個別に作り直す」というのはアリだと思います。
全体が大きすぎて詳細がぼやけるのであれば、そこをピックアップするのは理にかなっているでしょう。

橘さんはアライメントについてもアドバイスされていますが、モデル選択よりもアライメントミスが大きく影響すると聞いたことがあります。
アライメントをもし目で行っているのであれば、そこに「無意識な恣意的行為」が入っている可能性が大いにあります。
こちらも、プログラムを用いて何度か試してみることをお勧めします。

(無題) 削除/引用
No.3670-9 - 2010/12/14 (火) 02:48:33 - 橘
> ある程度故意に配列を除いているのも事実な気がします

それは論理的な根拠なしにやれば捏造です。

現状の最尤系統推定は、系統樹上での塩基・アミノ酸組成(と置換確率)の変化などを考慮していません。
なので、塩基・アミノ酸組成が著しく異なる配列は悪影響を及ぼしてしまいます。
そういう場合は除去するのは構わないと思います。
支持率を上げるために除去するのは不可です。

> 一回大量のデータで系統樹を作成して
> その後重要なクラスは再度個別に作成し直して
> 別のフィギュアとしてまた議論し直すのが妥当に見えてきました

それはアリだと思います。
あまりに遠縁な配列間の系統樹上では、塩基・アミノ酸組成や置換確率が均一でない可能性が高いので。

ただ、アライメントには細心の注意を払われた方がよいでしょう。
Clustalならアライメントパラメータを適切にすることも考えられますし、アライメントをMAFFTのL-INS-iに変えるだけでもかなり改善されます。
また、遺伝子ということですからタンパクコード塩基配列かアミノ酸配列なんだと思いますが、タンパクコード塩基配列であればアミノ酸に翻訳してアライメントし、塩基配列はその結果に合うようにアライメントするなどといった手段が使えます。
indelはほとんどないのであればアライメントのことは考えなくてもいいです。
アミノ酸配列なのであれば、適用するモデルは適切に選択するようにご注意下さい。
核遺伝子配列にミトコンドリア遺伝子用モデルを当てはめるとか、逆とか、たまにあります。
モデル選択で選択されてしまったのであればしょうがないですが、あまりそういうことはないはずです。

(無題) 削除/引用
No.3670-8 - 2010/12/13 (月) 23:53:37 - みな
みなさんが言いたいことが徐々にわかってきました

ただ高インパクトの論文はほとんどブートストラップの改善に取り組んでいるように見えますが気のせいでしょうか

ある程度故意に配列を除いているのも事実な気がします

みなさんのお話を聞いていると
一回大量のデータで系統樹を作成して
その後重要なクラスは再度個別に作成し直して
別のフィギュアとしてまた議論し直すのが妥当に見えてきました
これでいいんでしょうか?

(無題) 削除/引用
No.3670-7 - 2010/12/13 (月) 22:59:48 - 橘
塩基頻度やコドン利用頻度が偏っている配列を除去するのは理解できますが、そのような根拠無く除去をしたらただの捏造です。
ご注意下さい。
で、それ以外に支持率を上げる方法があるかということですが、データそのものを改善する以外にはありません。
というか上記の方法もその1種ですね。

そもそも支持率を上げる必要なんてあるんでしょうか。
支持率の高い事実についてのみ議論するに留める、というごく普通のことをすればいいんじゃないでしょうか。
議論している内容が、支持率の低い事実に依存しているのを隠したいということならどうしようもないです。
支持率が低くても、支持率50%の仮説と支持率45%の仮説とその他の仮説があるなら、場合分けするなどして最初の2つの両方を考慮した議論を行なうという手は使えるでしょう。

(無題) 削除/引用
No.3670-6 - 2010/12/13 (月) 17:56:25 - ンンノ

全く通じてないようなので、撤退します。
ごめんなさい。

(無題) 削除/引用
No.3670-5 - 2010/12/13 (月) 14:45:05 - みな
精度と頑健性の違いは少しよくわからないんですが
後半部分は納得できます

ただ配列があまりにも多様化して周りに悪影響を及ぼす場合にはその配列を取り除くことはよくあると思います

また質の高い論文はブートストラップ値を上げるために
かなりの労力を注いでいるように思われますがこれはどうなんでしょうか

(無題) 削除/引用
No.3670-4 - 2010/12/13 (月) 13:02:34 - ンンノ
BS確率は樹形の頑健性を評価する指標であって、精度を表現するものではありません。

BS確率が高い分岐点についてだけ、意味のある系統関係として扱えばよろしいかと。

クラスター内の系統関係を詳細に見たい場合には、クラスターを形成する群を
取り出して小さい系統樹を描いてみると、BS確率の高い分岐点が出現することは
あります。

(無題) 削除/引用
No.3670-3 - 2010/12/12 (日) 22:22:20 - みな
何が間違っているのかよくわからないのですが教えていただけないでしょうか

(無題) 削除/引用
No.3670-2 - 2010/12/12 (日) 01:16:03 - ンンノ
なんかブートストラップ確率について根本的に勘違いしてるような気がします。

系統樹のブートストラップをあげたい 削除/引用
No.3670-1 - 2010/12/12 (日) 00:20:59 - みな
系統樹をフィギュアに追加するようにリバイスを受けました
かなり大きな遺伝子ファミリーなので
もともと精度の高いつまりブートストラップの高い系統樹を作成するのはかなり困難なのですが
少しでもよくしたいと考えています
しかしブートストラップの低い枝を除くと逆に上流の枝のブートストラップが悪くなるなどなかなか操作が難しい状況です
どうしたらいいでしょうか

そもそもブートストラップの低い部分が散在する系統樹はどのような評価を受けるのでしょうか

かなりダイバージェンスの激しい遺伝子ファミリーです

15件 ( 1 〜 15 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を