Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

トピック一覧 | 研究留学ネットに戻る

最新のフォーラム | このフォーラム | ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

マイクロアレイの検定について トピック削除
No.290-TOPIC - 2009/04/06 (月) 20:55:53 - test
こんにちは。マイクロアレイのデータを統計解析したいのですが、伺いたいことがあります。

データはA、B、Cの3群からなり、各群は10個体あります。すべての個体について10000個の遺伝子の発現状態を調べ、各群で有意に異なっている遺伝子を検出したいと思っています。
このとき、遺伝子ごとに正規性と等分散性をShapiro-Wilk検定とBartlett検定で確認してからt検定の種類を決定すべきでしょうか?論文を読んでいると、正規性や等分散性についての確認は行わずにt検定を行っているものが多いと感じましたが、各群10個体あれば正規性と等分散性があると仮定して問題ないのでしょうか?
もし正規性と等分散性の検定をすべきとすると、10000回の検定を行うため、Bonferroniの方法などでp-valueを補正して検定しなければならないのでしょうか?
それとも、こういう話は投稿するジャーナルやレヴュアーによって考え方が異なり、クレームをつけられたときに考えれば良いのでしょうか?

どなたかご教授宜しくお願いします。
 
- このトピックにメッセージを投稿する -



8件 ( 1 〜 8 )  前 | 次  1/ 1. /1


Re: 解決済み 削除/引用
No.290-8 - 2009/04/08 (水) 20:59:04 - test
みなさん、いろいろな情報ありがとうございました。
焦らずに勉強していこうと思います。

Re: 削除/引用
No.290-7 - 2009/04/08 (水) 00:12:19 - UC
あ、追記ですが、先ほどの論文
Ranking analysis of F-statistics for microarray data
によると、小さいサンプルサイズでは、SAMより、こっちが
ずっと良いよと言ってますね。

Re: 削除/引用
No.290-6 - 2009/04/07 (火) 23:55:52 - UC
こんにちは。
>正規性なし等分散性なし→?何の検定を使えばいいのでしょうか?
実は小生も知らないのですが、
http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html
によれば、事前検定なしにWelchで行くのが良さそうです。
この場合は、2群間での比較ですが、このページの最後に
3群間でもWelchが良いと書かれていますね。

1万個の遺伝子に対して、事前検定をして、違う統計手法
って、かなり大変じゃないですか。そのために、SAMなど
マイクロアレイに対するいくつかの手法が出てきたと思い
ます。そもそも事前検定は、好ましくないという傾向にあ
るようですし。

ところで、SAMって多群間比較には使えるのか微妙ですね。
まぁ単純に、Bonferroniの補正を3群間にかければ良い気も
しますが。

以下のリンク先にある、
http://www.iu.a.u-tokyo.ac.jp/~kadota/r.html

Ranking analysis of F-statistics (RAF)
(Tan et al, BMC Bioinformatics, 2008)
も良さそうですね。この場合、多群間でサンプルサイズも
小さいので。

>サンプル数が少ないにもかかわらず、すべての遺伝子を
>画一的な統計手法で処理することに疑問を感じています。

結局のところ、統計は手段な訳ですが、すべてに適合する
手法は、知られていないと思います。あなたの実験に対して
どの手法が、一番、検出力が高く、かつ誤検出も少ないかを
考えて、それを実行すれば良いと思います。ひとつの手法で
不安なら、複数の手法を「画一的に」実施して、その中で共通
してランクの高い遺伝子を抽出するというのもありかと思います。

Re: 削除/引用
No.290-5 - 2009/04/07 (火) 21:45:19 - test
mom-aさん
「t検定は、各群の個体数(サンプルサイズ)が等しい場合、正規性や等分散性が乱れていても頑健である」確かに聞いたことがあるような気がします。貴重な情報ありがとうございます。
FDRは名前は聞いたことがあるのですが、古典的な統計学の文献にはあまり登場してこないので、使い方がよくわからないです。早速調べてみます。
論文はアクセプトされたらOKなところがありますが、自分の基本方針はもつ必要がありますね。レレヴュアーを説得するためにも理屈は必要ですし。

UCさん
SAMですか。新しい統計パッケージは使い方を理解するのも大変ですが、勉強してみます。
ところで遺伝子ごとに正規性と等分散性を検定して、
正規性あり等分散性あり→等分散を仮定したt検定
正規性あり等分散性なし→ウェルチのt検定
正規性なし等分散性あり→マン・ホイットニー・ウィルコクソン検定
正規性なし等分散性なし→?何の検定を使えばいいのでしょうか?
このように遺伝子ごとに用いる検定手法を混在させても良いのでしょうか?
サンプル数が少ないにもかかわらず、すべての遺伝子を画一的な統計手法で処理することに疑問を感じています。

Re: 削除/引用
No.290-4 - 2009/04/07 (火) 17:30:24 - UC
こんにちは。FDRの話が出ていたので。
やや古めの論文ですが、2001のTusherのSAM (Significance analysis of microarrays)は、このFDRを活用しています(Pubmedで「SAM Tusher VG」で検索すれば出てきます)。彼の方法は、t-検定がベースですが、外れ値の影響を受けにくい設計になっていて、またpermutation testも使っているので、比較的小さなサンプルサイズでも、頼もしい気がします。
フリーの統計ソフトRには、このSAMのライブラリーもありますし、過去のフォーラムに、有用なマイクロアレイ解析関連のRのサイトも挙げていたと思います。

 P.S. 個人的には、高々10個のサンプルサイズで正規性の検定は、心許ないと思います。そもそもの母集団分布が、正規分布しているであろうことが予想されるなら、気が楽ですけどね。

追加 削除/引用
No.290-3 - 2009/04/07 (火) 13:21:35 - mom-a
>それとも、こういう話は投稿するジャーナルやレヴュアーによって考え方が異なり、クレームをつけられたときに考えれば良いのでしょうか?

実際問題としてそういう部分は確かにあります。とはいえジャーナルが変わるたびに言われるままに解析方法を変えてしまうと、後で自分の仕事をまとめようとしたときに整合性が取れなくなってしまうことにもなります。
自分の基本方針というものは持っていた方がいいと思います。

(無題) 削除/引用
No.290-2 - 2009/04/07 (火) 12:18:00 - mom-a
>正規性や等分散性についての確認は行わずにt検定を行っているものが多いと感じましたが、各群10個体あれば正規性と等分散性があると仮定して問題ないのでしょうか?

この場合は、「t検定は、各群の個体数(サンプルサイズ)が等しい場合、正規性や等分散性が乱れていても頑健である」ことを前提にしているのだと思います。

>もし正規性と等分散性の検定をすべきとすると、10000回の検定を行うため、Bonferroniの方法などでp-valueを補正して検定しなければならないのでしょうか?

正規性と等分散性の検定をしないとしても、t検定を10000回行うことになるわけですが、かといってBonferroniの方法で補正すると、有意水準5%にするにはp<0.000005でなければならないわけです。もちろんそれでも差が出るものだけを拾う、という方針を否定はしませんが、どうでしょうか。
DunnettやTukeyの方法はFWE(Family wise error)を制御する方法ですが、マイクロアレイデータなどでは、これらとは異なる、FDR(False Discovery Rate)を制御する方法が有用だと聞いたことがあります。こちらの関係をお調べになるとよいと思います。私はこの方面には詳しくないので…

マイクロアレイの検定について 削除/引用
No.290-1 - 2009/04/06 (月) 20:55:53 - test
こんにちは。マイクロアレイのデータを統計解析したいのですが、伺いたいことがあります。

データはA、B、Cの3群からなり、各群は10個体あります。すべての個体について10000個の遺伝子の発現状態を調べ、各群で有意に異なっている遺伝子を検出したいと思っています。
このとき、遺伝子ごとに正規性と等分散性をShapiro-Wilk検定とBartlett検定で確認してからt検定の種類を決定すべきでしょうか?論文を読んでいると、正規性や等分散性についての確認は行わずにt検定を行っているものが多いと感じましたが、各群10個体あれば正規性と等分散性があると仮定して問題ないのでしょうか?
もし正規性と等分散性の検定をすべきとすると、10000回の検定を行うため、Bonferroniの方法などでp-valueを補正して検定しなければならないのでしょうか?
それとも、こういう話は投稿するジャーナルやレヴュアーによって考え方が異なり、クレームをつけられたときに考えれば良いのでしょうか?

どなたかご教授宜しくお願いします。

8件 ( 1 〜 8 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を