例数の話題は結構紛糾してしまうのですが…。私は検定で必要な例数は「求めたい(必要とされる?)差と実験の誤差の大きさ」から求まるもので、単純にn=3がダメでn=5や6なら良いというものではない、と教わりました。ですから、n=3で有意差検定が不可能とは思いません。ただ、結果の信頼度がどの程度あるか、というのはまた別の話ですし、結果の再現性についてはこれもまた別の話です。
BBBさんが「捨て難い」とおっしゃるのが、最悪捨てても論文としては(ちょっと価値が下がるかもしれないが)成立する…ということなら、散布図で載せて、エディターらが自分達と同じ判断をするかどうかみてみても…というのはダメなんですかね。
とりあえず、検定するとしましょう。動物実験データでは検定の多重性について厳しくいわれるようになっているので、BBBさんの場合は多重比較検定を行わなければならないと思います。
多重比較検定については、「統計的多重比較法の基礎(サイエンティストト社)」という本が詳しいです。が、この本に出てくる全ての方法が普通に使えるかというと、そうでもありませんが…。(多重比較の前に分散分析を行う人もいますが、私はこの本に従って分散分析しない派です。)
A,B,C,Dの4群とのことですが、調べたいのは1)〜3)のどれですか?
1)この中のどれか(例えばA)がコントロールで、AとB、AとC、AとDを比べたい。
2)全ての組み合わせを比べたい。
3)比べたい組み合わせが全てではないが、いくつかある。
1)の場合ならDunnett(ダネット)検定
2)の場合ならTukey-Kramer(チューキー=クレーマー)検定
あるいは、単にTukey検定と呼ばれることもあります
3)の場合なら、比べたい組み合わせ数によってBonferroni(ボンフェローニ)の方法で多重性を調整することになります。組み合わせの数によっては結局Tukey検定の方が検出力が良くなってしまうかもしれません。
いずれにせよ、多重比較検定の検出力は2群の検定に比べて低くなりますし、比べたい組み合わせの数が多くなるほど(表現が良くないですが)差が出にくくなります。n=3で4群総当りだと、よほど大きな差(そのくらい差がおおきければ、検定するまでもないかも、というくらい(笑))がないと統計的には有意差が出ないと思います。データを見ていないので、BBBさんのデータの場合がどうかはわかりませんが。とりあえず、一度計算して偉い人に見せてみてはいかがでしょう。 |
|