Bio Technical フォーラム

  • 書き込みがかなり増えてしまいサーバーの負荷が大きくなったので、新しいBioTechnicalフォーラムに移行してください。
  • 新しいトピックは新フォーラムでのみ立ち上げ可能です。レスは2009年2月15日までつけられますが、その後は、つけられません。

トピック一覧 | 研究留学ネットに戻る

最新のフォーラム | このフォーラム(readのみ) | ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

n=3のときの統計処理 トピック削除
No.787-TOPIC - 2008/03/05 (水) 22:12:15 - 統計初心者
統計の詳しい方にお聞きします。
マウスの実験でn=3のときのデータを比較する時、unpaired-tを使用すると有意差が出ますがmann whitneyでは有意差が出ないことはよくありますが、mann whitneyはn=4以上の時しか使えないと考えてよいでしょうか。また対応のないn=3のデータ比較ではunpaired-tで検定するのが正しいのでしょうか。よろしくお願いします。
 
- このトピックにメッセージを投稿する -



10件 ( 1 〜 10 )  前 | 次  1/ 1. /1


失礼しました。 削除/引用
No.787-10 - 2008/03/10 (月) 10:24:29 - mom-a
間違えて途中で送っちゃいました。

ただ、それぞれの手法には適用するための前提条件があるわけで、あまりにもそこから外れているものは計算すれば答えは出るものの、出てきた答えに意味がなくなってしまいます。
(おおさんのおっしゃるように、場合によっては無理に検定しなくても、というご意見はごもっともだと思います。)

最近はこの辺のところに煩くなってきていて、特に動物実験の場合には多重性について指摘されることが多くなっているように感じます。

等分散性についてはサンプルの群間比較を行って(母集団の分散を推定していることになる)いる例もよくみかけますが、正規性の検定まではやらないのが普通だと思います。
少数例のサンプルから母集団を推定しても、皆様お考えのように大した精度ではありません。本来であれば母集団の分布を推定するためにそれなりのバックグラウンドデータを取らなければいけないのでしょうが、よほど特殊な場合以外は、過去の事例を参考にし、大抵の計量データは暗黙のうちに正規分布として処理されているのでは。

ただし、血中薬物濃度は「対数正規分布」するものとされているので、「対数変換後にt検定」することになっています。また、本来ノンパラメトリックなデータの場合、t検定を使うことで「有意差が出にくい」場合もあります。そういう意味で、『その分野でそのデータがパラメトリック、ノンパラメトリックのどちらで扱われているかに従う』ことを考えてみるのは一つの方法だと思います。あまり古い論文を参考にすると(現在の基準では)方法が間違っている可能性があるので、新しいものをみたほうが良いと思いますが。

ややこしくしちゃったかも 削除/引用
No.787-9 - 2008/03/10 (月) 10:00:39 - mom-a
ACさんの前2段落(つまり、Aさんのいってること)は理論的に正しいです。

>実際の統計処理で、「母集団が正規分布」し「2群の分散が等しい」って
のは個人的にはあまりない気もしますが。何れにせよ、統計処理なんてのは
物事の現象を解釈する手段のひとつに過ぎないんですが。

少なくとも、利用する側にとっては手段のひとつに過ぎないと思います。ただ、それぞれの手法には適用するための前提条件があるわけで、あまりにもそこから外れているものは計算すれば

ぬ? 削除/引用
No.787-8 - 2008/03/07 (金) 22:57:15 - AC
Aさん曰く。
「2群の違いを検出する場合、Mann-Whitney検定に
比べt検定のほうが違いを検出する力が強いからt検定が使えるのであれば
そちらがベター」

 結局、「t検定が使えるのであれば」ってことなので、これは
「母集団が正規分布」し「2群の分散が等しい」という時なので、
その時はt検定を使い、そうでなければM-Wということなんですよね?

 実際の統計処理で、「母集団が正規分布」し「2群の分散が等しい」って
のは個人的にはあまりない気もしますが。何れにせよ、統計処理なんてのは
物事の現象を解釈する手段のひとつに過ぎないんですが。

(無題) 削除/引用
No.787-7 - 2008/03/07 (金) 19:30:19 - A

> Studentのt検定は「母集団が正規分布」し「2群の分散が等しい」ことを
> 前提としているはずです。本来、パラメトリック(t検定)、ノンパラメ
> トリック(Mann-Whitney検定)のどちらを用いるかは母集団分布に依存
> するのであって、どちらの方が有意差が出やすいかで選ぶものではあり
> ません。

私は統計処理に詳しいわけではありませんが、mom-aさんがおっしゃる
ようにStudentのt検定は「母集団が正規分布」し「2群の分散が等しい」
ことを前提としています。ですから面倒なのですがt検定を行う前に
t検定を使うのが妥当かどうかを確認する必要があります。もしそうで
ない場合はMann-Whitney検定もしくは別の検定法を使うことになるかと
思います。

私の外国人の知り合いに数学科の統計学で修士号を取りその後医科学で
PhDを取り、現在某大学でバイオインフォマティックスを専門として
教授をしている人がいます。彼に一度「常にMann-Whitney検定を使えば
いちいち正規分布かどうかや2群の分散が等しいことを確認してt検定を
使うようなめんどくさいことをする必要ないのでは?」と聞いてみたことが
あるのですが彼の答えは「2群の違いを検出する場合、Mann-Whitney検定に
比べt検定のほうが違いを検出する力が強いからt検定が使えるのであれば
そちらがベター」なのだそうです。

(無題) 削除/引用
No.787-6 - 2008/03/06 (木) 13:37:53 - おお
統計に少しは明るいBiologist さんの意見が従来の統計という意味では正しいです。

n=3では正規分布という検証も出来ませんし統計上無理があると言うのはほんとですし、一方生化学、分子生物学の分野では多用されているのも事実です。ただその状況でどれを選ぶというと選択しとしてはt検定ぐらいしかないという程度のものです。検定はするものの統計に基づいて実験をデザインして有意に差があるので、両者に差があるという論法よりは、あプライできる(選択肢がないので)t検定しても、有意さがえられるといった論法でしかないものもが殆どだとおもいます。結局は再現性やバラツキを何らかの形で具体的にしめしたと言うのが本当の所なのかもしれません。

>unpaired-t
実験の性質上paired-tで計算できるのなら、それでもいいと思います。ばらつきを吸収できる可能性があります。


ノンパラでどれぐらいnがいるのかと言うのは分かりません。実験のバラツキなど性質によると思いますから。でも、扱っているもので得られるnに限界があるのでしたら統計の理屈を優先するより、扱える数でこなしていくしかないのではと思います。
まずn=6ぐらいでデーターを取ってみてはどうでしょうか、でバラツキ方などををみて、必要であればもう一度n=6でやってみて、データーを合わせれるような場合であればそれでノンパラ(これは分布がどうなっているかによっての選択になりますが)でやってみるとか。最初のn=6で平均値でそれなりに違いが出そうなら、n=3でもうなんかいかやるか、paired-tがあプライできるようなデザインにするかでpaired-tに持ち込むとかもありと思います。

正しい統計を基準におくと、実験上無理が生じることもありますので、実験のできる範囲で妥協できる検定法を選ばざるおえないことがたたある事も頭の片隅に入れておいて下さい。

場合にとっては統計の有意さは出なくてもいいかとも思います、いかにそのほかにもサポートできるデーターがあるかということも重要です。

最近勉強していないのですが… 削除/引用
No.787-5 - 2008/03/06 (木) 11:54:36 - mom-a
Studentのt検定は「母集団が正規分布」し「2群の分散が等しい」ことを前提としているはずです。本来、パラメトリック(t検定)、ノンパラメトリック(Mann-Whitney検定)のどちらを用いるかは母集団分布に依存するのであって、どちらの方が有意差が出やすいかで選ぶものではありません。ただ、ノンパラメトリック検定は検出力の点から考えてn=3では事実上無意味だと思います。ですので、おおさんのおっしゃるように計量値(連続データ)であれば分布の歪みは無視してt検定ですませてしまう(統計に少しは明るいBiologist さんのおっしゃるように少々の解析方法の適用間違いには寛容に)ことは実際良くあると思います。


なお、標本において正規性や等分散性の検定を行うのは、標本分布から母集団の分布を推定するという意味合いだと思いますが、少数例では推定精度が低いですから、あまり意味をなさないという人もいます。(それと、各実験によってパラメトリックだったりノンパラメトリックだったりころころ変わるのはいかがなものか、という意見もあります)十分なバックグラウンドデータを取れれば良いですが、その分野でそのデータがパラメトリック、ノンパラメトリックのどちらで扱われているかに従うというのも一つの方法だと思います。論文等でそのあたりをお調べになった上でお考えになるのが良いのではないでしょうか。

なお、ノンパラメトリックな検定をしようと思うと、よほどはっきり差がないと5例では厳しく、10例以上必要なのではないでしょうか。t検定で処理するようなデータの場合でしたら実験系にもよりますが、5〜10例程度という印象をもっています。
いずれにせよ、何例必要かは、2群の平均値の差の大きさとバラツキの大きさに関係します。むやみに例数を増やすのも、「差を出るまで匹数を増やしたのでは」と思われる可能性もあります。実験系によって一般的に使われる例数というのがあるでしょうから、そのへんも参考にされてはいかがでしょう。

(無題) 削除/引用
No.787-4 - 2008/03/06 (木) 10:21:59 - 統計初心者
>おおさん、統計に少しは明るいbiologistさんありがとうございます。
たしかにn=3の論文を見かけますが相当impressiveな結果の時だけですよね。
いずれにせよ対応のない2群のデータ比較ではnをできる限り増やして(最低n=5)、mann whitneyで比較するということですね。
当方KOマウスを使っておりnを増やすのには苦労しますが、がんばります。ありがとうございました。

(無題) 削除/引用
No.787-3 - 2008/03/06 (木) 04:49:19 - 統計に少しは明るいBiologist
統計学的観点から見れば,この場合の適用においてはどちらかと言えばMann Whitneyが正しくなります.有意差が出ないという結果がより正しい解釈です.

Studentのt検定は,本来サンプルが正規分布し,かつ群間の分散が同質である場合にt-valueがt分布することを有意差判断の指標にしていますので,n=3のサンプルで分布や分散の同質性を保証することは困難なため,解析には適していません.
Mann Whitneyはそのような分布,分散の前提に依存しない検定方法ですから,少数サンプルあるいは分布,分散に偏りがあるサンプルの解析に適しています.

統計学からみた場合は,そもそもn=3で有意差を求めようという発想自体がナンセンスなのですが,Biologyのほうでは実際よく見かけますよね.査読者も含めて統計学に明るい人が少ないということと,統計学的な有意性よりもBiologicalな有意性(発症した,死んだ,というような統計に頼るまでもないドラスティックな変化)を優先しているために少々の解析方法の適用間違いには寛容なのだろうと思っています.

ご自身のスタンスによっても選択する統計方法が変わるということです.
ちなみに,私ならもう少しサンプルを増やして(n=10〜20くらいには)t検定を適用したいと考える案件ですね.

(無題) 削除/引用
No.787-2 - 2008/03/06 (木) 04:11:28 - おお
mann whitneyはn=3ではnが小さすぎると思います。nが3程度の時はt検定を使うぐらいしか選択肢がありません。

>mann whitneyはn=4以上
4でも苦しいと思いますが、、、

n=3のときの統計処理 削除/引用
No.787-1 - 2008/03/05 (水) 22:12:15 - 統計初心者
統計の詳しい方にお聞きします。
マウスの実験でn=3のときのデータを比較する時、unpaired-tを使用すると有意差が出ますがmann whitneyでは有意差が出ないことはよくありますが、mann whitneyはn=4以上の時しか使えないと考えてよいでしょうか。また対応のないn=3のデータ比較ではunpaired-tで検定するのが正しいのでしょうか。よろしくお願いします。

10件 ( 1 〜 10 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を