Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

適切な検定方法 トピック削除
No.5861-TOPIC - 2017/03/28 (火) 23:05:51 - p
実際のデータは別にあるのですが、
お聞きしたい内容をシンプルにお伝えするために下のような例を考えます。

男性と女性の2群があり、それぞれをさらに3群に分け、
類似の薬剤A、B、Cに対して効果を実感したかどうかという
アンケートをとるとします。

データとしては
    実感あり 実感なし
1.男ーA  3   28
2.女ーA 14   36
3.男ーB  6   31
4.女ーB 32    9
5.男ーC  3   30
6.女ーC 35    3
という結果が出たとします。

この場合に、
AーBーC間で効果を実感した人の割合に差があるかどうかを各性別で
(1 vs 3 vs 5, 2 vs 4 vs 6)
調べたいのですが、適切な統計手法がなにかわからず困っています。
具体的に言うと、データを見ると予想が付きますが、
男性ではABCどれも同程度で
女性ではAよりBCの方が有意に実感している。
且つ、男性より女性の方が有意に効果を実感しやすい。
というようなことが判定できる検定方法です。

単純に6群についてjs-STARのカイ二乗検定i×j表で行うことは可能なのですが、この方法だと6群をまとめたときの効果の実感の有無の期待値を出し、
その期待値と有意な差があるかどうかという検定になり、
厳密には意図するものとは違う検定になってしまいます。

別の方法として、効果の実感の有りを1、無しを0として値を設定して
男−Aから女ーCまでの平均値を出してtukeyで統計解析するのはどうかと
考えましたがそのような変換をしてよいのでしょうか。

統計に詳しい方のご助言をお待ちしております。
 
- このトピックにメッセージを投稿する -



20件 ( 1 〜 20 )  前 | 次  1/ 1. /1


(無題) 解決済み 削除/引用
No.5861-21 - 2017/03/30 (木) 08:56:25 - p
確かにHolm correctionであればA-Bがp値が2番目に低いので
0.025が有意水準となり、両側でもいけますね。
実は別の実験でHolm-Sidakを行っているものが複数あるので
Holmで揃えるのはなんの問題もありません。

少なくとも片側検定をする場合は、誰が見ても片側であることが自明であるか
明確な根拠を記載する必要があるという点で、確かにハードルが上がります。
100%片側でよいことを色々説明するよりは、両側検定を複数回するから
Holm correctionしましたよという方が
読み手が引っかかりにくいかもしれないとも思いました。

お二人のコメント、議論によって
取るべき道筋が見えてまいりました。
Fisher's exact testの両側検定を複数回行い、Holm correctionを行うという
今の私にとって最善と思える方法が得られましたので
ここで一旦締めさせていただければと思います。
大変勉強になりました。ありがとうございました。

(無題) 削除/引用
No.5861-20 - 2017/03/30 (木) 03:40:35 - おお
>片側でもいいと思います。
なるほど。そうゆうふうに見ればたしかにそういう感じはします。なかなか方がはでOKというには勇気が入ります。

(無題) 削除/引用
No.5861-19 - 2017/03/29 (水) 16:32:23 - AP
>実験内容としてはBやCのほうが実感する人が多いという結果を予想していたので片側でもいいとは思いますが、

どういう検定をするかはどういうどういうどういう検証しようとしているモデルとしてどういうものを想定しているかによると思うので、片側でもいいと思います。

>片側が0.0165でギリギリ有意、両側は0.0237で有意ではない

結局、有意水準をどこにするかは恣意的、便宜的な判定基準ですから、
p=0.01とp=0.02で全く別の現象が起こっているというわけでもないですよね。
100回に1回の現象が起こったら稀だとするか、50回に1回の現象が起こったら稀だとするかという話ですもの。
こういう調査では有意水準5%というのも受け入れられると思いますけど。

(無題) 削除/引用
No.5861-18 - 2017/03/29 (水) 16:15:57 - AP
>多重に関しては以下のURLでは必要と言ってます。

そうなんですね。
ノンパラの多重比較まで書いてるような高度な教科書は読んでないので、
Bonferroniはパラメトリックの方でしか馴染みがなかったです。
Bonferroniの補正が応用できるなら難しくなさそう(私の見てる教科書でも、ちょこっとでも触れていてくれたらいいのに)

(無題) 削除/引用
No.5861-17 - 2017/03/29 (水) 16:14:23 - おお
Holm step downで3つのとき一番ひくいp値は0.05/3、二番目に低いp値は0.05/2、三番目に低いp値は0.05/1を従来の0.05の水準とみなす。

最近は得られたp値を3つの検定をするときは3倍、2倍、1倍として(Bonferroniの場合はすべて3倍)、有意水準を0.05未満かどうかで判断する人のほうが多くなってきているのではとおもいます。

Holm step downでするなら、少なくとも論文中でHolm step downで統一できるものはそうしておいたほうがいいと思います。

(無題) 削除/引用
No.5861-16 - 2017/03/29 (水) 15:56:17 - おお
>[Re:14] pさんは書きました :
> >AP様、おお様

>
> A-C:両側、片側共に有意
> B-C:共に有意でない
> A-B:片側が0.0165でギリギリ有意、両側は0.0237で有意ではない


> 「片側両側問題」もなかなか悩ましい問題でもありますし。

Holm step downなら差が大きくないものに対してはゆるくなると思いますが、、、片側はちゃんと説明ができないと無茶だと思います。

(無題) 削除/引用
No.5861-14 - 2017/03/29 (水) 14:23:00 - p
>AP様、おお様

とても勉強になります。
AP様のご指摘は確かにそう思いますが、
おお様のURL先の情報も見た感じ信憑性がある気もしています。
私の所属先では元論文が読めなかったので詳細はわかりませんが・・・

試しに本当のデータで、bonferroniの補正(p<0.05/3=0.016666)
をかけてみました。

A-C:両側、片側共に有意
B-C:共に有意でない
A-B:片側が0.0165でギリギリ有意、両側は0.0237で有意ではない

というなんとも悩ましい結果でした。
実験内容としてはBやCのほうが実感する人が多いという結果を
予想していたので片側でもいいとは思いますが、
「片側両側問題」もなかなか悩ましい問題でもありますし。

丁度submit前ということもあり、
reviewerに投げてみるのも手かもしれませんね(苦笑)

(無題) 削除/引用
No.5861-13 - 2017/03/29 (水) 13:49:47 - おお
APさんありがとうございました。 m x n ができるという記述があったもので、、、調べているところでした。。。

多重に関しては以下のURLでは必要と言ってます。一つの意見として上げておきます。

http://www.biostathandbook.com/fishers.html
You could do a 2×2 Fisher's exact test for each of these pairwise comparisons, but there are 6 possible pairs, so you need to correct for the multiple comparisons. One way to do this is with a modification of the Bonferroni-corrected pairwise technique suggested by MacDonald and Gardner (2000), substituting Fisher's exact test for the chi-square test they used.

(無題) 削除/引用
No.5861-12 - 2017/03/29 (水) 13:17:08 - AP
うまく説明できてないかなあ、

平均値は標本ごとにバラつきのある値の代表値であり、個々の標本の値の違い、バラつきを内包している。だから、t検定の過重による問題も起こる。

ノンパラでは個々の標本の値は離散的(yes/no, A/B/C)に定まっているのでバラつきも誤差も関係ない度数で扱えばよくて、代表値で丸める必要がない(というか意味が無い)。

(無題) 削除/引用
No.5861-11 - 2017/03/29 (水) 13:04:19 - AP
>&#160;&#160;t&#160;検定
t検定

変なフォント使ったみたいで化けてしまった

(無題) 削除/引用
No.5861-10 - 2017/03/29 (水) 12:30:53 - AP
>その場合、いわゆる3群内で2群間のt-testを繰り返してはいけないという
>問題と同じにならないでしょうか。

数学や統計に詳しいわけじゃないけど、それは違うと思う。

&#160;&#160;t&#160;検定のようなパラメトリック検定は、平均値いう偏差や誤差を含む推定値を使っているわけだ。その上で、平均値士誤差という値同士を比較して例えば、片方が&#160;+誤差、もう一方がー誤差といった極端な場合でも有意差がでるか、確率的に起こりにくいことか起こりやすい分布か否か、という考え方をする。推定値同士の比較であるから、群が増えれば誤差が大きくなって判定を誤るというのは直感的に理解できる。

質問のような、種別尺度でノンパラメトリックな統計量では、母集団平均ののような推定値ではなく、誤差がありえない現に観察された要素をカウントした数なんだからそもそも誤差を含まない。推定された確率ではなく、現にデータが示す確率で判定するんだから。だからフィッシャーの「直接確率」検定とか「正確確率」検定とかいうんじゃないか?

>2 x 2だけじゃなくってm x nでもFisher exact testはできるみたいだから調べてみたら。

それはそうなんですけど、アウトプットはカイ自乗と同じことで、比較したいもの同士の情報は与えてくれないんじゃ?

(無題) 削除/引用
No.5861-9 - 2017/03/29 (水) 12:00:06 - おお
2 x 2だけじゃなくってm x nでもFisher exact testはできるみたいだから調べてみたら。

数値化はちょっと慎重にやらないと説得力ないと思う。

2 x 2で複数やるのは確かに厳密に言うと多重検定として扱うべきとも思いますが、どこまで厳密に見て指摘されるかはReviewer次第かもしれません。

(無題) 削除/引用
No.5861-8 - 2017/03/29 (水) 11:05:15 - p
>AP様
早速のご返信ありがとうございます。
やはり数値化はまずいですよね。

>比較を個々にFisherでもしたらいいと思う。
その場合、いわゆる3群内で2群間のt-testを繰り返してはいけないという
問題と同じにならないでしょうか。
bonferroniのように有意水準を検定数で割ったものを
実際の有意水準にするというような補正が必要な
気がしますがどう思われますでしょうか。

何度もお聞きしてしまい申し訳ありません。。。

(無題) 削除/引用
No.5861-7 - 2017/03/29 (水) 10:48:36 - AP
>やはり不連続な値で平均値を出すのはまずいでしょうか・・・

これは門前払いされるんじゃないか、

(無題) 削除/引用
No.5861-6 - 2017/03/29 (水) 10:47:29 - AP
>A-B, B-C, A-Cの比較をできればA-B間の差が有意だと言えるのではないかという
風に考えています。

この比較を個々にFisherでもしたらいいと思う。

(無題) 削除/引用
No.5861-5 - 2017/03/29 (水) 10:38:36 - p
>AP様
カイ二乗検定の場合、
女性全体でN=129で実感ありが81(62.7%), なしが48(37.3%)で
女性のA, B, C各群がこのパーセンテージから有意にずれているかという
検定になりますよね。
実際に検定すると実感ありの割合はAは有意に低く、B, Cは有意に高いという
結果になります。

私が解析したいと思っているデータは数値が微妙に異なっていて
(傾向はほぼ同じです)、これを解析すると
Aは有意に低く、Bは有意ではない、Cは有意であるという結果になります。
全体の期待値とA,B,Cを比較するのではなく、
A-B, B-C, A-Cの比較をできればA-B間の差が有意だと言えるのではないかという
風に考えています。

最初に提示したような数値(0と1)に置き換えると、平均値として出せるので
(例えば女-Aは0.28、Bは0.78、Cは0.92という感じです)、
SDも付き、統計も通常の方法で出来るのですが、
やはり不連続な値で平均値を出すのはまずいでしょうか・・・

(無題) 削除/引用
No.5861-4 - 2017/03/29 (水) 10:05:12 - AP
>男性ではABCどれも同程度で

男性だけのABC群間で検定


>女性ではAよりBCの方が有意に実感している。
女性だけのABC群間で検定

>且つ、男性より女性の方が有意に効果を実感しやすい。
ABC群ごとに男女間で検定

で、Fisherなりカイ二乗なりでいけそうな気がする。

(無題) 削除/引用
No.5861-3 - 2017/03/29 (水) 08:28:42 - おお
>この方法だと6群をまとめたときの効果の実感の有無の期待値を出し、
>その期待値と有意な差があるかどうかという検定になり、

ん、あっそうか。今言っていることがわかりました。

(無題) 削除/引用
No.5861-2 - 2017/03/29 (水) 01:27:06 - おお
カイ二乗検定はchi-squared distributionかどうかを見るわけだからそれでも良さそうな気がしますけど。。。だめかな。。。

Fisher exactで
1.男ーA  3   28
2.女ーA 14   36
これで差がないですから、

3.男ーB  6   31
4.女ーB 32    9
でFisher exactで差があるなら、Bでは感受性(感)に男女差で差があるといえますから、お考えのことは示せるのではないでしょうか。

https://en.wikipedia.org/wiki/Fisher%27s_exact_test#Example
https://en.wikipedia.org/wiki/Chi-squared_test#Example_chi-squared_test_for_categorical_data

適切な検定方法 削除/引用
No.5861-1 - 2017/03/28 (火) 23:05:51 - p
実際のデータは別にあるのですが、
お聞きしたい内容をシンプルにお伝えするために下のような例を考えます。

男性と女性の2群があり、それぞれをさらに3群に分け、
類似の薬剤A、B、Cに対して効果を実感したかどうかという
アンケートをとるとします。

データとしては
    実感あり 実感なし
1.男ーA  3   28
2.女ーA 14   36
3.男ーB  6   31
4.女ーB 32    9
5.男ーC  3   30
6.女ーC 35    3
という結果が出たとします。

この場合に、
AーBーC間で効果を実感した人の割合に差があるかどうかを各性別で
(1 vs 3 vs 5, 2 vs 4 vs 6)
調べたいのですが、適切な統計手法がなにかわからず困っています。
具体的に言うと、データを見ると予想が付きますが、
男性ではABCどれも同程度で
女性ではAよりBCの方が有意に実感している。
且つ、男性より女性の方が有意に効果を実感しやすい。
というようなことが判定できる検定方法です。

単純に6群についてjs-STARのカイ二乗検定i×j表で行うことは可能なのですが、この方法だと6群をまとめたときの効果の実感の有無の期待値を出し、
その期待値と有意な差があるかどうかという検定になり、
厳密には意図するものとは違う検定になってしまいます。

別の方法として、効果の実感の有りを1、無しを0として値を設定して
男−Aから女ーCまでの平均値を出してtukeyで統計解析するのはどうかと
考えましたがそのような変換をしてよいのでしょうか。

統計に詳しい方のご助言をお待ちしております。

20件 ( 1 〜 20 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。