Bio Technical フォーラム

  • 書き込みがかなり増えてしまいサーバーの負荷が大きくなったので、新しいBioTechnicalフォーラムに移行してください。
  • 新しいトピックは新フォーラムでのみ立ち上げ可能です。レスは2009年2月15日までつけられますが、その後は、つけられません。

トピック一覧 | 研究留学ネットに戻る

最新のフォーラム | このフォーラム(readのみ) | ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

31件 ( 21 〜 31 )  | 次  1/ 1. 2. /2


(無題) 削除/引用
No.2097-12 - 2008/10/23 (木) 22:06:49 - AP
>通りすがりさん

ひょっとすると、「恣意的」という言葉が「手前勝手に」とか、「自分の都合のいいように手を加える」、というような意味にとって引っかかったのかもしれませんが、そういう意味ではないです(単なる、arbitraryの訳語)。

>正確な例えとも言い切れませんが、例えば「P=0.01でA>B」という結果の解釈として、「もし同じ実験を100回したら99回はA>Bで、残り1回はA<BもしくはA=Bとなる」というのがわかりやすいかと。

解釈としてはそれで十分だと思いますし、その点は理解しているつもりです。

>そうでしょうか?実験者は実験する前にMethodsを作成しますよね?統計解析はMethodsですよ。実験データが出てから、その得られたデータに合わせて都合のよい統計解析を行う行為はいかがなものかと。捏造と言われても言い返せません。

統計解析をいじってどうこうしても良いという話をしてるのではもちろんありません。統計解析自体は手順の決まっている数学なので、出てくる値は動かせませんし、動かしてはいけないものというのは当然です。出てきた数字が何を示しているか、事実をどのように反映しているかということです。

>そして得られた結果が実験の目的(仮説・真実?)に沿うか否かDiscussionするのです。その実験者のDiscussionが公正で適したものか否かを論文審査で問うわけです。

P値は確率であり、それ以上でも以下でもないでしょう。どんなにディスカッションしても、それが100%正しい(あるいはあやまり)ということにはできないないですよね。論文審査する人(あるいは他の誰か)が有意水準の設定が公正かどうかなんて判断できるものでしょうか(もちろん、実験やデータ処理の手順に問題がないとして)。

また、あらかじめ有意水準を宣言してからやればいいというのが、推測統計の正しい運用なのかも私にはよくわかりません。ほんとうに違いがある群間でも、差が小さいとかサンプル数が多くとれないとかで、実際にやってみたらどうしてもP値が高めにでることもあるわけで。

平たく言うとP=0.1でも0.01でも、10%あるいは1%は違っているかもしれない、逆に言えば九割くらいは確実とか九割九分は正しいと予想できるというということですね。「P<0.01を意味のある差とする」と宣言したとして実験を初めたけれど、結局、データがP=0.05だったとしたら、95%の確率は捨てて無条件で意味がないとするのが正しいことですか?

>その通りです。それができないなら広く用いられている P<0.05にするのです。

それでは、納得のいく説明というのにはならないです。慣習に従いましたというだけで。有意とするP値のレベルが妥当かどうかは納得のいく「設定根拠」の説明ができるかできるかどうか次第という主張でしたので、どういう説明をすれば妥当性を確立できるのかというのが疑問でした。
それができないなら、

>従って、例えば、「P<0.1を意味のある差とする」と実験者が実験する前に設定し

じゃあ、なんで0.05や0.01、あるいは0.001ではないのかということになり、0.1を選んだというのは恣意的というほかないです。ここは0.01ではなくて0.1にするのが正しいのだというような説明は可能ですか?

AP様 削除/引用
No.2097-10 - 2008/10/23 (木) 19:29:02 - 通りすがり

> P値を先に宣言してからやればいいというのでは、根本的な解決にならないような。
> データからP値を出してから、それが妥当かどうかを検討するというのがあっても間違ったこととは思えないし、

そうでしょうか?実験者は実験する前にMethodsを作成しますよね?統計解析はMethodsですよ。実験データが出てから、その得られたデータに合わせて都合のよい統計解析を行う行為はいかがなものかと。捏造と言われても言い返せません。


>宣言したP値が妥当であるという納得のいく説明ができればよいといっても、そこが難しいのでは。

その通りです。それができないなら広く用いられている P<0.05にするのです。


>P値の意味するところは、結局、このサンプルサイズとデータでは、差があるかないかの判断が、どれくらいの確率で当たりかということで、その実験で出た差が、たまたま真実とは異なる、はずれくじを引いた結果である確率はどれくらいあるかということですよね。どれくらいの高確率なら、引いたくじは当たりであるはずと判断するか、実験結果が指し示すところが真実と一致しているはずと判断するか、線引きは恣意的にならざるを得ないと思いますが。

正確な例えとも言い切れませんが、例えば「P=0.01でA>B」という結果の解釈として、「もし同じ実験を100回したら99回はA>Bで、残り1回はA<BもしくはA=Bとなる」というのがわかりやすいかと。そして得られた結果が実験の目的(仮説・真実?)に沿うか否かDiscussionするのです。その実験者のDiscussionが公正で適したものか否かを論文審査で問うわけです。

AP様の言う「恣意的な線引き」とは何のことですか?Discussionという意味合いであればよいですが。

(無題) 削除/引用
No.2097-9 - 2008/10/23 (木) 16:21:07 - AP
>mom-aさん

御説、実感としていちいち納得です。
直感として明らかに差があると確信しても、データを計算してみたらたまたまP=0.06しかなかったというようなとき、「有意差はなかったので差はない」と結論するのが真実に近いとは言えないですから。94%の確率で差があるんだということが見えた方が、著者としても読者としても有益なことでしょう。

水準ぎりぎりのときに、nを増やしてなんとか差を出すとか、インチキくさい印象がありますが、サンプルサイズを大きくすれば、極端な話、全数調査すれば(それが出来ないからこその推測統計、確率論ですが)、たとえ差が小さくても厳然と差はあることになるので、けっしていけないことではないはずですよね。

>通りすがりさん

P値を先に宣言してからやればいいというのでは、根本的な解決にならないような。
データからP値を出してから、それが妥当かどうかを検討するというのがあっても間違ったこととは思えないし、宣言したP値が妥当であるという納得のいく説明ができればよいといっても、そこが難しいのでは。P値の意味するところは、結局、このサンプルサイズとデータでは、差があるかないかの判断が、どれくらいの確率で当たりかということで、その実験で出た差が、たまたま真実とは異なる、はずれくじを引いた結果である確率はどれくらいあるかということですよね。

どれくらいの高確率なら、引いたくじは当たりであるはずと判断するか、実験結果が指し示すところが真実と一致しているはずと判断するか、線引きは恣意的にならざるを得ないと思いますが。

そう考えると、P値の実数をいちいち書いた方がいいというのも、確率論に根ざしているのだからあたりまえ、というように思えてきました。

有意性 削除/引用
No.2097-8 - 2008/10/23 (木) 14:11:34 - 通りすがり
大切なのは、データの解析方法や有意性のP値を、実験する前に設定することです。

統計学的な有意性としては、P<0.05が一般的ですが、例えP<0.05という結果がでても、本質的に意味のある差なのか?ということはよくあること。その逆も然りです。

従って、例えば、「P<0.1を意味のある差とする」と実験者が実験する前に設定し、その設定根拠について納得のいく説明が出来るのであれば良いのではないでしょうか。

APさん 削除/引用
No.2097-7 - 2008/10/22 (水) 13:48:20 - mom-a
おしゃるとおりです。統計の専門家の意見が必要なところですが、私も個人的な知り合いがいませんし、きっとここを見ているような統計家はいないですよね。ということで、私が見聞きした範囲の情報でしかないですが、まぁないよりはましでしょうか。

>結果はなるべく加工しない一次情報で出した方がいいという意味でも。

私はこの点に納得がいったので、最近はこういう傾向にありますよ、というように人には話しています。全ての場合にあてはまるわけではないですし、分野にもよりますが、*をつける方法は今でも一般的であることも言っておきますが。

>つまり、p=0.011とp=0.009では*と**に分かれますが、実際問題としてはどちらも大差ない

>例えばp<0.01でも、p=0.005の群とp=0.001の群があったとし、その実数が提示されたとして、読み手はそこから何を読み取るのだろう

上で私は殆ど同値なものがたまたま境界線上にあることであたかもより良いような印象を与えてしまうののは好ましくないのでは、というつもりでした。(ついでにいうと、*の数が多いからといって「生物学的に」より良いとは限りません。)

下でAPさんがおっしゃるのはP=0.005でもp=0.001でも結果の生物学的な解釈に影響しないのだから、実数表記してもそんなに有用なのか?ということでしょうか(違ってたらすみません)。
この値であれば、(念のため、生化学などの分野でしたらと限定しておきます…他分野のことはわからないですから)どちらも変わらないと思います。p<0.001なら実数表記しない、と以前書きましたが、それはp値は小数点以下3桁目まで表記されることが多いためで、感覚的には1%以下はあまり問題にならない気がします。

むしろ、問題になるのはp値が大きい時だと思います。p=0.049なのかp=0.011なのか。サンプルサイズが小さいin vitroの実験では、前者の場合、再現良く有意差が出るか?少々不安です。しかも、妙にサンプルサイズ(いわゆるn数)が大きかったりしたら、有意差が出るまで数を増やしてやっとコレ?なんて。p=0.800なのかp=0.055なのか。p=0.800ならお話にならないですが、p=0.055くらいだと、検定の検出力は十分だったのか?サンプルサイズの設定が不適切だったのでは?とか。

これは書かない方が良いかもしれませんが…
p<0.05なのかp≦0.05なのか問題になったことがあります。p=0.050なんてありえるのか、とかp=0.051を四捨五入してp≦0.05にして*をつけるのは間違ってないか、とか。そのとき、その場にいた統計学の先生は「p=0.049でもp=0.051でも何が違うのか。それによって今後の対応が変わるとでもいうのか。」と言いました。

(無題) 削除/引用
No.2097-6 - 2008/10/17 (金) 00:02:28 - AP
拙い質問におつきあいいただきありがとうございます。

>[Re:5] mom-aさんは書きました :

>
> 数値を出した方が単純に情報量が多いということだと思いますが、有意水準5%,1%という区切りが恣意的だから、実数の方が良い、ということではないでしょうか。上手く表現できないですが、つまり、p=0.011とp=0.009では*と**に分かれますが、実際問題としてはどちらも大差ないですよね?

実数を出しておけば、間違いがないだろうというのは理解できます。書き手の線引きでフィルターがかかるより、結果はなるべく加工しない一次情報で出した方がいいという意味でも。

それでも、漠然とした疑問があるのは、真実、差がある群でもp値に高低はでる訳で、水準以下の中での高低がどれほどinformativeであるか、ということなんです。数学的、確率論的意味はわかりますが、生物学的意味というか、実験結果の意味づけとしてどれほどの重要性があるのか?
例えばp<0.01でも、p=0.005の群とp=0.001の群があったとし、その実数が提示されたとして、読み手はそこから何を読み取るのだろう、統計学者は何を期待して個々のP値を要求するのだろう、という疑問と言い換えてもいいです。
統計学の専門家がそう言うのだから、黙ってそれに従った方がいいというのではScientistらしくないですから、なぜ、どうしてというところが知りたいところです。

> t検定でしたら、Excelでもp値を出力します。JMPは中途半端にできていて、検定手法によってp値が出るものと出ないものがあります。私が使っているのはver.6ですが、t検定、Dunnett検定、カイ二乗検定など、大抵の検定ではp値が出ますが、なぜかTukey検定では出ません。謎です。

最近のソフトはp値を出してくれるのですね(私のはJMP ver. 5でした)。一般の統計学の教科書で勉強すると、t値やChi^2値から先、p値を導く計算式というのは出さずに、対応表を使うというのが染みこんでしまっているので、少々違和感があったのですが、慣れの問題でしょうね。でも、ソフトウェア頼みだとすると、持つものと待たざるものの格差がでるのかも。

(無題) 削除/引用
No.2097-5 - 2008/10/14 (火) 19:02:21 - mom-a
>多群の比較(たとえばコントロール対、複数ある実験区)の場合は、それぞれのp値を書くというのは現実的でなく、煩雑ではないでしょうか。クラス分けして、*でマークしたものはp<0.05とか、**はp<0.01とか表記したほうが現実的ではないでしょうか。

おっしゃるとおり、特にグラフ上の場合は、見やすさも問題になるでしょうから、ケース・バイ・ケースで良いのでは。ただ、複数の統計専門家に「p値そのものを表記する方が望ましい」と意見されたことはあります。

>だいたいからして、pが0.01以下なら意味があるとか、0.05以下なら意味があるとかいうのが恣意的なので、計算上の実数を挙げると信頼性が高くなるのかどうかも疑問です。

数値を出した方が単純に情報量が多いということだと思いますが、有意水準5%,1%という区切りが恣意的だから、実数の方が良い、ということではないでしょうか。上手く表現できないですが、つまり、p=0.011とp=0.009では*と**に分かれますが、実際問題としてはどちらも大差ないですよね?

>それと、t検定の時など直接p値を出すプログラムはあるのですか?
先に有為水準αを0.01とか0.05と決めて、t値からそれ以上か、それを下回るかを判断するのが普通ではないかと思うのですが(JMPでも直接確率は出なかったと思います)。

t検定でしたら、Excelでもp値を出力します。JMPは中途半端にできていて、検定手法によってp値が出るものと出ないものがあります。私が使っているのはver.6ですが、t検定、Dunnett検定、カイ二乗検定など、大抵の検定ではp値が出ますが、なぜかTukey検定では出ません。謎です。

(無題) 削除/引用
No.2097-4 - 2008/10/14 (火) 17:17:28 - AP
統計音痴です。どなたか解説していただけるとありがたいです。

二群の比較(たとえばコントロールと実験区)くらいなら、確率を直接表記するというのも可能ですが、多群の比較(たとえばコントロール対、複数ある実験区)の場合は、それぞれのp値を書くというのは現実的でなく、煩雑ではないでしょうか。クラス分けして、*でマークしたものはp<0.05とか、**はp<0.01とか表記したほうが現実的ではないでしょうか。
だいたいからして、pが0.01以下なら意味があるとか、0.05以下なら意味があるとかいうのが恣意的なので、計算上の実数を挙げると信頼性が高くなるのかどうかも疑問です。

それと、t検定の時など直接p値を出すプログラムはあるのですか?
先に有為水準αを0.01とか0.05と決めて、t値からそれ以上か、それを下回るかを判断するのが普通ではないかと思うのですが(JMPでも直接確率は出なかったと思います)。

統計の専門家は 削除/引用
No.2097-3 - 2008/10/14 (火) 15:39:19 - mom-a
実数を記載する方を好みます。そもそも、p<0.05、0.01などで段階的に区切って表記していたのは、p値を簡単に求めることができなかったからで、イマドキはソフトがp値を計算してくれるものが殆どですから。

ただし、UCさんのおっしゃるとおり、p<0.001より小さい場合は実数でなくてもp<0.001で充分だと言われます。

投稿規程などに規定があるなら、それに従うことになるでしょう。

Re: 削除/引用
No.2097-2 - 2008/10/10 (金) 21:47:15 - UC
こんにちは。
0.03程度であれば、P = 0.03 と明示したほうが良いように思います。3%の確率でたまたま起こる訳ですから。 P = 0.00053 とかなら、 P < 0.001 とかでも良いと思いますが。まぁ好みの問題やら投稿規程やらによるのでしょうが。

論文のP値の記載について 削除/引用
No.2097-1 - 2008/10/10 (金) 21:25:37 - 仮性統計
いつも参考にさせていただいております。
統計後のP値の論文の記載について教えていただきたいのです。

P<0.05という記載とP=0,03という実数を記載するのではどちらが良いのでしょうか?
P<0.05という風に記載していた場合に実際の値を出せという風に言われたりする場合などはあるのでしょうか

31件 ( 21 〜 31 )  | 次  1/ 1. 2. /2


パスワードを入力してチェックした記事を チェックした記事を