Bio Technical フォーラム

  • 書き込みがかなり増えてしまいサーバーの負荷が大きくなったので、新しいBioTechnicalフォーラムに移行してください。
  • 新しいトピックは新フォーラムでのみ立ち上げ可能です。レスは2009年2月15日までつけられますが、その後は、つけられません。

トピック一覧 | 研究留学ネットに戻る

最新のフォーラム | このフォーラム(readのみ) | ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

論文のP値の記載について トピック削除
No.2097-TOPIC - 2008/10/10 (金) 21:25:37 - 仮性統計
いつも参考にさせていただいております。
統計後のP値の論文の記載について教えていただきたいのです。

P<0.05という記載とP=0,03という実数を記載するのではどちらが良いのでしょうか?
P<0.05という風に記載していた場合に実際の値を出せという風に言われたりする場合などはあるのでしょうか
 
- このトピックにメッセージを投稿する -



31件 ( 1 〜 20 )  前 |  1/ 1. 2. /2


(無題) 削除/引用
No.2097-32 - 2008/10/27 (月) 02:15:41 - おお
>[Re:30] Kazuさんは書きました :
> かいつまんで言うと、統計は重要ですが、基礎実験の段階で、治験レベルのことをやっている人はいないと思うので、このレベルであれば、あまり統計の細かいところにこだわる必要はないと思いますということです。

私は他人がどうだからという人間でないので、もし必要と感じたらより
洗練された統計手法を使うと思います。仰られている治験での統計という
のは、察するに純粋に統計学として、高度というほかに、倫理的なものも
からめて言っているようなきがします。

試験管での実験やモデル動物の実験ならまだしも、生物学でしたら
野生動物を使っている場合もありますし、そうすると個体差は治験
並みのバリエーションがあるでしょうし、統計的にもあったものを
選んで感度をあげないととても話ができないと思います。いや、
治験は母集団を設定できますのでもっと楽かもしれません。

治験だから高度で基礎は使わなくて良いとは言わないでください。

あと、ブラインドでデーターを実験助手に出させて、それを処理するということは基礎でもあります。

>
> 余談ですが、実験精度の高さは日本の得意とするところなので、こういったところで、ちゃんとしたルールを作って世界に訴えてほしいものです。

そうしたいものですね。

(無題) 削除/引用
No.2097-31 - 2008/10/27 (月) 01:45:37 - yt
> 動物実験でダブルブラインド?? 面白い表現ですね(笑)

I guess he meant 'using two deifferent researchers, one for preparation of reagents to administer and the other for giving it to the animals and observing them to assess the effects of the reagents', and they do not share the information about which is real and which is placebo.

(無題) 削除/引用
No.2097-30 - 2008/10/26 (日) 18:08:51 - Kazu
かいつまんで言うと、統計は重要ですが、基礎実験の段階で、治験レベルのことをやっている人はいないと思うので、このレベルであれば、あまり統計の細かいところにこだわる必要はないと思いますということです。

余談ですが、実験精度の高さは日本の得意とするところなので、こういったところで、ちゃんとしたルールを作って世界に訴えてほしいものです。自動車産業も品質のよさで勝負している訳ですから。

(無題) 削除/引用
No.2097-29 - 2008/10/26 (日) 17:54:58 - 通りすがり
>[Re:28] Kazuさんは書きました :

また、ダブルブラインド、ランダマイズド、プロスペクティブスタディで動物実験を組むと研究費がいくらあっても足りないという問題もあります。


動物実験でダブルブラインド?? 面白い表現ですね(笑)

(無題) 削除/引用
No.2097-28 - 2008/10/26 (日) 17:21:34 - Kazu
市場原理主義では、結果を出さないと食べていけないし、逆にいい結果を出せば、いくらでも富と名声を手に入れることができるので、捏造をなくすことができないジレンマがあります。オリンピックでドーピングするのは当たり前で、それに対してWADAが検査を導入すると、その他の方法を考えてまたドーピングするのが人間です。テレビも視聴率至上主義なので、○る○る大辞典のようなことになるのです。このような世界で統計を真剣に議論するのは意味をなさないという考え方は、あながち的を外れていないと思います。データのいいとこどりは違反行為です。しかし、現時点では論文投稿既定で、動物実験であっても治験と同じように統計解析しなければならないという決まりはないような気がします(あれば教えてください)。だから12回実験やって、一番いいデータ4回分で統計解析するラボが出てくるのだと思います。これは倫理上の問題点です。

また、もし仮に、データに一切の手心を加えていないまじめな研究者がいたとしても、自分で統計解析したら、その時点でエビデンスレベルは下がります。だから、ほとんどの実験系では統計解析の信憑性を確保できていない(エビデンスレベルが低い)のが現状です。実験系を組み立てた人は一切実験にも、統計にも関与してはならないのが治験の理論です(このような実験は味気ないと感じるかもしれませんが)。だから、統計を真面目に学習したり議論するのは大切ですが、自分で実験して、データ解析している研究者が、自分の統計解析法は間違っていないと主張するのは、治験の世界ではありえない話なのです。また、ダブルブラインド、ランダマイズド、プロスペクティブスタディで動物実験を組むと研究費がいくらあっても足りないという問題もあります。

だからこそ世界統一で、捏造に対する検証システムが構築されて、実験系にどこまでの正確性を求めるかをクリアカットにすることが必要になると思います。しかし、論文の検証のためアクセプトまで5年くらいかかるような世界になったら、院生が卒業できなくなって困ります(泣)。

(無題) 削除/引用
No.2097-27 - 2008/10/26 (日) 14:57:47 - AP
>しかし臨床治験の領域で、ランダム化比較試験が確立し、この場合は基本的に恣意的なデータを排除するためたま様の仰るように症例を追加することはできません。しかし、これを研究論文に求めては科学の進歩が遅れてしまう可能性もあります。

臨床であろうと基礎であろうと、作為的にデータをとることは排除しなければならないというのは当たり前のことで、それが守られなければ推測統計の根本が崩れてしまいます。たとえデータを追加しようと、無作為であれば推測の精度が高まることはあれ、真の値(母集団が持つ統計値)と裏腹な結果が導かれることはないはずです。

意図的に偏ったデータを集める行為自体がアウトなはずで、科学以前、統計学以前の問題です。もし、データの追加を禁止する理由が「意図的なデータを排除する」ことにあるなら、科学的見地から禁じているとういうより、犯罪防止のような社会的な要請から来る縛り、人間の性に対する縛りと言うことだけということになります。
そういう面が、とくに利害がからむような場合、ないとは決して言えませんが、科学者、研究者の科学的・論理的な思考力が性悪説的に否定されていることになりそうで、それだけだけの理由だと認めるということは、自己否定をしていることになりそうではないですか。

パワーアナリシス(覚えたので、さっそく使ってみた)の場合は、一回の実験で、こういう現象のこの程度の差異をこの有意水準で検出できるようにという設定から逆算して、必要なサンプル数を決めているはずですね。論理的にものが考えられる人であれば、これで出た結論は、いくら追加データを追加したところで、精度を高めることはあっても、ひっくり返せるのだとは考えないでしょう。
もし、ひっくり返そうと思ってやる人がいたなら、論理的な思考ができないとか、artifactを拾っているような未熟な実験技術しかないとか、科学者のプライドを捨てて作為的な結果を出そうとしていると自ら認めるようなものです。

データの追加は禁止されているからやらないというのではなく、科学者としての論理性と自覚からそういうことをやろうなどとは考えないものだ、と信じたいです。

(無題) 削除/引用
No.2097-26 - 2008/10/26 (日) 14:54:55 - おお

> でもそれが現実です。例えばHarvard大学でたくさんRO1を複数持っているC人PhD(もちろん教授、JCIやScienceにも論文がでています)にずばり質問したことがあります。
> 「先生のラボでは何回実験を繰り返していますか?全部のデータの中には差が顕著のものや、逆に差が見えにくいものもあると思いますが、解析には全部を使っているのでしょうか?」
> 「例えば12回繰り返しました、当然反応には差があって、良く差が出ているのが4つ、少し差がでているのが4つ、差がないのが4つあったとします。そのときは、良く差がでている4つのデータを使います」

まいりました。
今度は、同じような質問して、同じような答えが帰ってきたら、あなたの論文は事実ではないのですねともう人押ししてやってください。

幸わたしは、自分が見たもの自分の結果から展開していく事の方が多いので、大きな損害はないですが、、、

よこやりすいません 削除/引用
No.2097-25 - 2008/10/26 (日) 14:20:01 - あだむやん
>[Re:24] おおさんは書きました :
> >[Re:23] Kazuさんは書きました :

> > 臨床と研究はまったく別物と思います。昔は研究論文は捏造が当たり前だったので、統計解析自体が無意味でした。
>
> そうなんですか、、、いつごろの話でしょうか、、、
おそらくkazuさんのいわれていることは正しいと思います。
なぜなら、今時EBMといわれている、そのEvidenceとして認められる論文とは、少なくとも1980年以降のものだけに限られていると思います。
それ以前の論文は、現在の世界の中ではEvidenceとしては認められない、ということになっているはずです。


> > 国内外のラボでは、いいデータのみ取ってきて統計解析している論文(すなわち再現性がない)がかなりあるようです。
>
> これも迷惑な話ですね、、、、
>
でもそれが現実です。例えばHarvard大学でたくさんRO1を複数持っているC人PhD(もちろん教授、JCIやScienceにも論文がでています)にずばり質問したことがあります。
「先生のラボでは何回実験を繰り返していますか?全部のデータの中には差が顕著のものや、逆に差が見えにくいものもあると思いますが、解析には全部を使っているのでしょうか?」
「例えば12回繰り返しました、当然反応には差があって、良く差が出ているのが4つ、少し差がでているのが4つ、差がないのが4つあったとします。そのときは、良く差がでている4つのデータを使います」
素直な人ではありましたが、まったく悪びれる風もなく、それが当然だ、という顔をして答えられました。(その場は15人以上が集まるDiscussionの場でしたので、1対1ではありません)どうりできれいなデータばかりでているな、とわかりました。それ以後、あまりそのラボの論文をまともに信じる気になりませんでした。ただ、3つをpick upするのではなく、4つ使うだけましですが(笑)
おそらくその教授は、grantのため、publicationにこだわっている人だと思います。そこには科学を探求しようという純粋な心がすでによごれているように感じました。
ほんと、迷惑な話です。迷惑な話で腹が立つより怒りを通り越してあきれてしまいますが、それが現実です。でも、そういうずるをなるべく人にさせないようにするために、そういうずるを自分が見抜けるようにするために、また逆に自分がずるをしていないということを人に信じてもらうためには、論文を読んだ万人が納得しやすいように、データをきちっと集め、統計的にもきちんと正しい方法で解析して差があるといっていいかどうかを確認し、自分の仮説を得られた結果をもとに粛々と解釈していくことが肝心だと思いますし、それが科学研究だと思います。いえ、信じています。

(無題) 削除/引用
No.2097-24 - 2008/10/26 (日) 13:24:11 - おお
>[Re:23] Kazuさんは書きました :
> 臨床と研究はまったく別物と思います。昔は研究論文は捏造が当たり前だったので、統計解析自体が無意味でした。

そうなんですか、、、いつごろの話でしょうか、、、

> 国内外のラボでは、いいデータのみ取ってきて統計解析している論文(すなわち再現性がない)がかなりあるようです。

これも迷惑な話ですね、、、、


> もちろん薬であれば最終的に治験で、その有用性が判定されるので、動物実験の段階で、そこまでシビアにやらなくてよいという考え方もありうると思いますし、

治験に金がかかるのに、いい加減な動物データーから治験をやってみようと思わないでしょうし、前臨床のデーターもそれぞれ方法論その他で縛りがありますけど、、、、

> 結論を言えば、現時点では研究論文における統計は、あまり意味がないような気がします(将来的に基礎研究にも治験レベルがもとめられるようになるかもしれませんが)。統計の勉強も重要ですが、何よりしっかり研究することが一番で、あまり統計のことで悩みすぎなくてもよいのではないでしょうか?

そうともいい切れないのではないでしょうか、、、、
はずれ値が、結構離れたところに出てくるデーターでは平均したりすると、さがあるのか分かりにくいですが、ノンパラの検出感度は見た目分かりにくくても有為差を出してくれますし、SNPsなどを使った連鎖解析の検出力は非常によくなり疾患の発症に関して非常に理解が進んできていますし、そう考えると統計しだいで今まで分からなかったことが見つけれるのではという期待も高いと思います。
確かにもっと基礎的なものになると、見た目で分かるぐらい差がないと、ということが多いですが。


p値についてほかでコメント書いてましたけど、しばらくこのとぴフォローしてなかったのですが、幾らかかぶったことが書かれてました(汗)

(無題) 削除/引用
No.2097-23 - 2008/10/26 (日) 12:25:24 - Kazu
臨床と研究はまったく別物と思います。昔は研究論文は捏造が当たり前だったので、統計解析自体が無意味でした。しかし臨床治験の領域で、ランダム化比較試験が確立し、この場合は基本的に恣意的なデータを排除するためたま様の仰るように症例を追加することはできません。しかし、これを研究論文に求めては科学の進歩が遅れてしまう可能性もあります。動物実験で各グループ700例ずつ必要ですと統計家にいわれても現実的ではないですよね。国内外のラボでは、いいデータのみ取ってきて統計解析している論文(すなわち再現性がない)がかなりあるようです。もちろん薬であれば最終的に治験で、その有用性が判定されるので、動物実験の段階で、そこまでシビアにやらなくてよいという考え方もありうると思いますし、捏造論文を排除するシステムを常に更新していかないといけないのは当然のことと思います。アメリカがよいとは思いませんが、研究にも市場原理主義を導入しているほうが競争力は強いようです。

結論を言えば、現時点では研究論文における統計は、あまり意味がないような気がします(将来的に基礎研究にも治験レベルがもとめられるようになるかもしれませんが)。統計の勉強も重要ですが、何よりしっかり研究することが一番で、あまり統計のことで悩みすぎなくてもよいのではないでしょうか?

(無題) 削除/引用
No.2097-22 - 2008/10/25 (土) 14:20:17 - yt

> 私は,かつて新薬の臨床試験に携わってましたが,試験する前にまずプロ
>トコール(研究目的,方法(例数,統計解析含む))を厚生労働相に提出し
>承認された後で初めて試験を実施します.試験結果が出てからの例数追加や
>統計解析の変更は不正行為です.あらかじめ設定しておいた方法に逸脱せず
>に遂行された結果に対して,有意差がつけば「薬が効いた」で有意差がつか
>なければ「薬が効かなかった」という世界です.
 
わたしも以前は臨床にいましたが、これと生物学の実験とは全く趣旨が違うものなので、「これ」を実験室で行う実験に当てはめるのはどうかと思います。
 
「十年百億」と言われるような新薬開発では「効く」か「効かない」かが企業にとっては非常に大きな分かれ目で莫大なカネが動くのですから、その1点について限りなくドライにシビアに決めるのは意味があることだろうし、変更を認めないというのは「お役所仕事」の観点からも理にかなってるのでしょう。治験と言うのは、薬効判断の指標によっては医者の主観によるところが多い場合もあるし、最悪の場合はデータの改竄もありうる、だから「結果が出た後の追加は認めない」と言うのは非常に理にかなったことだと思います。結果が明らかになった後に、莫大な損失を被るのを恐れた会社が医者を買収しないとも限らないですから。ただ、俗に言う「日本でしか使われない薬」代表的なところでは脳代謝改善薬とかがあるように、このやり方が必ず科学的な結論を導き出せるか、と言うとそうは思いません。

多くの研究者がやる研究では多くの場合は、1点についての「ポジかネガか」「統計の結果が出たらそこで終了」という趣旨ではなくて、パイロットスタディーに始まり、手持ちの結果から漠然とした仮説を立てて実験を行って、統計とってみて、そのデータをもとにもう一度考えて、仮説を棄却するなり新たな仮設を立てて、最終的には「どういう事象が背景にあるか」を追求するのが趣旨だと思います。だから、一番最初に「何回実験をしよう」と決めることもそんなに無いと思います。要は「自分や他人が納得するかどうか」が問題であって、コントロールとの差が明らかで再現性も間違いないと確信すれば3回くらいで止めるだろうし、差が微妙だったらそれ以上に何回も繰り返して納得したところで他人も納得できる形にデータに纏めて、それが何を意味するのかを考えて仮説を発展させていく、というのが一般的ではないでしょうか?

(無題) 削除/引用
No.2097-21 - 2008/10/24 (金) 19:59:47 - AP
聞きたいこと言いたいことがいっぱいあり、長文連投になってしまって我ながらはしたないと思いますが、ご容赦ください。

>ただの恣意的なガイドラインだと????

どうも恣意的ということばは印象がわるいようで。「作為的」ということではないですし、否定的な含みはないです(推測統計の前提は無作為性、ランダム性ですから)。ターミノロジーは建設的でないのでやめますが、通りすがりさんへのレスで言い尽くしています。

実験計画に沿って統計をとるのには、
・観察値にどれくらいの差があれば有効とする
・どのくらいのP値なら有効とする
(以上によって、自ずと必要な検出力やサンプルサイズ、ひいてはデータ処理の手法や検定法が決まってくる)
という前提が必要なものだと理解します。では、その前提を決めているのはなんですしょうか? それが正しい選択であると数学的に証明できるものですか。そうではなくて、期待や経験則や先例、あるいは人によって勝手なことをされては困る業界や役所が定めたガイドラインに基づいて、これくらいの確率なら正しいと認めて差し支えないだろうという線引き採用したのにすぎないのではないですか。証明不能で、他の選択肢も可能なのに、ある一つのことを選ぶ行為を恣意的といいます。

治験の時は、なるべく多くの人になるべく大きな効果が得られるものを検出するという意図で(それ自体はまっとうな目的設定)、小さいけれど確実に差がある可能性は捨てても、偽陽性が引っかかりにくく可能性の高いものだけを検出できるような条件を設定を選ぶものだと思います。そういう設定をして、この条件ならば真偽判定が達成できるはずの実験計画を立ててからやっているのだから、結果が仮説と違っていたら捨てるのは言われるまでもなくあたりまえだと思います。仮説に合わなかったから追加実験をするというのは、とんだマッチポンプで論理的でないし、ちゃんと判定できるはずの実験をやったのだから、何回繰り返そうが同じ結果に行き着くはずで、やるだけ無駄というものでしょう。

しかし、それは捨てたものには実用レベルの差がないというだけで、いかなる差もないということを意味しません。

もし、同じことを生物学者がやったとしたら、、、薬が効くか効かないか自体にはあまり興味がありません。その生物の属性は、すべての個体がその薬に反応することか、すべてではないが大部分か、まったく反応しないというのがそれであるか、いやほとんどは反応しないけれど、ごく少ない割合でも確実に反応するやつが存在していて、それもひっくるめてその生物の本態なのか、、、見極めることは意味があり、それが生物を理解を深める助けになると考えます。些少な差でもあれば検出できるような、あるいは小さいけれど確実に差があるものを捨ててしまわないような条件設定を選ぶ場合もあるわけです。

実験計画にそった統計(パワーアナリシスっていうんですか)を否定するわけではないし、これまでもそういう主張はしていないです(ただ、有意水準設定が妥当かどうかはディスカッション次第というところに疑いがあった)。むしろリスペクトしています。だけど、それこそが統計の王道でそれ以外はインチキみたいな主張をされるのには、あまりにタコツボ的で、非常に反感を覚えます。もともと、統計学は自然科学や社会科学を記載する方法として発展してきたのですから。

(無題) 削除/引用
No.2097-20 - 2008/10/24 (金) 18:47:46 - ami
脇で読んでいる人にもわかるようにかいつまんでわかりやすく説明していただけるとありがたいですどなたかお願いします。

Re: 削除/引用
No.2097-19 - 2008/10/24 (金) 15:49:36 - UC
こんにちは。

>試験結果が出てからの例数追加や統計解析の変更は不正行為でないと認識されていらっしゃったのですか? しかも統計理論とは別の話と?? 必ずしも一般化できないと??? ただの恣意的なガイドラインだと???? 正直驚きます.不正行為であることは一般認識と思われますが.

これは、いくらなんでも話が一般化されすぎていて言いすぎだと思います。統計は、飽くまで、事実に起こっている現象を見るためのひとつの手段に過ぎません。そりゃ、研究デザインの段階で、有意水準を決めてパワーアナリシスをやって、必要な例数を算出してやるのが理想だとは思いますが、実際の(例えば)生物現象を前にして、それが確かに起こっているのか、(パワーアナリシスをせずに)現実的なnを用意して傾向を見ることが、非科学的だとは到底思えません。

 場合によっては、n=5で見て、傾向がつかめなかったから、nを増やして、再検討してみても良いでしょう。これが不正行為というのは、個人的には同意しかねますが、統計関連は、フィロソフィーも絡んでくるので、自分がよしとする個人的見解に終始せざるを得ない気がしますね、分野が違うと統計デザインが大きく違ってくるのは当然ですし。

(無題) 削除/引用
No.2097-18 - 2008/10/24 (金) 15:20:55 - AP
>試験結果が出てからの例数追加や統計解析の変更は不正行為でないと認識されていらっしゃったのですか? しかも統計理論とは別の話と?? 必ずしも一般化できないと??? ただの恣意的なガイドラインだと???? 正直驚きます.不正行為であることは一般認識と思われますが.

薬の治験のように、効いたときと効かないときの値の差がこれくらいのものを見つけよう、その差を検出できる検出力を達成するにはこれだけのサンプル数を確保すればいい、そのサンプル数ならxx検定で検定できて、P値がこれより小さいものを有効としよう、という目的達成型の実験で実験計画がたつならいいですが、それだけがScienceではないでしょう。

たとえば、野生生物を採取して計測を行うとか、非常にまれにしか出現しない遺伝子型の個体を調べよう、と言うような場合はどうでしょう。
計測値にどれだけの差が出るのかも未知、サンプル数がどれだけとれるのかも運任せ、十分なサンプル数があればt検定が簡単だし受け入れやすいのでそうしたいところだけれど、とりあえず手持ちのサンプル数で可能な検定をしよう、サンプル数が少なくて検出力や検定の厳密さが不十分、足りない分は、来シーズンや次世代が生まれてから取って追加しよう(追加しないと、毎回サンプル数がたりないままだから)、、、、

一般認識とはかけ離れた、驚くべき不正行為なのでしょうか?

(無題) 削除/引用
No.2097-17 - 2008/10/24 (金) 14:04:49 - AP
>たまさん

誤解があるかものなと思っていましたが、

自分の思い通りの結果がでるまで、追加実験を繰り返して、いいところでやめればいいと言っているのではありません。差があるのかないのかはっきりしない微妙なP値であった場合、nをあげれば、どちらかはっきりする、なぜならサンプル数が多い方がより真に近い推測ができるのだから、ということです。サンプル数を増やしたら、差が「ない」ことがはっきりすることもあれば、「ある」ないことがはっきりすることもある、自分がどっちを期待していたかは関係なく、そこが明確になれば科学としては一歩前進です。

少ないサンプル数でP=0.049だったのが、サンプル数を増したら、0.020になるかもしれないし0.065になるかもしれない。サンプル数が多い方のP値の方が検出力が高くより真に迫っているというのは自明だと思います。

生物を相手にしていると、着目している現象を観察してみたら差が小さくて、当初の例数では差があるともないとも言えないということがあります。そういうときには、nを増やし検出力を高めて、どちらかはっきりさせことが必要になることもあるということです。
薬効のように、ある一定の検出力で一定の有意差がでないものは実用的でないから、危険があるから、相手にする必要がないというのとは違います。

それでもやはり、私は非科学的なおかしなことをいっているでしょうか。

(無題) 削除/引用
No.2097-16 - 2008/10/24 (金) 13:36:56 - たま
>[Re:15] APさんは書きました :
> >たまさん
> >「今回はたまたま有意差がでませんでした.確率論だから」という発想がでることが悲しいです.
>
> 有意差が出るかでないかが「たまたま」「偶然」の出来事だといったつもりは毛頭ないですが、どこがそう読めたんでしょうか。
> 「差がないときでも差があるという観察結果がでることが、ある確率で偶然起こる。観察結果がその偶然にあたってしまった確率はどれだけあるか」という「教科書的な」P値の意味をあらためて掲げただけす。

AP様の真意,よく理解できました.お詫び申し上げます.


しかし,「サンプル数の追加」を容認する表現は避けることをお勧めします.
すなわち,実験手順として例えば,n=5の実験を終了し,統計解析した後,例数の再検討(例えばn=10)が必要という「考察」に至った場合,今度は改めてn=10のプロトコールを立ち上げ,いちからやり直します.先のn=5の実験結果は採用できません.決してn=5の統計解析後にn=5を追加して計n=10の実験結果として扱う行為は容認しないでください.したがってAP様の下記のコメントは全く同意できません.


>試験結果が出てからの例数追加や統計解析の変更は不正行為としますというガイドラインを「恣意的に」定めただけでしょう(人間に与えるものならなおさら、学術的な意味とは離れても法令上のルールをもうけるというのはわかります)。それは統計理論とは別の話であり、必ずそうすべきだと一般化できるものではない、というのは同意していただけるでしょうか。

試験結果が出てからの例数追加や統計解析の変更は不正行為でないと認識されていらっしゃったのですか? しかも統計理論とは別の話と?? 必ずしも一般化できないと??? ただの恣意的なガイドラインだと???? 正直驚きます.不正行為であることは一般認識と思われますが.

(無題) 削除/引用
No.2097-15 - 2008/10/24 (金) 12:24:22 - AP
>たまさん
>「今回はたまたま有意差がでませんでした.確率論だから」という発想がでることが悲しいです.

有意差が出るかでないかが「たまたま」「偶然」の出来事だといったつもりは毛頭ないですが、どこがそう読めたんでしょうか。
「差がないときでも差があるという観察結果がでることが、ある確率で偶然起こる。観察結果がその偶然にあたってしまった確率はどれだけあるか」という「教科書的な」P値の意味をあらためて掲げただけす。

分野が違っても推測統計の本質が変わるわけではないでしょう。
全数調査できればどんな結果であれそれが「真」ですが、無制限のサンプルが出来るわけではないので何が「真」らしいか確率論で考えるということではないですか。

当然、差が小さくて計算すると有意差が微妙ということはあります。でも、サンプル数を増やすことで、差があるにしてもないにしても「真」に近づくことはできます。

ある治験薬で、100人のうち99人には効かないけれど一人には確実に効くとか、効果は非常に小さいけれどほとんどの人に効果があるとか、差が小さくて確率的に考えた「有意差」が出にくいということはあるでしょう。しかしこれでも、全く効果がない場合とは違いがあるというのが真であり、サンプル数がに制限がなければ「有意差」が出てくるはずです。ただ、そんなに差が微妙な効果しかない薬は使い物にならない、だから簡単に有意差が出るような大きな差があるものだけ相手にしましょう(通りすがりさんの「あらかじめ有意水準を決めておく」というのがそれですか)、試験結果が出てからの例数追加や統計解析の変更は不正行為としますというガイドラインを「恣意的に」定めただけでしょう(人間に与えるものならなおさら、学術的な意味とは離れても法令上のルールをもうけるというのはわかります)。それは統計理論とは別の話であり、必ずそうすべきだと一般化できるものではない、というのは同意していただけるでしょうか。

私は生物学プロパーなので、生物全体としては、あるいは集団全体としては何が真かというイデーに近づくための手段の一つが推測統計だと思っています。どんなに小さな差異であろうとそれが生物の本質であれば意味があり、見逃すべきではないと(あくまでも理想で、検出されることが困難な現象のほうがはるかにおおいのは間違いないですが)。

(無題) 削除/引用
No.2097-14 - 2008/10/24 (金) 10:46:36 - たま
たまたま拝見させて頂きました.
通りすがり様とAP様の熱い討論に肝銘を受けております.

客観的にみますと,お二方はおそらく専門が違うので,
大きくすれ違いがあるように思えます.

通りすがり様は文面から推察するに,統計解析の専門家という立場ではないのでは? 統計解析を利用する立場の方でしょう.したがって,通りすがり様は「公正な研究の取り組み方,取り組む姿勢(目的,方法,結果,考察,論文審査)」について正論を述べられている.通りすがり様は,「統計解析は研究結果を評価する手法」という観点より,実験する前に設定するものだと述べられている.実験方法は実験者が実験する前に自由に決めてよいので,もちろん統計解析の種類や有意水準についても実験者が最適だと主張できるものを自由に決めたらよい.ってことがいいたいのでは? そして,その実験方法(統計解析含む)が他論文と外れた方法だと論文審査で当然指摘を受けるだろうが,そこで「当実験方法は当研究にとって最適だ」ということを説明できればいいのでは?研究目的や内容によっては,有意水準をp<0.05以外に設定した方がbetterな場合もあると思う.無論その設定根拠に十分な説明が必要だが.

一方,AP様は統計解析の教科書的な理解はあるものの,生化学的実験等において統計解析を活用する本質を取り違われているように思う.AP様の文面に「たまたま」だとか「確率論」だとか「ほんとうは」とかという言葉が目立ちますが,宝くじやコインの裏表ならそれでいいでしょう.しかし,薬理学や生化学的実験等に用いる統計解析とは,研究仮説を公正に証明する絶対的な手法です.「今回はたまたま有意差がでませんでした.確率論だから」という発想がでることが悲しいです.

私は,かつて新薬の臨床試験に携わってましたが,試験する前にまずプロトコール(研究目的,方法(例数,統計解析含む))を厚生労働相に提出し承認された後で初めて試験を実施します.試験結果が出てからの例数追加や統計解析の変更は不正行為です.あらかじめ設定しておいた方法に逸脱せずに遂行された結果に対して,有意差がつけば「薬が効いた」で有意差がつかなければ「薬が効かなかった」という世界です.

(無題) 削除/引用
No.2097-13 - 2008/10/24 (金) 01:49:17 - AP
>>正確な例えとも言い切れませんが、例えば「P=0.01でA>B」という結果の解釈として、「もし同じ実験を100回したら99回はA>Bで、残り1回はA<BもしくはA=Bとなる」というのがわかりやすいかと。

>解釈としてはそれで十分だと思いますし、その点は理解しているつもりです。

なんて書きましたけれど、他の人からおしかりを受けるかもしれません。
みなさん重々ご承知でしょうけれど、念のためいうと、

P=0.01でA>B(片側検定として)とは、「A=Bが真」であった場合でも同じ実験を100回繰り返せば1回は検定したデータと同じデータがでるというのが正しいです。確率計算の基盤が、「A>B」がという結果が正しいと仮定したとき、たまたま「A<=B」の結果がでる確率はどれくらいかという話ではなく、「A=B」とした場合(帰無仮説とした場合)、たまたま「A>B」の結果が出る確率がどれくらいあるかということですね。
一瞬、裏を返せば同じことなのかも?とも思えますが、仮定の置き方が違うので全然意味が違うんでしょう。

「本当はA=Bなんだけれど、やった実験がたまたまA>Bの結果になる」可能性が確率Pだけあるということは、P値が小さければ、行った実験でたまたま誤ったA>Bの結果を得ただけだという可能性は低くなる、だからA<Bが真の可能性が高くなるというロジックですね。

で、くじのアナロジーですが、はずれくじの割合が高いほど、はずれを引いてしまう可能性が高くなる、はずれの割合がどれだけ低ければ引いたくじがはずれではないと確信できるかという話です。まさかはずれくじは引かないだろうと安心できるのが、100枚につき1枚のはずれなのか、100枚に5枚なのか、というのが有意水準だと思います。

でも、突き詰めて考えると、100枚のうち1枚がはずれというより、100枚すべてが確率0.01ずつはずれと考えるのが確率論としては正しいのかなあ、
P値の高低はあっても、どこかを境に真・偽をはっきり分けようとするのではなく、値に応じて真であると期待できる度合いがかわるだけととらえた方がいいのかなあ、だから、個々のデータについてP値の実数を示した方がいいということになるのかなあ、と漠然と考え始めています。

31件 ( 1 〜 20 )  前 |  1/ 1. 2. /2


パスワードを入力してチェックした記事を チェックした記事を