Bio Technical フォーラム

  • 書き込みがかなり増えてしまいサーバーの負荷が大きくなったので、新しいBioTechnicalフォーラムに移行してください。
  • 新しいトピックは新フォーラムでのみ立ち上げ可能です。レスは2009年2月15日までつけられますが、その後は、つけられません。

トピック一覧 | 研究留学ネットに戻る

最新のフォーラム | このフォーラム(readのみ) | ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

データの捏造 トピック削除
No.2640-TOPIC - 2009/01/13 (火) 22:04:07 - けん
ある実験に関して3回の比較を行って、差を見出したのですが、
論文に掲載する場合はどの試行を使ったらよろしいのでしょうか。
詳細は省略しますが、その差は、非常に顕著なものではないのですが、
確実に存在しています。
飛んだ値の少ない、ある程度整ったデータを載せたい気持ちはありますが、
この考え自体がグレーゾーンな気がします。
どのように判断したらよろしいんでしょうか。
3回の比較はそれぞれn=50になっています。
チャンピョンデータの捕らえ方に戸惑いを感じます。
 
- このトピックにメッセージを投稿する -



16件 ( 1 〜 16 )  前 | 次  1/ 1. /1


Re: 削除/引用
No.2640-16 - 2009/01/17 (土) 11:04:22 - UC
 情報が少なくて何ともですが、細胞内のある物体の位置情報に関して、WtとMutantの比較をしたら、どうも差がありそうだと。n=20だと有意水準に近付き、n=50だと、P値が有意水準以下になった(nは観察した細胞の数ですか?)。それなら、n=100にすれば良いのではないでしょうか。本当の現象なら、よりP値も小さくなるでしょう。単なるばらつきであれば、nを増やしても、微妙なP値でしょう。もし、3回やって、十分に小さいP値を得るのであれば、その中の代表的なデータを示す、でなんら問題はないと思います。勿論、自信を持って、エラーバーで3回の試行平均を載せても良いでしょうけど。

 探索的な基礎実験で、nを増やすことである現象の確証を得るということは、個人的には問題ないと思います。

 データの分布によって統計手法も違ってくるでしょうけど、ある物体の位置情報って、普通に正規分布しそうですね。

 いずれにせよ、統計の専門家に相談するに一票です。

(無題) 削除/引用
No.2640-15 - 2009/01/16 (金) 21:03:44 - mom-a
>議論が統計処理の方向に移っているようなので参考にならないかもしれませ>んが、やはりばらつきの原因を追究することはできないのでしょうか。
>例えば
>
>>[Re:11] けんさんは書きました :
>> n=20程度では、しっかりとした優位差を出せない
>> といいましたが、
>> もちろん傾向はあります。
>>
>> ただmutantと同じようなロットが偶発的に出てきてしまうことがありま
>す。
>
>とのことですが、逆にmutantがWTと同じような局在を示すことはないのでし>ょうか?

IRESさんのおっしゃることはごもっともだと思いますが、「ばらつきの原因」を検討するとしても、やはり統計を専門にしている人に相談した方が良いように思います。

例えば、けんさんのおっしゃる「n」は何を指しているのかわかりません。細胞を培養したディッシュの数なのか、細胞の数なのか、「ある物体」の位置を測定した数なのか、1細胞から複数のデータが取れるのか、1枚のプレパラートからか、顕微鏡の1視野からか…。「ロット」という言葉も何を指しているのか気になります。

データもどのようなデータで、どう処理しているのかわかりません。
>位置を角度とかで数値化して出すのか、
>あるエリアにある頻度をだすのか、
>WTとMUTで正常位置にある数、異常な位置に
>ある数をもてめてχ2じょう検定に持ち込むのか
>生のデーターをみて、じっくり示したいことと
>処理の仕方を考えてみるのもてかもしれません。

実験方法やデータ処理の方法によっては、「差がある」と思っていたものが単なる「偏り」であることも、あり得ないことではありません。

統計に詳しい人に相談し、そのあたりを踏まえた上でIRESさんのおっしゃるように新たな検討が必要かどうか考えられたら良いのではないでしょうか。

(無題) 削除/引用
No.2640-14 - 2009/01/16 (金) 19:19:35 - IRES
議論が統計処理の方向に移っているようなので参考にならないかもしれませんが、やはりばらつきの原因を追究することはできないのでしょうか。
例えば

>[Re:11] けんさんは書きました :
> n=20程度では、しっかりとした優位差を出せない
> といいましたが、
> もちろん傾向はあります。
>
> ただmutantと同じようなロットが偶発的に出てきてしまうことがあります。

とのことですが、逆にmutantがWTと同じような局在を示すことはないのでしょうか?

もしないのであれば、WTが何らかの状況下でmutと同じ挙動を示すと解釈できるのではないでしょうか?それを示す新しいデータをとるかディスカッションするなどの対応もあるように思いますが...そのような対応の結果であるのであればご容赦ください。

(無題) 削除/引用
No.2640-13 - 2009/01/15 (木) 15:41:05 - おお
難しいですね。でもデーターの扱い方にも注意を払った方が
いいかもしれません。

位置を角度とかで数値化して出すのか、
あるエリアにある頻度をだすのか、
WTとMUTで正常位置にある数、異常な位置に
ある数をもてめてχ2じょう検定に持ち込むのか
生のデーターをみて、じっくり示したいことと
処理の仕方を考えてみるのもてかもしれません。

統計は優位差がいい方法を選べば良いというのは
間違っています。今やっている統計処理に行き着いた
経緯はなんなんでしょうか?

専門家に相談すべきです。 削除/引用
No.2640-12 - 2009/01/15 (木) 15:21:31 - mom-a
>優位差をいかにうまく見せるかを検討していますが、この選択自体が恣意的なデータの解釈とも取れる気がしてきました。

仮説を証明するための検定は、本来実験計画時に決定されているべきもので、後から色々な検定をやってみて有意差が出るものを選ぶことは「後付け」と呼ばれ、統計を専門とする人々からは忌み嫌われます。
とはいえ、基礎研究などの分野では1つ1つの実験が最終的な「検証」というより試行錯誤の段階に近い、いわゆる「探索的」であるので、データを取ってみてからの変更もある程度は許容せざるを得ません。
とはいえ、「差がつくから」変更するのではなく、「理論的にこちらの方が適切である」べきでしょう。

差が大きければ、検定手法がどうこういわずともデータを見れば納得してもらえるかもしれません。が、差が小さいとなるとコトはそう簡単にはいきません。

ここで細かい実験条件、データの割付方法、得られたデータの分布などなどを説明なさるのは難しいでしょうし、そこまでしたからといって正しい答えが得られるとは限りません。しかし、正しい解析方法を知るには、おそらくけんさんが思っているよりも詳しい情報が必要です。
大学なら学内をあたって統計に詳しい人に相談すべきです。大学中探せば一人や二人いるか、あるいは誰かを紹介してもらえるでしょう。企業などでふさわしい人がいなければ、データ解析を請け負ってくれるところへ外注してもらっても良いかもしれません。

n=50を3回も繰り返し、しかも「重要」と思われるデータを得たのですから、無駄にしてはもったいないです。

(無題) 削除/引用
No.2640-11 - 2009/01/15 (木) 13:05:48 - けん
n=20程度では、しっかりとした優位差を出せない
といいましたが、
もちろん傾向はあります。

ただmutantと同じようなロットが偶発的に出てきてしまうことがあります。

(無題) 削除/引用
No.2640-10 - 2009/01/15 (木) 13:01:47 - けん
実験はWTとmutantの比較になっていますので、
毎回WTとmutantを観察している状況です。

(無題) 削除/引用
No.2640-9 - 2009/01/15 (木) 13:00:12 - けん
みなさんありがとうございます。
細かい内容はご説明すると長くなってしまうので省略しますが、
細胞内におけるある物体の位置を測定しています。

しかしかなり大きなばらつきがあり、
お世辞にもきれいとは言いがたいデータになってしまいます。
優位差があることは間違いないのですが、
たとえばn=20程度では、しっかりとした優位差を出せない実験になっています。確率の問題です。
しかしデータとしては重要な意味を持つので論文に出したいと思っています。
同じデータでもグラフの種類や統計データの算出方法によって大分印象が違う状況なので、そのあたりも検討中です。
優位差をいかにうまく見せるかを検討していますが、
この選択自体が恣意的なデータの解釈とも取れる気がしてきました。
なかなか難しいですね。

技術的な部分の向上はほぼないと思われます。

(無題) 削除/引用
No.2640-8 - 2009/01/15 (木) 11:42:02 - mom-a
どういう実験なのか全くわからないのでなんとも言い難い部分がありますが。n=50で3回試験を行った結果は、毎回同様の結果で少ないながら各回のデータでは有意差はあった、という解釈でよろしいのでしょうか?その上で、論文用のデータとして「一番データがきれいに揃っているものを選ぶ」のか、それでは恣意的になるので無作為に、あるいは最新のデータを選ぶ、などの方法を取るべきか、というのがご質問の主旨と解釈してよろしいでしょうか?

技術的な問題で回を追うごとに実験精度が向上しているのなら最後のデータを使って良い気もします。が、せっかく3回も試験をして再現性を確認しているのなら、全部のデータを出した方が良いように思います。

ではどうするか、というのは色々やり方があるでしょうし、サプリメントに全データをつけるという方法があるなら、図の方はチャンピオンデータでも何でも良いような…。

ただし、単純に各実験の平均値をとってn=3にする、というのは個人的にはお勧めしません。以前おおさんのトピックで取り上げられたJCBの論文では確かにそのように読み取れるやり方をしていましたが、duplicateやtriplicateとは状況が異なります。
どのようにデザインされた実験かわかりませんが、枝分かれ型分散分析など、複数回にわけた実験データを併合して解析する手法はありますから、統計に詳しい人に相談してn=50×3回のデータを全部使って解析することをお勧めします。

(無題) 削除/引用
No.2640-7 - 2009/01/14 (水) 20:00:19 - HA
たぶん、この辺は細胞生物学系のがかなり厳しいですね。JCBでは統計処理は"representative data"内のreplicateではなく、全部のデータに基づくようにということを要求しています。これは、以前、ここで議論になっていたような記憶があります。きれいな正規分布ではなく、飛び値が出るのは生物では普通にあることでまたそれなりの意味がある可能性もあり、むしろ特に個体では、全部揃ってるのも変なもののように感じます。中央値を用いればいいのではないでしょうか。かなりのばらつきの中に、ある傾向があることを統計処理で示せれば良いと思いますよ。

画像の場合、全部の生データの提出がJCBではsubmnissionのときに求められます。representativeというのはだめですよ、ということかな。画像でない数値データの元データは、submissionの時点では求められていないと思いますが、JCBでもNCBでもreveiwerによっては要求される場合があります。

(無題) 削除/引用
No.2640-6 - 2009/01/14 (水) 19:47:45 - IRES
基本的には3回の施行の平均値にerror barが基本なのはご理解されていることと思いますが、それが出来ない原因は回避できないのでしょうか?
手技の問題、アッセイシステムの問題、個体差様々な原因があって、それぞれに対処に仕方は違うと思います。ただ、どのようなものなのか分らないので安易にコメントすることにためらいを感じます。

(無題) 削除/引用
No.2640-5 - 2009/01/14 (水) 19:25:44 - おお
>[Re:4] JKさんは書きました :

> ちなみにどこの雑誌かご存知ですか?
>

すみません、うわさを聞いただけです、、、、
確証のないコメントでした、、、、、

横槍で、、、 削除/引用
No.2640-4 - 2009/01/14 (水) 18:29:12 - JK
-最近では、生データーとその計算をしたエクセルシートを
サポートインフォメーション(サプリメント)に
公開しなさいということもあるそうです。

ちなみにどこの雑誌かご存知ですか?

(無題) 削除/引用
No.2640-3 - 2009/01/14 (水) 03:32:03 - おお
全部載せればいいのではないですか?
バラつくことがあるということに何か見いだせるか
という視点ではチャンピオンデーターだけ見せるのは
確かに情報を削って出しているといえますが、
あなたの論点は何かにもよってきます。表にするのか
どうかよく分かりませんが、図を作るなら、
チャンピをんデーターを図にして、テーブルで
3回のそれぞれの平均値とかSD/SE値P値を書いておけば
、正直かと思います。
最近では、生データーとその計算をしたエクセルシートを
サポートインフォメーション(サプリメント)に
公開しなさいということもあるそうです。
個人によっていいかどうかは、判断は異なるでしょうけど
正直なところを載せたいと言う気持ちであれば、それを
考慮したデーターの示し方をしたらいいかと思います。

ま、スキル的なことで毎回数を重ねる度によくなってきて
いるなら、チャンピオンデーターでもいいかもしれません。

(無題) 削除/引用
No.2640-2 - 2009/01/13 (火) 22:35:31 - @
どの回の実験でも一応有意差があるなら単に一番きれいなデータを載せればいいのではないですか。3回のうち1回が有意水準ギリギリのところとか、ばらつきが変に大きいとかで結果にまだ自信もてないなら、もう何回かやってみれば。重要なのはほんとうに差があるかないかということで、いま悩んでいるのは、明瞭な差か、そこまででないけど有意差はあるとか、というくらいのことでしょう。『くりかえし3回やって3つとも基本的に同様のデータを得ました。代表的な結果をここに示します。』とでも書いておけばいいと思います。

データの捏造 削除/引用
No.2640-1 - 2009/01/13 (火) 22:04:07 - けん
ある実験に関して3回の比較を行って、差を見出したのですが、
論文に掲載する場合はどの試行を使ったらよろしいのでしょうか。
詳細は省略しますが、その差は、非常に顕著なものではないのですが、
確実に存在しています。
飛んだ値の少ない、ある程度整ったデータを載せたい気持ちはありますが、
この考え自体がグレーゾーンな気がします。
どのように判断したらよろしいんでしょうか。
3回の比較はそれぞれn=50になっています。
チャンピョンデータの捕らえ方に戸惑いを感じます。

16件 ( 1 〜 16 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を