Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

トピック一覧 | 研究留学ネットに戻る

最新のフォーラム | このフォーラム | ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

リアルタイムPCR(ddCt法)の結果の統計解析 トピック削除
No.1862-TOPIC - 2010/01/06 (水) 13:32:32 - はるな
たとえば

10個体の生物からA,B,C,DおよびEの5つの遺伝子の発現量をリアルタイムPCR
ddCt法により計測したとします.

つまり得られるdCt(ddCtではない)データセットは,10個体×A,10個体×B・・・10個体×Eの全50データです.


ここで,各遺伝子のdCt値に差があるかどうかを検定するには,
対応のある一元配置の分散分析+多重比較が妥当だと考えるのですが,

通常ANOVAを行う場合には,データの正規性と等分散性が満たされる必要が
出てきます.

上記例の場合だと5遺伝子群すべてで正規性と等分散性が満たされる必要があります.

しかし,リアルタイムPCRデータを扱った多くの論文では正規性と等分散性の仮定については触れていません.

ここで,質問です.

ANOVA等のパラメトリック検定を行うために,得られたデータを対数変換するのはよく使われる手ですが(賛否はありますが),リアルタイムPCRによって

得られたdCT値を対数変換すること,は許されるのでしょうか?

dCtはもともと対数なのでそれをもう一度変換することに抵抗があります.

ご存知の方,おられましたら,お教えください.
 
- このトピックにメッセージを投稿する -



9件 ( 1 〜 9 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.1862-10 - 2010/01/09 (土) 19:32:58 - はるな
JNT さま

書き込みありがとうございます。

えっと、

「マイクロアレイの場合ですが、発現量は対数正規分布することは分かっているので、リアルタイムPCRでの発現量もおそらく対数正規分布すると思います。それを計算の過程で対数変換してすでに正規分布しているとみなしている」

のであれば、得られた生データを対数変換する必要はなく、そのまま生データをANOVA等のノンパラな解析で使用することに問題はないでしょう。よって、わざわざ対数変換する必要もないわけですし、また、変換することによって生じる余計な問題を排除できると思います。

おっしゃるとおり。


でも、未知の母分布が対数正規分布する、ということがなぜわかるのか?

という疑問がのこります(一般的にそうだ、としても自分の場合はそうとは限らない)。それが、わたしの疑問のはじまりです。

かりに、得られたデータが、正規分布を仮定できない場合はどうするのでしょうか?

(無題) 削除/引用
No.1862-9 - 2010/01/09 (土) 17:32:53 - JNT
ANOVAでとりあえず対数変換するのは知りませんでしたが、
血中濃度など、世の中には対数正規分布するデータは大量にあるので、
対数変換して正規性があれば問題ない、という考えには納得できます。

マイクロアレイの場合ですが、発現量は対数正規分布することは分かっているので、リアルタイムPCRでの発現量もおそらく対数正規分布すると思います。
それを計算の過程で対数変換してすでに正規分布しているとみなしているわけだから、
そこからさらに対数変換するのは間違いな気がしますね。

(無題) 削除/引用
No.1862-8 - 2010/01/07 (木) 08:46:27 - ザンギ
>p値の補正がやはり必要になってくるのでしょうか。

僕が答えられることではないと思いますが、必要な気がします。
実データでは、検出力が強すぎて困ってます。

(A群の最小値)>(B群の最大値)
のようなデータセットで、群内のばらつきが大きくて例数が少ない
場合には、パラメトリックな検定では有意差がでないことが珍しく
ないと思いますが、Permutation testではp値がゼロになって
しまいます。
ウェットな感覚ではPermutation testが正しいのですが、例数が
足りないんじゃないかという疑問には答えられません。古典的な
検定では有意差がないからダメと言われると、Permutation testを
やってる意味が無い(苦笑)

permutation test 削除/引用
No.1862-7 - 2010/01/06 (水) 23:18:08 - はるな
お二人とも書き込みありがとうございます。

mom-aさん
おっしゃるとうりです。

ザンギさん

permutation testの方法、理解できました。

なんとなくですが、ノンパラの中では最強っぽい検定ですね。

Rでは、perm.testのコマンドで動いてくれました。

上記の仮想例の場合だと、A,B,C,D,Eの5群で多重比較する(検定をA VS B,A VS C, A VS D・・・・D VS Eの10回くりかえす)ことになるので、p値の補正がやはり必要になってくるのでしょうか。

(無題) 削除/引用
No.1862-6 - 2010/01/06 (水) 19:05:58 - ザンギ
mom-aさん、解説ありがとうございます。

>ザンギさんのおっしゃるようにpermutation testも悪くないかもしれ
>ませんが、うっかりするとeditorが理解してくれなかったり…なんて…。

僕も生物系の論文で、この検定を使ってるのをまだ見たことがないので、
かなり不安ですが...

>はるなさん
>permutation testとはどのようなものですか?

日本語では並べ替え検定と呼ぶようですが、mom-aさんのおっしゃるように
まだ普及してないのかもしれません。
僕が使っているMeVに実装されていたので、ちょこっと勉強してみました。
www.tm4.org/mev/
正規性を仮定しないで、起こり得る組み合わせを全部計算しちゃって、
P-valueを算出する方法と理解しています。

下のテキストのイントロダクションと14.5章が、僕にはよく分かりました。
bcs.whfreeman.com/ips5e/content/cat_080/pdf/moore14.pdf

(無題) 削除/引用
No.1862-5 - 2010/01/06 (水) 17:35:21 - mom-a
>通常ANOVAを行う場合には,データの正規性と等分散性が満たされる必要が出てきます.

実験で得られたデータ(=サンプル)の、ではなく、母集団の正規性と等分散性を仮定しているはずです。もちろん、「それが分からないから検定などで母集団の分布を推定している」のではありますが、少数例では検定してもさほどの検出力は得られません。(それならば例数を増やせという意見もあることは承知しています。それでOKなら問題ありません。)

>しかし,リアルタイムPCRデータを扱った多くの論文では正規性と等分散性の仮定については触れていません.

ということで、in vitroではたかだかn=3〜5で、群の方はいくつになるか分からない、といったようなPCRではこのあたりを検定していない、ということだと思っています。
その場合、とるべき方法としては
・ノンパラメトリックの手法を使う⇒ただし、多群、対応あり、などなどがあるとかなり非実用的ではあります。簡単なソフトでは使えないかもしれませんし。
・検定の頑健性に甘えて(?)パラメトリックで押し切る⇒各群のサンプルサイズが等しければ、比較的分布や分散のゆがみに影響されないです。特に、分散が大きく異なる場合、分布が不明であってもノンパラメトリック検定よりもAspin-Welch型の検定を推奨している人もいます。
 参考: http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html 
 不等分散を前提にした一元配置分散分析ってあまり一般的ではない気がしますが、上記の結果をみる限りでは、サンプルサイズが等しければ、通常のANOVAでもさほど第1種の過誤の変化は許容範囲と考えられるのではないかと思うのですが、どうでしょう?
・変数変換して正規化する⇒薬物動態試験での血中薬物濃度データの対数変換のように、一般的に利用されているならOK。ただし、一般的でない変換の場合、「そのデータはたまたまその変換で正規分布になったが、母集団の分布は違う!」ということになりそうな気がして心配。


>あんまり統計には詳しくないのですが、ANOVAで対数をとるのって一般的なんでしょうか。
 
特に「ANOVAで」ということではないと思いますが、正規性が得られない場合、変数変換を行って正規性が得られればパラメトリック、というのは統計家にとってはさほど疑問がないようです。ただ、実験担当者としては、意味のわからない数値が出てくるのが嫌、という感覚をもつ人が多いように思います。その中で、対数変換は比較的普通に使われる部類に入ると思いますが、それでも、血中濃度のように対数変換が前提とされている場合はいいとして、PCRデータのようにあまり一般的に使われていない変換を敢えて行う、というのは個人的には好みませんが…。

ザンギさんのおっしゃるようにpermutation testも悪くないかもしれませんが、うっかりするとeditorが理解してくれなかったり…なんて…。

お礼 削除/引用
No.1862-4 - 2010/01/06 (水) 15:46:16 - はるな
ザンギ 様

返答ありがとうございます.

ANOVAを含めたパラメトリックな検定を行う際に,
比較対象とする全部の群で正規性が仮定できるとは限りません.

特に,比較する群が多くなると当然難しくなります.

この場合に,log(生データ+定数(たとえば1))などとして,正規性を仮定してしまうという方法はよくやられていると思います.

そんなめんどくさいことせずにノンパラで,という判断もありますが
検出力が低下してしまうこともあります.

いずれにせよ,dCt値が未知の定数×コピー数と定義されるのならば,変換しても問題なさそうですね.

permutation testとはどのようなものですか?
よろしければお教えください.

(無題) 削除/引用
No.1862-3 - 2010/01/06 (水) 15:28:44 - ザンギ
あんまり統計には詳しくないのですが、ANOVAで対数をとるのって一般的なん
でしょうか。
マイクロアレイのデータの分布を正規分布に近づける弁法として使われている
のだと理解していました。

dCtは計算上は対数ですが、意味しているのはGAPDHなんかのノーマライザ
の何倍のコピー数かということでいいでしょうか。
それならdCtの単位は「未知の定数×コピー数」ではないかと思います。
対数の相加平均はリニアの相乗平均ですから、なんにしろ有意差があるなら
検出できると思いますが。

無理に正規性を仮定しなくても、それくらいの数ならpermutation testすれば
いいような気もします。

リアルタイムPCR(ddCt法)の結果の統計解析 削除/引用
No.1862-1 - 2010/01/06 (水) 13:32:32 - はるな
たとえば

10個体の生物からA,B,C,DおよびEの5つの遺伝子の発現量をリアルタイムPCR
ddCt法により計測したとします.

つまり得られるdCt(ddCtではない)データセットは,10個体×A,10個体×B・・・10個体×Eの全50データです.


ここで,各遺伝子のdCt値に差があるかどうかを検定するには,
対応のある一元配置の分散分析+多重比較が妥当だと考えるのですが,

通常ANOVAを行う場合には,データの正規性と等分散性が満たされる必要が
出てきます.

上記例の場合だと5遺伝子群すべてで正規性と等分散性が満たされる必要があります.

しかし,リアルタイムPCRデータを扱った多くの論文では正規性と等分散性の仮定については触れていません.

ここで,質問です.

ANOVA等のパラメトリック検定を行うために,得られたデータを対数変換するのはよく使われる手ですが(賛否はありますが),リアルタイムPCRによって

得られたdCT値を対数変換すること,は許されるのでしょうか?

dCtはもともと対数なのでそれをもう一度変換することに抵抗があります.

ご存知の方,おられましたら,お教えください.

9件 ( 1 〜 9 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を