Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

log2FoldChangeの設定 トピック削除
No.13124-TOPIC - 2025/09/25 (木) 22:12:59 - Catch
bulk RNA-seqを行いました。

わずかな差があることを多くのデータセットで確認したのですが、FDRだけ0.05にしてlog2FoldChangeには制限を設けないというのはありでしょうか。
 
- このトピックにメッセージを投稿する -



13件 ( 1 〜 13 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.13124-13 - 2025/09/27 (土) 17:24:11 - あの
当方も補足しておきます。

ボルケーノプロットの図の上で、X軸方向では1.2倍や0.83倍を境界にして、さらに
Y軸方向では、P<0.01で色分けして作成したものを、最初に提示しています。

(無題) 削除/引用
No.13124-12 - 2025/09/27 (土) 14:19:30 - asan

せっかくなので追加で述べますと、一つのやり方としては「データの分散を見て境界を決める」というのもあります。例えば、Flow cytometryをされてる方ならイメージ着くと思いますが、scatter plotした時に集団として陽性、陰性グループに分かれることが確認できる場合があります。発現の高い手段を陽性として、低い集団を陰性とみるのが妥当だと思ってその境界でゲートを作りますよね。それと同じように、NGSデータも全体の変動をみて全体から外れた位置にある遺伝子変化(p値、Fold change)を「意味のある差」とする方が理にかなってるとも言えます。本来なら機械的にただなんとなく線を引くよりこの方がよっぽどデータに即してます。ただ、主観的なので好まれないのです。

もちろんこの解釈は前提条件として、全体のほとんどの遺伝子変化はないものとする点、変動があるものは外れ値的に動くことで緩やかな動き(バイナリーではなくて線形性の変化)がある場合ノイズに埋もれてロストする、というリスクも含まれます。

(無題) 削除/引用
No.13124-11 - 2025/09/27 (土) 14:07:47 - asan

統計処理上は問題ないです。ただ、よくわかってないレビューワーが文句を言ってきた時にどうするかは考える必要があります。また、厳密にうとその後の解析目的によっては統計上は一通り問題ない処理をしてても実際は”あまり意味のない”やり方をしてる可能性はあるのでそこは何をどういう根拠で処理するかが本質です。

そもそも歴史的にバイオ研究でP<0.01または0.05かつFCで1.5倍や2倍という値が使われてきた経緯は”ただなんとなくそのぐらい”という線引きをした以上のものではないです。NGSなどが出てきた時に多重処理をする必要が生じてFDRなどの考えが出てきましたがどうしてもBHなどで機械的に処理をするとノイズが多すぎるバイオ研究では条件が厳しすぎるのでほとんどの価値があるデータを失ってしまう。そこで、多重処理の条件を緩和しつつ意味のあるものを取るという意図で、上記の条件を使うことがゆるすぎず厳しすぎずという感じでハマったにすぎません。本質的には優位差検定において1.5倍とか2倍とかには全く根拠はなく、さらに言えばバイオロジーにおいても全ての遺伝子発現変化がそこに閾値があるという根拠もありません。

一方で、注意が必要なのは本来のP値やFDRというのは十分なデータがあってこ素適切に機能するというものです。せいぜいN=3-5程度しかないデータでFDRとかやってもデータのバイアスを引きずりやすくて当てにならないので、FDRでたまたま非常に差があっても例えば、1.1倍しか差がないデータを本当に変化と扱っていいのかという問題が発生します。これを解決するためにはやはり眼に見えるかたちの差1,5倍くらいの変動を意識した方が嘘が混じらないという経験則的(慣例)があるというのも真理です。

ここからは個人的な解釈もありますが、結論からしたらぶっちゃけ「統計的な作法とバイオロジカルに意味があるは必ずしも一致しない」ということは前提にすべきということです。それを踏まえて例えばFDRで切って変動遺伝子群(DEG)を何奴も定義するとかの用途であれば嘘が多少混じっていても全体の傾向を見たいので意味がありそうです。一方で、個別の重要遺伝子リストと抽出して着目するものに絞る場合1.1倍を含めるのは上記理由からリスキーなやり方と思います。バリデーションが必要でしょう。

本質的なことを述べると、edgeRのTMMなどの解析もFold Changeの補正は、「全体のばらつきの中心を合わせた時に大きく変動差が残るもの」がDEGだからという主旨で若干圧縮がかかります。つまり1.1倍とか微妙な差はそもそもデータ処理の仕方でも変わるとも言い換えれます。当たり前ですが、何を持って値が変動したとみなすかというのは結局絶対的な正解ないのです。

(無題) 削除/引用
No.13124-10 - 2025/09/27 (土) 09:35:04 - おお
>[Re:9] あのさんは書きました :
> たぶんレフェリーが定量PCRのデータを求めてくるでしょうね。
>
そうなると変化量が小さいと難しくなってくるし、 有意差がついてもそれだけで説得できるのかとか色々不安な要素がつきまといますね。

内部標準も qPCRと RNAseq で取り方が違うわけだからブレるだろうということも考慮に入れると、、、

RNA seq で動かないと見れる遺伝子の内部標準候補も見てみるといいのかもしれません。

(無題) 削除/引用
No.13124-9 - 2025/09/27 (土) 05:42:13 - あの
たぶんレフェリーが定量PCRのデータを求めてくるでしょうね。

RNAの残量に余裕があるならば、自分ならば、次の二つを実施します:

 パスウェイの中で重要な3から5遺伝子の発現量が、定量PCRで有意差があることを示す

 RNAseqで優位差がなかった3から5遺伝子の発現量が、定量PCRでも有意差がないことを示す

なお、これらの定量PCRのためには、内部標準として使われることが多い10程度の遺伝子の変動係数を表で見せて、最も変動しない上位二つの遺伝子を内部標準にするという手があります。Genorm とかの定番を使えるなら、もちろんそれでも良いでしょうけど。

(無題) 削除/引用
No.13124-8 - 2025/09/27 (土) 05:19:20 - おお
>[Re:7] Catchさんは書きました :
> マウス由来の細胞から作成したオルガノイドに薬剤を振りかけて発現差の検定しています。
>
> 1つではなくて、7個オルガノイドを作成したのですが、いずれもトランスクリプトームの差はわずかです。しかしFold2を無視すれば、差が見えてきて、GO解析で特定のパスウェイが浮き上がっています。
>
> これならこれでいいですよね?
>

どうでしょう。。。それでそのパスウェイが動いているとどの程度主張できますか?細胞の形質とどれくらい結びつけれますか?

(無題) 削除/引用
No.13124-7 - 2025/09/26 (金) 19:09:27 - Catch
マウス由来の細胞から作成したオルガノイドに薬剤を振りかけて発現差の検定しています。

1つではなくて、7個オルガノイドを作成したのですが、いずれもトランスクリプトームの差はわずかです。しかしFold2を無視すれば、差が見えてきて、GO解析で特定のパスウェイが浮き上がっています。

これならこれでいいですよね?

(無題) 削除/引用
No.13124-6 - 2025/09/26 (金) 03:45:01 - たこ
あ、すみません
同様にFDRで切ってlog2FC の誤りです。

(無題) 削除/引用
No.13124-5 - 2025/09/26 (金) 03:42:25 - たこ
まだ論文化できてないですが、同様にFDRで切ってFDRは特に閾値を設定せずというのは少し前になりますがやってました。
マイクロアレイの頃でもFDRで切ってlog2FCには特に注目せずいうのはよくやられていたような(目的にもよるし、私の周りだけかもしれませんが)。
RNAseqだけで終わるわけじゃないはずですし、結局その後にどれだけの検証をして、どれだけその遺伝子の発現が生物学的にクリティカルに効くのかというところに尽きるんじゃないでしょうか。

(無題) 削除/引用
No.13124-4 - 2025/09/26 (金) 03:38:47 - あの
文字化け部分は正しくは次です
 最初のは、ログ2で、
 次は 割る です、

(無題) 削除/引用
No.13124-3 - 2025/09/26 (金) 03:35:29 - あの
参考までに、当方は、FDRは個体差のある生体材料では使っていません。

それでも、異なるゲノム系やジーン系のジャーナルに複数の論文がアクセプトされています。

次のようにしています:

TPM+1のlog2の値に対して、対応無しt検定をしてP値が0.01未満
かつ
Fold Changeが1.2 より大きい、または 0.83 より小さい
(log&#8322;FC で ±0.263)

でDegを選抜しています。

0.83と簡単にするため書きましたが、より正確には、1&#10135;1.2の値です。

(無題) 削除/引用
No.13124-2 - 2025/09/26 (金) 01:30:51 - おお
無しではないです。今まで見てきたものでは1.5倍で見ていたのがありました。

それはともかく検証できるか、それで得られる結論がもっともらしいと読んだ人が思うかだと思います。

1.2倍で、qPCRで検証できてタンパクでも差が見られ、その差で形質が変わっていると示すことができたと主張する方もここにいらっしゃいました。

log2FoldChangeの設定 削除/引用
No.13124-1 - 2025/09/25 (木) 22:12:59 - Catch
bulk RNA-seqを行いました。

わずかな差があることを多くのデータセットで確認したのですが、FDRだけ0.05にしてlog2FoldChangeには制限を設けないというのはありでしょうか。

13件 ( 1 〜 13 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。