Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

RNA seq のカウント トピック削除
No.12602-TOPIC - 2024/10/02 (水) 16:28:46 - おお
RNA seqのそれぞれの遺伝子のカウントを見てます。
ちょっと考える事があってどれくらいのカウントなら生理的な意味がありそうかなと思ったりしています。

大体10以下はノイズと区別がつかないので解析しても意味がない様で、手元のデータもそう言う低いデーターはステイタスがlow とされていて統計的解析から除外されています。

じゃあ何らかの処理で20が60になったとして、50が125になったとしてその生理的インパクトはどの程度なのかと思ったりします。勿論RNA seq の感度がそれぞれの遺伝子で全く同じと言うわけでもないでしょうし、翻訳効率、mRNAやタンパクの 安定性色々な要因が絡んでくるので全ての遺伝子で一様これ以上とは言えないでしょうけど、皆さんの経験や感触など有れば教えていただきたくおもいました。
 
- このトピックにメッセージを投稿する -



14件 ( 1 〜 14 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.12602-14 - 2024/10/13 (日) 19:35:49 - ふみ
刺激Xなし →→→→ 現象Y起こらない
刺激Xあり →→→→ 現象Y起こる

刺激X以降、かつ、現象Yが起こる以前に、網羅的遺伝子発現解析
遺伝子A, B, Cの発現レベルが刺激Xなしを対照として有意に変化
刺激Xあり →→A, B, or C→→ 現象Y起こる と想定

Cの遺伝子欠損
刺激Xあり →→→→ 現象Y起こらなくなる
刺激X →→C→→ 現象Y すなわち Cが当たり
遺伝子発現の変化率: C<B<A

こういうことがひとたびならずありました。

-----
振れ幅が大きいものは、刺激Xなしでカウントが少ないものが大半ですね。

(無題) 削除/引用
No.12602-13 - 2024/10/11 (金) 07:26:13 - あの
当たりってどういう意味で使っていますか?

(無題) 削除/引用
No.12602-12 - 2024/10/11 (金) 01:15:05 - おお
>[Re:11] ふみさんは書きました :
> 発現量の振れ幅が大きいものは、影響が大きい役割を果たしていないということはあるかなと想像しました。
> 発現レベルの差と倍率が大きくないものが当たりだったことは確かにあります。

面白い指摘ですが、逆も真なりとも思える内容かと、、、
振れ幅が広いものに関してその時の発現量(実際のカウントなど)は確認されましたか?あるいは確認できますか?

(無題) 削除/引用
No.12602-11 - 2024/10/10 (木) 07:49:48 - ふみ
発現量の振れ幅が大きいものは、影響が大きい役割を果たしていないということはあるかなと想像しました。
発現レベルの差と倍率が大きくないものが当たりだったことは確かにあります。

(無題) 削除/引用
No.12602-10 - 2024/10/10 (木) 00:44:06 - おお
>[Re:9] あさんは書きました :
> 脱線させてすみませんが、volcano plotで端に来る遺伝子はハズレで、

p値が非常に低くてfold changeが大きいものということでしょうか?その発現量は確認できますでしょうか?

(無題) 削除/引用
No.12602-9 - 2024/10/09 (水) 16:17:31 - あ
脱線させてすみませんが、volcano plotで端に来る遺伝子はハズレで、そのちょい下か、中の上くらいに居る遺伝子が当たりのことが多い気がするんですが、気のせいでしょうか。当たりの定義が不明瞭ですけど。

(無題) 削除/引用
No.12602-8 - 2024/10/09 (水) 04:02:33 - あの
以前と違って、RNAseqの費用が安くなったので、一群あたり5とか6とかできるようになっていますよね。


色々な考え方や線引きがあると思いますが、当方では、
 少なくとも片方の群で全個体のTPM が1以上なら解析対象

にしています(分析RNA量が先のリンク先の量を踏まえて十分な場合ですが)。

これは
   発現遺伝子の中には、片方の群では発現しなくなるものだってあるだろう、

という前提です。そのため、Fold changeはお察しの通りに大きくなりますね。


もし、もっと良い方法があるなら、他の方の御意見を、当方もうかがいたいですが。

(無題) 削除/引用
No.12602-7 - 2024/10/09 (水) 01:59:00 - おお
>[Re:6] あのさんは書きました :
> おおさん
>
> まずはvolcano plot を書いてみて、興味ある遺伝子が、どこらへんに位置するか見てみたらどうですか?
>
> 有意差だけではなく、fold change がどのくらいかという観点と、その有意水準 P値が どの程度小さいのかを評価できますので。

ありがとうございました。そういった観点で一度見てみます。カウントが低いとノイズの影響が大きくなってfold changeが大きく見積もられたり(逆もあると思うけど)しませんか?

(無題) 削除/引用
No.12602-6 - 2024/10/05 (土) 18:34:50 - あの
おおさん

まずはvolcano plot を書いてみて、興味ある遺伝子が、どこらへんに位置するか見てみたらどうですか?

有意差だけではなく、fold change がどのくらいかという観点と、その有意水準 P値が どの程度小さいのかを評価できますので。

(無題) 削除/引用
No.12602-5 - 2024/10/05 (土) 09:02:08 - おお
ありがとうございました。ちょっとリンクは見きれてないのですが無理があるとは思いつつも数字で縛ろうと考えていたのがやはり無理があるという感じですね。

考えている概要としては、あるコントロール的な何もしないような試薬(実際はそうではないのですが)で処理したもので400弱の遺伝子が2倍以上で有意差が認められてまして、遺伝子全体の発現量の分布と変動した遺伝子の発現量の分布を見てみたところ変動した遺伝子のほぼ全てにおいて発現量はかなり低く(発現量を縦軸に取り全遺伝子の発現量をプロットしたもので最適な縦軸のスケールにした場合変動したものはX軸にへばりついている)意味のある変動なのかという見方もあるかなぁと都合の良い解釈を持ち出そうとしたり、しなかったり、、、てなところです。

(無題) 削除/引用
No.12602-4 - 2024/10/02 (水) 21:07:49 - あの
asanさんの示すリンク先にはなぜかいけないのですが、迷っているうちに見つけた次のリンク先の話は、当方の感覚にもマッチします

https://www.subioplatform.com/ja/info_casestudy/8/quantity-matters-for-quality-of-rna-seq-data

(無題) 削除/引用
No.12602-3 - 2024/10/02 (水) 19:35:12 - asan

ttps://www.subioplatform.com/ja/products/subioplatform/the-dynamic-range-of-rna-seq#about-count

この辺の議論を読んでください。


結論的にいうと、データの深さやノイズの乗り方にもよるので本来はそのデータ毎に信頼できるカウント数というのは変わります。
1000万リードぐらいの多くのデータでは、10-20カウント以下はノイズが極端に多くなる傾向にあるため、そのようなデータをDEG解析をする時は0カウントとみなしてゼロカウントを擬似的に10とか入れて処理をしたりします。それによって、刺激前後で発現がほとんど出てないものに対してもfold changeとかの計算が可能になります。

ただ、この辺はデータ毎に傾向を確認して処理してるかというとコマンドでやってる人はあまり拘らずにそのまま機械的にデフォルトのセッティングで20とかでカットオフ値を使ってしまってるデータも多いと思います。よって、オミクス解析で個別ターゲット遺伝子の変化に着目して機能解析をする場合は別でバリデーションを取るとか、その前に注目する段階でraw count値を確認してノイズの可能性があるかチェックする方がいいと思います。

ちなみに、変動差に意味があるかないかという話になってくると細胞生物学的な意義の話になるので分子にもよるでしょう。炎症性サイトカインとか刺激後に100倍とか簡単に動くもののの2倍変化はしょぼいかもしれませんが、転写因子とかで1.5倍ぐらいの変化でも十分なものもあります。生物学的に重要な遺伝子はそもそもそんなに極端な変化をするものは少ないのでノイズを含めてエンリッチメント解析やパスウェイ解析をする方が情報量としてのノイズは軽減されると思います。

(無題) 削除/引用
No.12602-2 - 2024/10/02 (水) 18:40:50 - あの
当方の感覚ですが、tpmは1以上あれば排除しません。


たとえば有名な受容体でも、一桁というのはよくあります。

一方で、ホルモンなどの分泌し続けるタンパクの遺伝子は、かなり大きなtpm値になります。

RNA seq のカウント 削除/引用
No.12602-1 - 2024/10/02 (水) 16:28:46 - おお
RNA seqのそれぞれの遺伝子のカウントを見てます。
ちょっと考える事があってどれくらいのカウントなら生理的な意味がありそうかなと思ったりしています。

大体10以下はノイズと区別がつかないので解析しても意味がない様で、手元のデータもそう言う低いデーターはステイタスがlow とされていて統計的解析から除外されています。

じゃあ何らかの処理で20が60になったとして、50が125になったとしてその生理的インパクトはどの程度なのかと思ったりします。勿論RNA seq の感度がそれぞれの遺伝子で全く同じと言うわけでもないでしょうし、翻訳効率、mRNAやタンパクの 安定性色々な要因が絡んでくるので全ての遺伝子で一様これ以上とは言えないでしょうけど、皆さんの経験や感触など有れば教えていただきたくおもいました。

14件 ( 1 〜 14 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。