Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

RNAseqデータ解析の際の発現countの正規化についてTPM,FPKM トピック削除
No.12212-TOPIC - 2024/03/10 (日) 00:56:46 - コリアンダー
RNAseq解析において、どの解析で何の正規化を行うのか、人(サイト)によって言っていることがバラバラで困っているのですが、TPMやFPKMは何の解析で使われますか?

ボックスプロット、CPA、クラスタリング、差群解析などはedgeRなどのTMM正規化で十分です。
ヒートマップは各遺伝子ごとにZscoreでの補正がかかるため、TMMで十分です。
IPAネットワーク解析は入力データはrawcountが推奨されています。

実際、どのような場面でTPMが使われるのでしょうか?TPM正規化での低いカウント値を示す遺伝子の排除や、同一サンプル(条件)内での異なる遺伝子を比較する場合の他にTPMやFPKMが使われる解析を教えて頂きたいです。

よろしくおねがいします
 
- このトピックにメッセージを投稿する -



5件 ( 1 〜 5 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.12212-5 - 2024/03/12 (火) 13:38:01 - あの
IPAについては、正規ユーザーならば、日本の代理店のトミーでジタルバイオロジーに相談することをおすすめします。

それから使用したことがあなら知っていると思いますが、IPAのデータ入力段階で、Fold changeなどのデータのタイプを選択する必要がありますね。

他の解析方法については、統計学的センスや、RNAの長さ補正をしていないデータでもよいかなどを基に判断していくことになると思います。

どなたか詳しい方の御意見をお待ちしましょう。

(無題) 削除/引用
No.12212-4 - 2024/03/11 (月) 18:07:44 - コリアンダー
CLC GENOMICS workbenchからIPAに入力する際のmanualを添付致します。
https://resources.qiagenbioinformatics.com/manuals/ingenuitypathwayintegration/current/index.php?manual=Import_Expression_Data.html
TPMを入力することもできるそうですが、推奨はraw countです。

(無題) 削除/引用
No.12212-3 - 2024/03/10 (日) 21:00:38 - asan

「同一サンプルにおける遺伝子間の発現量の多寡」を知りたい場合は、TPM, FPKMなどにしなければいけません。

一方で、「同一遺伝子のサンプル間における発現量の変化」をみたい場合は、基本的にcount dataによって低い発現量のノイズ除去や正規化はすべきです。

PCAやクラスタリング解析などは、全体のシフトが一部(発現した遺伝子の中で動くものは一部)のようなサンプルの場合は、全体の不変なものにひきづられてあまり意味のある差が分離できないことがあります。正規化すればそれっぽい図が書けたりすることもありますが、そういうデータが予想される場合(i.e.刺激後や転写因子のKO後の同じ細胞fractionの発現差解析など)であれば、変動する遺伝子のみを抽出して行うとか目的にあったアプローチを取ることのほうが意味があります。

(無題) 削除/引用
No.12212-2 - 2024/03/10 (日) 19:35:27 - あの
詳しい方のご意見を当方も伺いたいですが、まずは次の情報は参考になりますか?

https://olvtools.com/documents/edger

TMM正規化とはRNA-Seq解析における遺伝子発現量の補正方法の1つで、edgeRに実装されている手法です。
RNA-Seqで測定できるのは、絶対的な発現量ではなく相対的な発現量です。 そのため、少ない遺伝子がたくさん発現している場合に、相対的に他の遺伝子の発現量が減少したように見えてしまいます。 そこでTMM正規化では、サンプル間の発現量の違いを最小化するように補正を行います。 この方法を用いれば、サンプル間で大部分の遺伝子の発現が変動していないデータであれば妥当な補正を行えることになります。
なお、TMM正規化ではサンプル間で共通の要素については補正を行いません。 例えば、遺伝子長はリードカウントに相関すると言われており、遺伝子長が長いほどリードカウントは多くなりますが、TMM正規化では補正していません。 edgeRでは発現変動遺伝子の抽出にフォーカスしており、遺伝子間の補正は必要ありませんので、TMM正規化で十分です。
一方で、FPKM/RPKMやTPMといった正規化手法では遺伝子間の発現量を比較することも考慮して遺伝子長に対する補正も行っています。


なおIPA は、TpmのFold changeが推奨というように思っていました。

RNAseqデータ解析の際の発現countの正規化についてTPM,FPKM 削除/引用
No.12212-1 - 2024/03/10 (日) 00:56:46 - コリアンダー
RNAseq解析において、どの解析で何の正規化を行うのか、人(サイト)によって言っていることがバラバラで困っているのですが、TPMやFPKMは何の解析で使われますか?

ボックスプロット、CPA、クラスタリング、差群解析などはedgeRなどのTMM正規化で十分です。
ヒートマップは各遺伝子ごとにZscoreでの補正がかかるため、TMMで十分です。
IPAネットワーク解析は入力データはrawcountが推奨されています。

実際、どのような場面でTPMが使われるのでしょうか?TPM正規化での低いカウント値を示す遺伝子の排除や、同一サンプル(条件)内での異なる遺伝子を比較する場合の他にTPMやFPKMが使われる解析を教えて頂きたいです。

よろしくおねがいします

5件 ( 1 〜 5 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。