大学院生です。公共データを用いたRNA-seqを行いたいのですが、初心者なので参考情報がうまく調べられず、困っております。
解析したいデータはRIPにより得られたもので、
・Fixした細胞のライセートから抗体で釣れたRNAを読んだもの (pulldownedとする)
・ライセートの一部から直接抽出したRNAを読んだもの (inputとする)
の2つです。これらのFastqファイルが公開されており、inputとpulldownedを比較してエンリッチされているRNAを調べたいと考えています。
ここで、各データのリファレンスゲノムに対するアライメントまでは完了しました。
ここからは
@HTSeq、DESeqによる各遺伝子のエンリッチメントスコアの算出
AIGVを用いた特定遺伝子におけるエンリッチメントの可視化
の2種を行いたいのですが、Aについて質問があります。
アライメントしたデータについて、リードのカバレッジをただIGVで見比べるだけでは比較にならないので、アライメント後のinputおよびpulldownedのデータに何らかのノーマライズ(リード数?深さ?)をかましてからIGVで見る必要があるのかな、と思うのですが、具体的な方法がわかりません。ご存じの方がいらっしゃればご教示いただけないでしょうか。 |
|