とある遺伝子について、プロモーター領域がメチル化されることで発現抑制されることがわかっているのですが、どのCpGがメチル化されることがより重要なのかを知るため、データベースから様々なWGBSのデータ(sraファイル)をダウンロードし、マッピングして比較したいと考えています。
このような解析はやったことがなく初心者なため、
参考書として、DRY解析教本を使用しています。
参考書に則ってマッピングを行い、メチル化シトシンの検出をして、bsfcall.txtファイルを得ました。そこから、bedgraphファイルを作成し、UCSC Genom Browserにアップロードして見たところ、グラフのある位置がCpGのCではなく、別のところ(CGではない並びのGなど)にあることが多いのですが、これはどのように解釈すれば良いのでしょうか。
ヒトの様々な臓器についてのWGBSデータを比較しており、哺乳類ではメチル化されるのはCGの並びのCのみであるはずですが、どう解釈してよいのかわからず混乱しています。
また、WGBS解析では健常者と癌患者などのデータを比較し、どの領域でメチル化に違いがあるのか解析しているものがほとんどだと思いますが、私は先述したように、ある特定の遺伝子のプロモーター領域について、様々なWGBSデータからどのCpGのメチル化が発現抑制において重要なのかを検討したいと考えています。そのようなデータを示すのに良い図をご存知でしたら、ご教示いただきたいです。
よろしくお願いします。 |
|