なんか、あやふやなことを書いてしまったかもしれず、申し訳ありません。
複数検体から変異を検出する際は、joint callingすることが多いと思うのですが(参考:GATKのサイト等)、そうすると変異のない検体の当該サイトのcoverage情報も同時に出力されるはずです。あとから個々の検体のcoverageを算出するのは正しい作法なのかどうかちょっとわかりません(フィルタリングの基準等が同一でなくていいのか等)。この部分の解析も外注されたのなら、外注先に問い合わせればデータをもらえるかもしれません。
pysamstatsそのものについては、pythonが動く環境をつくれば動くとは思います。Anacondaが有名ですが、私はMacなのでほとんどhomebrewで入れています。ただ、coverageを算出する座標を複数指定する方法がよくわからないので、その部分を自動化しようとすると簡単なシェルスクリプトを書く必要が生じるかもしれません。 |
|