「同一サンプルにおける遺伝子間の発現量の多寡」を知りたい場合は、TPM, FPKMなどにしなければいけません。
一方で、「同一遺伝子のサンプル間における発現量の変化」をみたい場合は、基本的にcount dataによって低い発現量のノイズ除去や正規化はすべきです。
PCAやクラスタリング解析などは、全体のシフトが一部(発現した遺伝子の中で動くものは一部)のようなサンプルの場合は、全体の不変なものにひきづられてあまり意味のある差が分離できないことがあります。正規化すればそれっぽい図が書けたりすることもありますが、そういうデータが予想される場合(i.e.刺激後や転写因子のKO後の同じ細胞fractionの発現差解析など)であれば、変動する遺伝子のみを抽出して行うとか目的にあったアプローチを取ることのほうが意味があります。 |
|