1)分類群によって可変領域ごとの特徴は変化するので、変異量の多い少ないくらいしか言えない。現実には、細菌16S以外の配列が増えてしまう(植物葉緑体など)ようなプライマーセットは避ける。そうやっていくつもユニバーサルプライマーを試して具合が良さそうなものを使う。また、RDPやSILVAでPCRシミュレーションして良さそうなものを選ぶ。プライマーの論文はAEMやPNASに載ってたと思う。
2)使用するプログラムとリファレンスデータベースと対象サンプルによるので一概には言えない。いい加減な基準で同定しているプログラム(QIIMEのデフォルトなど)では、よく種レベルまで落ちていることもあるが、かなりの高確率で間違っている。人腸内細菌叢や人口腔内細菌叢のような非常によく研究されている細菌叢なら属はかなり信頼できるでしょう。ただし、湖沼や海洋、さらにマイナーな場所の細菌叢となると、どんどん怪しくなっていきます。
3)解読領域を長くするor増やすことで種まで落ちるかどうかは、リファレンス配列の整備具合に依存します。極端な例で言えば、近縁種が全く登録されていない分類群は全ゲノム解読しても属レベルも同定できません。しかし、仮に人腸内細菌叢だとしても、NGSで解読できる長さでは高い信頼度で種まで落とせる割合はそれほど高くはないでしょう(なお、QIIMEデフォルトの同定方法ではかなり落ちますが、査読者は信用してくれないでしょうから種レベルの議論はしないことをお勧めします)。複数領域解読するのは、1つのプライマーセットで増幅してPacBioなどで長く解読できるなら効果的ですが、複数のプライマーセットでそれぞれ解読するのは議論を頑健にはしてくれることはあっても種まで落とせる割合はあまり上がらないでしょう。連結して解析できないからです。 |
|