scan match>?
ざっくりいうと、えられた全てのペプチド候補のスコアを集計して、データーベースでどのタンパク質のどのペプチドが出てるかということを統計的に優位に出すためのスコアです。
peptide match >?
そのペプチドをピークとして認識して認識したと仮定するにあたって、どのくらいそのピークの信頼性があるのかを統計的な形で表現したraw scoreみたいなもんです。
上記の概念自体はごく一般的なショットガン( DDA)解析では一般的な考え方ですが、細かいスコアリングの手法については非公開な部分もあるので考え方です。
>分子量が低くても検出されるペプチド数が多ければそれだけ信頼性が高くなる。
基本的に擬似定量の方法として、特定のタンパク質に対してMS/MSでアサインされるペプチドの回数は、そのタンパク質(ペプチド)の量に相関して増えることは言われてますが、おっしゃる通り分子量にも比例します。そのため、分子量と検出されるペプチドの数に一定の相関はありますが、それを単純に補正して発現量を議論する方法を考えてるヒトもちろんいます。ただし、一般論としてLC-MS/MSで一定の時間に検出される同じペプチドを繰り返し検出したら同定数が減ってしまうので、これを避けるためにショットガンプロテオミクスでは、一定のLCの時間の間でそれを排除するアルゴリズムを入れているので、何度MS/MSをとったか(幾のペプチドを同定したか)というのはあまり厳密な量の指標にはなりません。
>分子量が巨大なタンパク質のペプチドは検出されたとしてもコンタミの可能性もあるので信頼性はよっぽど検出されるペプチド数が多くなければ高くはならないのではないかと考えていますが、正しいでしょうか...?
分子量の大きさとコンタミ(同定の偽陽性という意味では)は関係ないです。あくまでピークイオンとそれを含むMS/MSスペクトルのS/N比の問題であり、タンパク質の同定であれば当然より複数の異なるペプチドが同定できた方が信頼性がますのは当然です。その信頼性をそれぞれ異なるカテゴリーで評価して数値化してるのが上記のスコアです。 |
|