ケースコントロールスタディにおいて、複数の感受性遺伝子のSNPから、ロジスティック回帰分析を行っている論文を見かけますが、実際のやり方(独立変数のパラメータのとりかた)がよく分かりません。例えば、目的変数を病気の発症=1、発症しない=0として、単独SNPを説明変数とするなら、パラメータの取り方はSNPの遺伝子型によって、AA=0,AB=1,BB=2というのな数値に変換するのでしょうか?または、AA=1,AB=2,BB=3とするのでしょうか?
複数のSNPの場合は、どういうパラメータを取ることになるのでしょうか?例えば、SNP1(AA,AB,BB)、SNP2(AA,AB,BB)、SNP3(AA,AB,BB)の場合、パラメータは組み合わせによって、1〜27の数字を当てればよいのか、説明変数を3つとして、AA=0,AB=1,BB=2とするのでしょうか?
最終的に、選択された説明変数による重回帰式(予測式)を求める具体的な方法や便利なソフトなどあったら教えて下さい。 |
|