統計初心者です。よろしくお願いします。
20例の患者サンプルで、バイオマーカーA(連続変数)を測定しました。全例で生存期間データが得られています。このデータを用い、Aの値でサンプルを2群に分け、カプランマイヤー・ログランクで生存曲線の有意差の有無を調べるよう指示されてます。2群に分けるのにROC解析を使うよう言われているのですが、要領を得ません。つまづいているポイントは、
1. 通常のROCはアウトカム(従属変数)が2分変数である事が条件と理解してますが、イベント発生と打ち切りを含めた生存期間からなるアウトカムを2分変数に変換する方法が分かりません。
2. 時間依存性ROC解析というのがあるようで、risksetROC、timeROCなどと呼ばれるパッケージがRにあるようなのですが、これらは生存期間データをそのままROC解析するためのパッケージと理解して良いでしょうか?
3. そもそもカットオフ値を動かして最適な条件を見出すというROCのプロセスが、統計学的に正しいのかよく分かりません。最小P値法に似てる気がして不安です。
不勉強で申し訳ありませんが、ご指導いただけると幸いです。よろしくお願いします。 |
|