>95パーセンタイルや99パーセンタイルではダメなのか
有意差検定の場合は有意水準(第一種の過誤の確率)5%が一般化しています。健康診断などの正常値も健康な人(?)の95%が含まれる範囲とかだったでしょうか。おっしゃるように、厳しいんだな、と思いました。しかし、分野によっては±3S.D.を基準にする場合もあるようですから何ともいえません。
>ただ、UC様もおっしゃいますようにtype 8のp(k)=(k-1/3)/(n+1/3)が、Hyndman and Fan (1996) のお奨めということで特にこれでなくてもいいのかなと(普通にエクセルでpercentileでいいのかなと。もちろんアルゴリズムが違うので、多少の計算結果は異なるかもしれないですが、どの方法も数が多くなればそんなに変わらないのかなと)今はそんなふうに考えています
どの方法もサンプルサイズが大きければほとんど差はないだろうというお考えは正しいです。どれが間違いというわけではなく、補正の仕方に一長一短あるということでしょうから、エクセルのpercentileが間違いというわけではありません。エクセルで計算するというのもアリだと思います。
2つの段落が「ただ、〜」とつながっているのがちょっと気になりますが、パーセンタイルの計算式の意味とカットオフを何パーセントに設定するかというのは別の話です、蛇足ですが付け加えておきます。(そんなことは当然、といわれるでしょうが。)分布の形とか、明らかに外れているとか、数値がどのくらい変化するとどういう現象がおきるとか、そういうことの方が問題になるのではないでしょうか。分野固有的な基準値がある場合がありますから、他の事例などを参考になさってはいかがでしょう。 |
|