Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

トピック一覧 | 研究留学ネットに戻る

最新のフォーラム | このフォーラム | ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

「平均±標準偏差」標準偏差の大きさが有効数字桁数を規定する? トピック削除
No.78-TOPIC - 2011/02/27 (日) 07:35:09 - st
実験では装置等の測定精度によって有効数字の桁数を決定すべき
というのは理解しています。

それを踏まえた上で、複数の測定を行った場合の結果を平均±標準偏差で
表示することがごく一般的ですが、この際の有効数字の桁数は
いつも個々の測定精度から決定されるものをそのまま用いて大丈夫でしょうか?
仮に標準偏差がその最小有効数字の位より大幅に大きい場合には
標準偏差の有効数字が1桁もしくは2桁くらいになるように
有効数字の桁数を減らすべきでしょうか?

具体例を挙げさせてください。
例えば酵素の活性を求める場合、3回独立な測定を行って
5.55555, 6.66666, 7.77777という3つの値を得たとします。
有効数字は小数点以下5桁とします。
この3つの値の平均と標準偏差は6.66666と1.11111なので、
結果は6.66666±1.11111と表示すべきでしょうか?
それとも標準偏差は”あいまいさ”もあらわすので標準偏差の項にあまりに
たくさんの有効数字があるのは無意味だと考えて四捨五入して
7±1 もしくは 6.7±1.1 もしくは6.67±1.11
とするのがいいでしょうか?
その場合どのような判断基準で有効数字の桁数を決定すればいいのでしょうか?



よろしくお願いいたします。
 
- このトピックにメッセージを投稿する -



24件 ( 1 〜 20 )  前 |  1/ 1. 2. /2


(無題) 削除/引用
No.78-26 - 2011/03/05 (土) 02:14:21 - yyy
酵素活性によって産生された色素量などを機械で読みとるという系なのでしょうか? それで、その制度が小数点以下5桁くらいまであると。
 
でも、そのサンプルを量りとったり、添加サンプル量や試薬量なども小数点5桁くらいまでの精度でやってるのでしょうか? 結局はそれに用いたピペッターなどの精度に準じるのが妥当な気がしますが。

(無題) 削除/引用
No.78-25 - 2011/03/05 (土) 01:26:52 - 00O
>定量分析の場合は「不確かさ」の定義などがありますし

>たとえば、メスシリンダーで同じ体積の液体を測るような簡単な系

メスシリンダーでの有効数字はどのように定められているのですか?
前出の、wikipediaにならっているのでしょうか?
質問にある「酵素活性」は定量分析に分類されるものだと考えることが可能だと思いますが、定量分析だとした場合には有効数字はどこまでになるのでしょうか?

(無題) 削除/引用
No.78-24 - 2011/03/04 (金) 22:35:07 - 00
有効数字ってその測定システム系自体が持っている測定限界を
表す数値で、標準偏差は、測定のばらつきの度合いで
概念が違うので、うまく関係づけるのは難しいんじゃないだろうか。

たとえば、メスシリンダーで同じ体積の液体を測るような簡単な系でさえ、
測定者が変わったり、液の粘性が変わったりするだけで標準偏差って
変わってくると思うんだよね。でも、有効数字って変化しないよね。

だから、測定のばらつきの度合いと有効数字って似てはいるし、
ある限定された条件で関係づけることはできるかもしれないけど、
少なくとも統一的に関係づけることは難しいように思う。

カルバさん 削除/引用
No.78-23 - 2011/03/04 (金) 20:28:58 - mom-a
>最終計算結果として出力される平均値、標準偏差、標準誤差を丸める場合(有効桁数を決定する場合)、mom-aさんや製薬業界ではどのような方法を採用されているのでしょうか?(トピ主さんのご質問への回答でもありますが)

私が担当していたのは薬効試験なので、申請資料といっても添付資料なので、臨床試験のデータほど慎重でなかったのか、あるいは昔の話なので今とは事情が違うのか、そのあたりは何ともいえませんが、実際のところ、最終的な表に記載する数字の桁数については、それほど気を使っていませんでした。なんとなく、慣例に従う、といったところでしょうか。

思うに、興味があるのが測定された値そのものではなく、対照群との間に差があるか、ということなので、6.71だろうが6.7だろうがあまり気にならないのではないでしょうか。実測データや計算過程のところはきちんとしていないと問題になりますが、最後の丸めは指摘されたらやり直しても済むような(指摘されたことはないですが)。
例に挙げられているほど有効数字の桁が多い例を経験していない、ということもあるような気がします。感覚的にはトピ主さんの案やカルバさんが示して下さった例はそう違和感がないように思っています。ただ、これが絶対的なルールとして浸透しているかというと、そうでもないかな、と思いますが。

定量分析の場合は「不確かさ」の定義などがありますし、数値そのものが重要となるでしょうから、桁数の表示などのルールが明確になっているかもしれません。

グラフ 削除/引用
No.78-22 - 2011/03/03 (木) 05:52:19 - gra
話がそれてしまいますが
数字ではなくグラフであらわしては如何ですか?
グラフならば桁数を好きなだけ入れても気にならないのではないでしょうか?

(無題) 削除/引用
No.78-21 - 2011/03/01 (火) 18:13:33 - カルバ
>平均値等の統計量の算出には生データを使うべきだと思います。
というmom-aさんのご意見には個人的に共感できます。

ところで、最終計算結果として出力される平均値、標準偏差、標準誤差を丸める場合(有効桁数を決定する場合)、mom-aさんや製薬業界ではどのような方法を採用されているのでしょうか?(トピ主さんのご質問への回答でもありますが)

(無題) 削除/引用
No.78-20 - 2011/03/01 (火) 17:16:31 - mom-a
製薬会社時代、信頼性調査の時に表に記載された数値から電卓で検算すると数値が合わないといって問題になったことがありました(表には丸めた数値しか記載していなかったので)。現実問題として、そんな細かい桁に意味がないだろう、と主張しても、監査である以上数値が合わないのは気持ち悪い、ということになってしまいます(このときは、生データからの計算過程を示して納得してもらいました)。丸めの誤差は結構侮れず、場合によっては有意差のある・なしが逆転してしまうこともありえます。
昨今ではデータを入力すれば、解析結果までコンピュータが一気に計算することが多くなっているので事情が異なると思いますが、Excelを使う場合など端数の処理をおろそかにすると、画面に表示されている桁とソフト上で計算に使っている桁が違っていたりするので注意が必要です。

私は、統計家から端数を丸めるのは最後にした方が良いというアドバイスを貰ってから、そうすることにしています。

>平均値と標準誤差は、実際の観測値ではなく、観測値の有効数5.56、6.67、7.78を用いるべきなのでしょうか?

ここでいう「観測値の有効数」は観測値の最大値と最小値の差や標準偏差を使って求めているので、平均値等の統計量の算出には生データを使うべきだと思います。

(無題) 削除/引用
No.78-19 - 2011/03/01 (火) 16:37:49 - カルバ
>トピの質問からそれてしまいますが、平均値と標準誤差は、実際の観測値ではなく、観測値の有効数5.56、6.67、7.78を用いるべきなのでしょうか?

今回の例では、どちらを用いても同じ結果になるようです。手持ちのデータやデタラメな数字でいくつか試算してみましたが、細かい数字を見れば同書の方法で求まる有効桁数以下の数値に違いが出るものの、結果は同じでした。もしかしたら実測値と有効数に丸めた値で異なる平均値・標準偏差となる場合があるのかもしれませんが、分かりかねます。

なお、先ほどの投稿で標準偏差の桁数を標準偏差を3で割った値に基づいて示してしまいましたが、同書では標準誤差を3で割った数値で平均値の有効桁数を求めることだけが記述してあり、「標準偏差は平均値に準じ」としか書いてありませんでしたので、もしかしたら平均値の桁数はあくまで標準誤差に基づいて求めるものなのかもしれません。本トピの例や同書に書かれている例ではどちらで計算しても同じ桁数に落ち着きますが、試したものの中には標準偏差と標準誤差をそれぞれ3で割ると0でない桁が異なる場合もありました。

どなたか詳しい方、いらっしゃいませんか?

(無題) 削除/引用
No.78-18 - 2011/03/01 (火) 11:33:25 - Boston-Pullman
すごく勉強になります。

トピの質問からそれてしまいますが、平均値と標準誤差は、実際の観測値ではなく、観測値の有効数5.56、6.67、7.78を用いるべきなのでしょうか?

詳しいわけではありませんが、 削除/引用
No.78-17 - 2011/03/01 (火) 09:52:09 - カルバ
「生物統計学入門」(新城明久著、朝倉書店)によれば、「観測値の有効数の基準は、最小値から最大値までの単位数の差が30−300の間にあることである。」とされています。この根拠については全く分かりませんが、それが正しいとするとトピ主さんの例では、5.55555, 6.66666, 7.77777の最大値と最小値の差が2.22222ですので、これは30単位を下回っているため1の位だけでは有効数に満たないということになります。そこで単位数を変えて上記の範囲に収まる桁を探すと、小数点第1位まで単位を変化させた55.5555、66.6666、77.7777でもまだ届きません(小数点第1位も有効数に満たない)。もう一段階、小数点第2位まで単位を変化させた555.555、666.6666、777.777の場合、差が222.222と上記範囲に収まります。従って、小数点第2位までを測定すれば良いということになりますので、観測値の有効数は5.56、6.67、7.78となるのではないでしょうか。

また同書によれば、「平均値と標準誤差の有効数は標準誤差を3で割り、その商が0でない桁に注目する。平均値はこの桁まで、標準誤差はもう1桁余分にとる。(中略)標準偏差(の桁数)は平均値に準じ」るとあります。トピ主さんの例では、標準偏差が1.11111ですのでこれを3で割ると0.37037となり、0でない桁である小数点第1位までを平均値と標準偏差の有効桁数とすれば良い(6.7±1.1)のではないでしょうか?

あくまで上記書籍に記載されている基準に沿った考え方で、これ以上のことについては分かりませんしコメントもできません。詳しい方、フォローしていただけると助かります。

(無題) 削除/引用
No.78-16 - 2011/02/28 (月) 22:06:07 - ats
stさんは、
http://ja.wikipedia.org/wiki/正確度と精度
のあたりのことを想定しているのでしょうか?
「科学や工学では、正確度や精度を有効数字で暗に示すことが多い。」と上記記事の後半に記述がありますね。
また、http://ja.wikipedia.org/wiki/標準誤差では
「分布が正規分布に従う場合、95%信頼区間は、おおよそ(平均±2×標準誤差)となる。」ですので、
標準誤差=0.641500なら、95%信頼区間は、6.66...±1.28...=5.3~7.9、
有効数字は最小桁に誤差が含まれるので、この場合、有効数字は1桁
標準誤差=0.0111111なら、95%信頼区間は、6.644~6.688なので、有効数字は3桁
と考えれば良いのでは。(自信がないな〜)
±(標準誤差)なのか±(標準偏差)か、およびN(測定数)は明記すべきですね。

前提 削除/引用
No.78-14 - 2011/02/28 (月) 21:52:59 - テスト
一つの真の値が存在すると考えられる場合(例、酵素活性)は、質問者のタイトルの通り・・・。
複数の値が存在する場合(例、ある年齢におけるあるグループの人たちの身長)は、装置等の測定精度程度までを書く・・・。

(無題) 削除/引用
No.78-12 - 2011/02/28 (月) 21:19:49 - 少数
>この例の場合、標準誤差=1.11111/√3 = 0.641500 となるので
平均±標準偏差は小数点以下1桁まで示し、6.7±1.1となります。

例のケースで小数点以下i1桁まで書きたい場合には、平均6.7標準誤差0.6と書けばよいと思います。つまり、6.7±0.6。

有効数字の考え方については
http://www.ipc.shimane-u.ac.jp/food/kobayasi/yukosuji.htm
が分かりやすいと思います。

(無題) 削除/引用
No.78-11 - 2011/02/28 (月) 14:55:18 - mom-a
”標準偏差の大きさが有効数字桁数を規定するか否か?”
という質問の意味が理解できなかったのですが、なんとなくわかってきました。

TK-1さん、atsさんのおっしゃるとおり、この場合は有効数字6桁を使って計算する(計算方法によっては桁落ちがあるかと思いますが)だけだと思います。

このことと、例えば個体間差が大きいので、集団の平均値の議論をする場合に6桁全部表示することに意味があるか?というのとは別の問題ではないでしょうか。挙げられた例については、気持ちはわかるけれど、形式的に全てをそのように決めてしまうと、どこかに落とし穴がありそうな…というところでしょうか。正直にいえば、よくわかりません。

(無題) 削除/引用
No.78-10 - 2011/02/28 (月) 14:06:58 - ats
ただの思考実験なのですね。TK-1さんの仰る通り、標準偏差もただの計算なので有効数字は明らかかと思います。

http:// 削除/引用
No.78-9 - 2011/02/28 (月) 12:28:47 - TK-1
> ここでは純粋に
> ”標準偏差の大きさが有効数字桁数を規定するか否か?”
> の質問に答えをいただけるとありがたいです。
> 5.55555, 6.66666, 7.77777というデータ(有効数字6桁)は
> 確実に信頼のできるものとさせてください。
なら

> その上で6.66666±1.11111 をどの桁数まで表示すべきか?
すべての桁まで表示できる。

(無題) 削除/引用
No.78-8 - 2011/02/28 (月) 12:19:35 - st
質問者です。
みなさんおっしゃる通り、ピペットマンの精度は有効数字
6桁も無いことは十分承知しています。
ピペットマンの精度が3桁だから3桁にすべき、という
解答は問題としている論点からずれています。

ここでは純粋に
”標準偏差の大きさが有効数字桁数を規定するか否か?”
の質問に答えをいただけるとありがたいです。
5.55555, 6.66666, 7.77777というデータ(有効数字6桁)は
確実に信頼のできるものとさせてください。
その上で6.66666±1.11111 をどの桁数まで表示すべきか?
という点に解答をいただくようお願いします。


自信は無いのですが、私自身1つの案を持っています。
それは標準誤差(標準偏差でなく)の第一有効数字の桁まで表示する
というものです。
この例の場合、標準誤差=1.11111/√3 = 0.641500 となるので
平均±標準偏差は小数点以下1桁まで示し、6.7±1.1となります。
仮に同じ6.66666±1.11111が10000回の測定の平均だった場合、
標準誤差は=1.11111/√10000 = 0.0111111となるので、
平均±標準偏差は小数点以下2桁まで示し、6.67±1.11となります。
ただこれが正しい考え方なのかどうか自信がありません。

(無題) 削除/引用
No.78-7 - 2011/02/28 (月) 11:35:13 - ats
こうじさんの意見に賛成で、ピペットマンの精度が低く有効数字3桁でくらいだったような。例えばルシフェラーゼアッセイでは同じサンプルを使用して反応液を調製して測定しても4桁目まで同じになったことないですね。

(無題) 削除/引用
No.78-6 - 2011/02/28 (月) 10:56:37 - 匿名
うろ覚えで大変申し訳ないのですが、製薬会社で申請関係の書類のデータ処理をしていた時の記憶です。
たしか、足し算引き算や掛け算割り算をするたびに有効数字の桁数は減っていったと思います。
ですのですべての測定機器の精度を考慮して実験データをデータ処理していくと、最後の値の有効数字の桁数は意外と小さくなることが多いです。
計算後も十分な桁数が残っている場合は実験者(実験責任者)の判断で表示する桁数を決めておりましたが、類似の実験との統一性には気を配っておりました。

余談になりますが、複雑な計算を行う実験(例えばKdやBmaxを算出するなど)では、前述の理由で有効数字の桁数がほとんどなくなってしまいます。
ではそういう値は全く信用ならないものかというと、研究者の立場からするとそうは思いませんでした。
有効数字の大切さそのものの扱いも実験によって変わるのだと個人的には考えているのですが、実際のところはどうなんでしょうね…。

標準偏差の大きさ 削除/引用
No.78-5 - 2011/02/28 (月) 10:31:28 - sss
偏見かもしれませんが、
そもそも有効数字が小数点以下5桁の測定装置と言うものは、100回くらい同じサンプルを測定したときに測定結果が例えば平均値1.00000標準偏差0.00009となるような装置の事だと思うのですが、・・・
測定装置の有効数字と酵素活性の有効数字、同じ考え方ではダメですか?

24件 ( 1 〜 20 )  前 |  1/ 1. 2. /2


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。