Bio Technical フォーラム

  • バイオ関連の実験をする上での、試薬、機器、プロトコールなどの情報交換の場です。
  • 新しいテーマで話を始める場合、質問をする場合は「新しいトピックを作る」から書き込みをしてください。
  • 質問に対して解答できる方は是非、書き込んで下さい。
  • このフォーラムにふさわしくないと管理人が判断した投稿は予告なく削除します。

新しいトピックを作る | トピック一覧 | 研究留学ネットに戻る

ひとつ前のフォーラム(readのみ)

このスレッドをはてなブックマークに追加このスレッドをはてなブックマークに追加

相関係数 トピック削除
No.9351-TOPIC - 2020/12/03 (木) 16:58:46 - ka
ある2値の相関関係を調べています。

いずれの値も正規分布を示さないため、pearsonではなく、スピアマンの相関係数を計算しております。

R値は0.25と低値なのですが、一部の少数の外れ値が右下に複数伸びているためか、p値は、0.0001と低値を示しています。ぱっと見は相関とはいいがたいのですが、統計学的にはこういう値が出ます。

pearsonならR値は0.05と低値なので、相関はないと判断できるのですが、この場合はノンパラメトリックなので、やはりスピアマンを用いるべきだと思っています。

自分の解釈でも、他の人の解釈でも相関はないと結論付けるべきと考えておりますが、どういう見せ方が取れますでしょうか。
 
- このトピックにメッセージを投稿する -



16件 ( 1 〜 16 )  前 | 次  1/ 1. /1


(無題) 削除/引用
No.9351-16 - 2020/12/05 (土) 11:36:59 - おお
>[Re:15] ど素人さんは書きました :

>
> あと、「外れ値」とみなされているデータがなぜその位置に出現するか、背景を的確に考察できるのであれば、その扱い方は決めやすいのではないでしょうか。

外れ値というけど、なにかを反映してそこに来ている可能性もあるのでよく考えてみるというのは私も賛成です。もし実験をやっての結果とかなら、その位置に(少なくとも片方が)来るような条件、手法、選別、患者からのサンプルならその患者のヒストリーとかなどで外れ値なのかどうなのか、そうでないならおそらく他の外れ値でないと思っているものでは起こってないことが起こっていると言える。
なので今回の結果だけでどうこうというより、ある程度探求すると(できると)もっとスッキリするとおもいます。

なんだか相関性が無いんだと最初から決めつけたようなやり方でつまづいているような気がします。

(無題) 削除/引用
No.9351-15 - 2020/12/05 (土) 09:54:32 - ど素人
個人的に、有意差ではなく効果量を評価する、という考えには賛成です。
生命科学分野では、効果量はまだ浸透していないかもしれません。

あと、「外れ値」とみなされているデータがなぜその位置に出現するか、背景を的確に考察できるのであれば、その扱い方は決めやすいのではないでしょうか。

(無題) 削除/引用
No.9351-14 - 2020/12/05 (土) 09:18:11 - おお
>95%以上がこの領域にあって、横軸に対して水平方向に広がっています。

回帰分析をして傾きが0とみなせるなら、xの変動に関係なくyが一定の値を取ることが示せるのでは?

(無題) 削除/引用
No.9351-13 - 2020/12/04 (金) 19:00:20 - asan


外れ値検定など主観的な方法を除いて外れ値を外す操作をして有意差をだすか、外れ値がマイナーならばnを増やして結果的に外れ値の影響を減らせば平均へ回帰してくるので正確な結果が出ると考えてサンプル数を増やすぐらいが一般的なやり方ではないかと。

(無題) 削除/引用
No.9351-12 - 2020/12/04 (金) 15:32:00 - ど素人
相関の解析では一般に、データが 2 つのグループに分かれるようなときは相関があるかのような結果になってしまいます。

その際は、データをグループごとに区分し、それぞれの中で相関があるかどうかを調べるのが常套かと思います。

(あくまで個人的な意見です)

(無題) 削除/引用
No.9351-11 - 2020/12/04 (金) 14:49:44 - s
>[Re:9] kaさんは書きました :
> A>たとえp値が低くても相関係数が低ければ、生物学的に興味のある相関ではない(xはyのほんの一部しか説明しない)という結論でいいように思いますが。
>
> これが言えたらいいんですが、p値は隠して、r値だけで相関関係はないと文章で言い張るということでしょうか?

「相関関係はない」ではなく「生物学的な興味が小さい」ということです。もちろんp値を明示しての話です。統計学的に有意であっても(だからp値は明示する必要がある)、効果量が小さいものを追及する意味が生物学的にあるかどうかは別の話です。実験科学か疫学かによっても違うとは思います。

ρをそのまま二乗していいのか知りませんが、寄与率が0.06(yの変動の6%しかxで説明できない)ぐらいのものは実験科学としては「ごく弱い相関が見られた」とのみ記述して、その後は無視するような気がします。

(無題) 削除/引用
No.9351-10 - 2020/12/04 (金) 14:33:52 - おお
>[Re:9] kaさんは書きました :
> @外れ値と言っていますが、外れ値の数がやや多めで、そこに引っ張られています。かりにグラフを右上、右下、左下、左上に分けますと、点自体は、左上が最も多く、次に左下にもそれと比較すると少なくはなりますが、95%以上がこの領域にあって、横軸に対して水平方向に広がっています。外れ値が数パーセント右下によっていて、そのため、pearsonにすると、左上から右下にかけての負の相関関係が見られます。


>外れ値が数パーセント右下によっていて

全体の分布より高い位置に右上に外れ値がないなら、それは可能性として弱い相関がある様に見えますよ。
細かいことはよく考えてみてかけそうなことがあれば、コメントします。

(無題) 削除/引用
No.9351-9 - 2020/12/04 (金) 13:18:19 - ka
@外れ値と言っていますが、外れ値の数がやや多めで、そこに引っ張られています。かりにグラフを右上、右下、左下、左上に分けますと、点自体は、左上が最も多く、次に左下にもそれと比較すると少なくはなりますが、95%以上がこの領域にあって、横軸に対して水平方向に広がっています。外れ値が数パーセント右下によっていて、そのため、pearsonにすると、左上から右下にかけての負の相関関係が見られます。

まだ外れ値の検定は行っていないので、感覚的な外れ値ですが。


A>たとえp値が低くても相関係数が低ければ、生物学的に興味のある相関ではない(xはyのほんの一部しか説明しない)という結論でいいように思いますが。

これが言えたらいいんですが、p値は隠して、r値だけで相関関係はないと文章で言い張るということでしょうか?

B>もし直線的な相関(1次関数で示せるような関係)を想定できるのならpearsonでやるのが筋だと思います。

自分が想定していたら想定と言っていいのでしょうか?ただ実際に図は上記のように全く想定と異なります。そもそも、あまりにも正規分布とはかけ離れているので、スピアマンにせざるを得ないと思っているのですが、スピアマンにするとp値を示すのが普通ですよね?

C他の手としては、pearsonのR値をしれっとテーブルにして、図は載せないでおこうとも考えています。

Dそもそも、pearsonにしてもスピアマンにしてもrの値0.25って、弱い相関ありって解釈しますよね。これも解釈を難しくしているので悩んでいます。もちろん数字がすべてではないのですが、


長い文章なので論点を@-Dとしました。

(無題) 削除/引用
No.9351-8 - 2020/12/04 (金) 11:15:26 - たろー
トピック間違えたのですが、消せなくなりました。すみません。

(無題) 削除/引用
No.9351-7 - 2020/12/04 (金) 11:12:17 - たろー
gap junction関連を想定するならgap juntion阻害剤でスクリーニングしてみてもいいかもしれませんね。時間と予算をかけるに値する現象なら、いくつか出ているようなunbiasedなスクリーニング入れると想定外のものが取れて面白いかもしれませんね。

(無題) 削除/引用
No.9351-6 - 2020/12/04 (金) 10:42:41 - s
たとえp値が低くても相関係数が低ければ、生物学的に興味のある相関ではない(xはyのほんの一部しか説明しない)という結論でいいように思いますが。

ちょっと話が脱線します。正規性についてですが、Pearsonのrは正規分布でなくても計算できるけど、帰無分布を共分散のない二次元正規分布にとっているのでp値の計算に偏りが出るという話だと思うけど違うのかな。だとすれば標本のx座標とy座標を組み換えて帰無分布を構成すればいいような。

(と思ってたらそういう論文があった。http://www.lib.kobe-u.ac.jp/repository/00045111.pdf)

(無題) 削除/引用
No.9351-5 - 2020/12/04 (金) 08:10:41 - おお
その外れ値と思われるものを除いたらどのような評価になりますか?

(無題) 削除/引用
No.9351-4 - 2020/12/04 (金) 08:08:10 - おお
スピアマンだと一方が高いと、他方も高いとか他方が低いという評価をするものと(私は)思っているので、なので外れ値に引っ張られて有意になるというのはあまり考えられないような気がします。
もし直線的な相関(1次関数で示せるような関係)を想定できるのならpearsonでやるのが筋だと思います。

(無題) 削除/引用
No.9351-3 - 2020/12/04 (金) 06:32:07 - ii
「計算上は相関があるような数値になるが、これは外れ値のように見えるサンプルが強く影響しているためであって、極端な場合を除けば相関があるとは言えない。」
って言って終わりでいい気がするんですけど、だめなんですかね?

(無題) 削除/引用
No.9351-2 - 2020/12/04 (金) 03:07:47 - おお
>いずれの値も正規分布を示さないため、
使用したサンプルの値は正規分布でなくてもいいと思うのですが、どのような分析をしたのですか?

相関係数 削除/引用
No.9351-1 - 2020/12/03 (木) 16:58:46 - ka
ある2値の相関関係を調べています。

いずれの値も正規分布を示さないため、pearsonではなく、スピアマンの相関係数を計算しております。

R値は0.25と低値なのですが、一部の少数の外れ値が右下に複数伸びているためか、p値は、0.0001と低値を示しています。ぱっと見は相関とはいいがたいのですが、統計学的にはこういう値が出ます。

pearsonならR値は0.05と低値なので、相関はないと判断できるのですが、この場合はノンパラメトリックなので、やはりスピアマンを用いるべきだと思っています。

自分の解釈でも、他の人の解釈でも相関はないと結論付けるべきと考えておりますが、どういう見せ方が取れますでしょうか。

16件 ( 1 〜 16 )  前 | 次  1/ 1. /1


パスワードを入力してチェックした記事を チェックした記事を

このトピックにメッセージを投稿する
名前 
メール   アドレス非公開
   タイトル 
本文      
設定  クッキーを保存(次回の入力の手間を省けます)
上に上げない(トピックの一覧で一番上に移動させません)
解決(問題が解決した際にチェックしてください)
暗証  半角英数字8-12文字の暗証番号を入れると、あとで削除、修正ができます。
送信 

〔使い方〕
  • 「アドレス非公開」をチェックすれば、自分のメールアドレスを公開しないで他の方からメールを受け取れます。
  • 問題が解決した際には、解決ボタンをチェックして解決した旨のコメントをつけてください。これは、初めにトピックを作った人と管理人のみが可能です。
  • 半角カタカナ、機種依存文字(全角ローマ数字、○の中の数字等)は文字化けの原因となりますので使わないでください。