相関関係と因果関係を混同しないために―私たちはなぜ「つながり」を「原因」と思ってしまうのか―

情報判断力
この記事は約4分で読めます。

「未婚者は寿命が短い」「足が長い人ほど学力が高い」「喫煙者は認知症発症率が低い」。

こうしたデータを耳にすると、多くの人は無意識のうちに「だから○○が原因なのだ」と考えてしまいます。

しかし、ここには統計理解の核心に関わる重要な問題があります。それは、相関関係と因果関係の違いです。

 

(1)相関関係とは何か

相関関係とは、二つの変数が統計的に関連して変動している状態を指します。Aが増えるとBも増える、あるいはAが増えるとBが減るといった関係です。

しかし、これはあくまで「一緒に動いている」という観察事実を示しているにすぎません。そこから直ちに「AがBを引き起こしている」と結論づけることはできません。

相関は因果の可能性を示唆することはあっても、それ自体が因果の証明ではないのです。

 

(2)因果関係とは何か

因果関係とは、一方が原因となり、他方が結果として生じる関係です。「Aが起こるからBが起こる」と言える状態です。

これを主張するためには、時間的順序の確認、他の要因の排除、再現性の検証などが必要になります。単なる同時変動だけでは、因果を確定することはできません。

 

(3)典型的な誤解

①未婚と寿命

「未婚者は寿命が短い」という統計的傾向があったとしても、それだけで「未婚が寿命を縮めている」とは言えません。

健康状態が悪い人ほど結婚しにくい可能性もありますし、不健康な生活習慣や経済的不安定、社会的孤立などが、寿命にも結婚率にも同時に影響している可能性もあります。

こうした第三の要因を交絡因子と呼びます。交絡因子を考慮しなければ、相関は簡単に因果へと読み替えられてしまいます。

②足の長さと学力

より分かりやすい例として、「足が長い人ほど学力が高い」というケースがあります。小学生から大学生までを含む集団で調査すれば、このような相関が出る可能性があります。

しかし、「足が長いから賢い」という因果は成立しません。本当の要因は年齢です。年齢が上がると身長が伸び、同時に学習年数が増えるため成績も上がります。

構造としては、年齢が足の長さにも学力にも影響しているだけです。もし年齢を揃えて大学生だけを調べれば、この相関はほぼ消えるでしょう。

この例は、第三の要因を考慮しなければ誤った結論に至ることを明確に示しています。

③喫煙と認知症

さらに複雑な例が「喫煙者は認知症発症率が低い」というものです。仮にそのような統計が出たとしても、そこから「喫煙が認知症を防ぐ」と結論づけるのは危険です。

認知症は主に高齢期に発症します。もし仮に、ある要因が他の疾患リスクを高め、平均寿命を短くする傾向があるとすれば、認知症を発症する年齢まで到達しない人が一定数存在する可能性があります。

その結果、統計上は「発症率が低い」ように見えることがあります。これは、生存者バイアスと呼ばれる現象です。

認知症になる前に集団から脱落した人が統計に反映されないため、見かけ上の割合が歪むのです。ここでは単なる交絡因子だけでなく、時間軸と生存構造の問題が関係しています。

(3)なぜ私たちは誤認してしまうのか ―認知バイアスの働き―

相関と因果の混同は、単なる知識不足ではありません。そこには人間の認知構造に根ざした傾向があります。

①原因を求める本能

人間の脳は、出来事に原因を見つけようとします。二つの事象が同時に起こると、その間に因果関係を見出そうとします。偶然や統計的関連であっても、そこに物語を読み込んでしまいます。

②確証バイアス

人は自分の信念を支持する情報を優先的に受け取り、反対の説明を軽視します。自分の世界観に合う因果説明は受け入れやすく、複雑な構造は見えにくくなります。

③単純化への傾向

複雑な多変量構造よりも、「A→B」という一本の矢印のほうが理解しやすく共有しやすい。そのため、単純な因果モデルが好まれます。

④交絡因子や構造の想定の難しさ

第三の要因や時間的脱落といった統計構造を想定するには、抽象的思考が必要です。慣れていないと、見えた関連だけで説明が完結したように感じてしまいます。

⑤物語化の衝動

人は世界を物語として理解します。原因と結果が明確な説明は説得力を持ちます。そのため、相関よりも因果の語りのほうが広まりやすいのです。

 

(5)思考の質を高めるために

データを見たときには、少なくとも次の問いを自分に投げかけることが重要です。

 ●他に説明できる要因はないか
 ●因果の向きは逆ではないか
 ●第三の要因は存在しないか
 ●年齢構成や生存構造に偏りはないか
 ●途中で脱落した人はどう扱われているか

こうした問いを習慣化することで、相関と因果の混同は大きく減ります。

相関と因果の区別は、単なる統計技術ではありません。それは偏見を防ぎ、誤った判断を避け、情報に振り回されないための基本的な知的態度です。

データに出会ったとき、即座に物語を完成させるのではなく、一歩立ち止まる。その慎重さこそが、情報社会における成熟した思考の出発点です。

タイトルとURLをコピーしました