わかりにくい概念の説明シリーズです。統計用語がわかりにくい原因に「たとえが身近でない」という点があげられます。疫学や医学といった一般人に馴染みのない分野でたとえが繰り広げられることが、一般人を統計から遠ざけてしまっている要因でないかなと思います。
そこで今回は疫学に頼らず、しかも数式を用いずに、わかりやすいたとえを用いて有意水準について解説したいと思います。
コンテンツ
有意水準とは
有意水準とは、統計仮説検定において帰無仮説を棄却する基準のことです。
と説明されてもほとんどの人がさっぱり(?)でしょう。帰無仮説!?んー、難しい言葉ですよね。順に解説します。
帰無仮説とは「あってほしくない仮説」のこと
帰無仮説とは、その名のとおり無に帰したい仮説のこと。すなわち、「そんなことあってほしくない」という仮説のことです。たとえを用いて説明しましょう。
警察にとっての帰無仮説は「容疑者が無罪であること」
例えば、警察がある容疑者を逮捕しようとしていたとします。容疑者の逮捕にあたってはとうぜん十分な証拠を集めます。つまり、「本当にこの容疑者は有罪なのか?」という検証をおこなうわけてす。これを統計学では「仮説検定」といいます。
通常であれば、犯人である証拠を集めるのが警察の手法なのですが、仮説検定の場合、これとは逆のアプローチをとります。つまり、仮説検定ではまず「あってほしくない事実」を仮説として設定し、その仮説を棄却(否定)することで「あって欲しい事実」を証明するわけです。
警察の例では「容疑者が無罪である」という仮説を否定することで、容疑者が有罪であると判断するのです。数学でいう背理法のようなイメージですね。
第一種の過誤(αエラー)とは「誤認逮捕」のこと
さて警察は、十分な証拠をもって帰無仮説を棄却したとしましょう。すなわち、「容疑者は無罪である」という仮説を棄却し、逮捕に至ったとします。
もしここで、棄却した帰無仮説が実は正しかった、という事実が判明したらいち大事です。つまり、本当は無罪であった容疑者を誤認逮捕してしまったことになります。
統計学ではこれを「第一種の過誤(αエラー)」といいます。第一種の過誤とは、検定によって棄却された帰無仮説が本当は正しかったという誤りのことを言います。
αエラーはその頭文字から「あわてんぼうのエラー」と呼ばれたり、診断の世界では、これを偽陽性なんて言ったりもします。
健康な人が健康診断で異常を指摘されたり、健全なアスリートがドーピング検査で引っかかったり、痴漢の冤罪であったり、αエラーの例は枚挙に暇がありません。
どこまでの誤認逮捕を許容するか?
第一種過誤(αエラー)をゼロにするには多大なコストが発生するため現実的ではありません。そこである程度は許容しようという流れがでてくるわけです。これが有意水準と呼ばれる基準で、0.05や0.01という基準が一般的に用いられます。
つまり有意水準を0.05に設定するとは、仮説検定を100回繰り返した時に、帰無仮説が5回以下しか起こらないようてあれば、この仮説は棄却しようと判断することだと言い換えることができます。
有意水準とは誤認逮捕を許容する基準
誤解を恐れずに言えば、有意水準を0.05に設定するとはつまり、誤認逮捕の確率を5%までは許容するということです。
「容疑者は無罪である」という帰無仮説のもと検定を100回おこなって「無罪である」という結果が5回以下しか示されなかったら、帰無仮説を棄却し、容疑者の逮捕に至ります。
こうして警察は「誤認逮捕の可能性が5%以下であるならば逮捕しよう!」という決断にいたるわけです。
※ ここでいう「確率」は、「100回の試行のうち何回その結果が出るか」という割合のことで、頻度論的な意味合いで用いられてます。
まとめ
一般的に統計学では、帰無仮説が起こる確率が5%以下であったらその仮説を棄却しようという約束事があります。
わからなくなったら、有意水準とは誤認逮捕の確率だという例えを思い出してみてください。
0.05%ではなく5%ですね
> Okutsu様
ご指摘ありがとうございます。訂正致しました。