先日とあるセミナーに参加しました。
セミナーの講師は入ってくるなり、自信ありげにこんなことを言いました。
「このセミナーの参加者には、誕生日が同じ人がいますね。」
セミナーの参加者は合計60人。
参加申し込み時にも誕生日の情報は伝えていません。
では、なぜこの先生はこうも自信満々に言えたのでしょう。
実は、これは「意外な確率」として、よく例に挙げられる「誕生日の一致問題」というものです。
1年は365日、参加者は60人、直感的に考えると、みんなバラバラの誕生日になる確率のほうが高そうに思えます。
しかし実際は、誕生日が同じ人がいる確率のほうが圧倒的に高いのです。
順を追って解説していきます。
誕生日の一致=誕生日の不一致の余事象!
少なくとも一組以上、誕生日が同じ人がいる確率は、
全体の確率(1)から、誕生日が一致する人が一組もいない(全員バラバラの誕生日)になる確率を引くことで求まります。
このように、全体から特定の事象が起こる確率を引くことで求める方法を余事象といいます。
今回の場合も、誕生日が同じ参加者がいる確率を求めるよりも、その余事象(全員バラバラの誕生日になる確率)を求めるほうが計算的にだいぶ楽です。
3人の中に同じ誕生日の人がいる確率
このような確率の計算は、人数が多いからややこしく感じます。
考え方を理解するためには、人数を少なくして考えるとスムーズです。
まずは、3人の集団(Aさん、Bさん、Cさん)で考えてみましょう。
3人の誕生日のうち2人以上が一致する確率というのは、
「1-(3人全員が全て異なる確率)」で求められます。
まず、Aさんの誕生日ですが、1人目なのでどの誕生日でも構いません。
つまり、365/365の確率です。
そして、Bさんの誕生日が、Aさんと異なる確率は364/365です。
最後に、Cさんの誕生日がAさんともBさんとも異なる確率は363/365となります。
ここから、3人全員の誕生日が異なる確率は、
365/365 × 364/365 × 363/365 となることが分かります。
つまり、全体(1)から、3人全員の誕生日が異なる確率を引けばいいので、
3人のうち誕生日が一致する人がいる確率は、
1 - (365/365 × 364/365 × 363/365) となります。
人数を減らせば考え方は分かりやすいと思います。
本題:参加者60人の場合、参加者内で同じ誕生日の人がいる確率
60人になっても考え方は同じです。
参加者n人として解き方を一般化すると以下のようになります。
n=60として計算していくと、以下の通りになります。
参加者が60人いる場合は、99.4%の確率で誕生日が同じ人がいるということになります。
これこそが、講師が自信ありげに「このなかに誕生日が同じ人がいる!」と述べた理由だったのです。
私たちの直感はときに信用ならないものだと気づかされる確率のお話でした。
↓この記事を読んだ方の多くは、以下の記事も読んでいます。
たった3日で統計調査士を取得した勉強法をご紹介!【統計検定】
↓「統計学って何?」レベルからの脱出!定番中の定番!